手机浏览器扫描二维码访问
巧妇难为无米之炊,数据就是机器学习的“米”。
- 数据收集:比如要做推荐系统,得收集用户的浏览记录、点击行为;要做疾病预测,得收集病人的病历、检查报告。
- 数据预处理:这步特别关键,就像淘米要去沙。包括:
- 处理缺失值:比如某个人的年龄没填,得想办法补上或删掉。
- 处理异常值:比如收入里突然出现一个“1亿”,明显不合理,得处理掉。
- 特征缩放:比如身高是“170cm”,体重是“60kg”,单位和数值范围不一样,得统一缩放(比如都缩到0-1之间),不然模型会“偏心”。
2. 特征工程:给数据“化妆”,让模型看得更清楚
“特征”就是数据里的关键信息。比如判断西瓜好坏,“色泽、根蒂、敲声”就是特征。特征工程是从原始数据里提炼出有用特征的过程,直接影响模型效果。
- 有时候要人工设计特征:比如把“日期”拆成“星期几”“是否节假日”。
- 有时候用算法自动提取特征:比如深度学习里的CNN,能自动从图像里提取“边缘、形状”这些特征,不用人类操心。
3. 模型训练:让机器“刷题涨本事”
选好算法(比如决策树、神经网络),把处理好的数据喂给它,机器就开始“学习”了。它会不断调整内部参数,让预测结果和真实情况越来越接近。
- 训练过程中,得注意过拟合和欠拟合:
- 欠拟合:模型太“笨”,连训练数据都没学好,比如把所有邮件都当成正常邮件。
- 过拟合:模型太“教条”,把训练数据里的噪声也学进去了,比如只认识训练过的那几张人脸,换张角度就不认识了。
解决方法也不少,比如“正则化”(给模型加约束,不让它学太细)、“增加数据量”“模型简化”等。
4. 模型评估:给机器“考试”打分
训练好的模型得测试一下准不准。常用的指标有:
- 准确率(Accuracy):预测对的比例,比如100个邮件,90个判对了,准确率就是90%。但它在“数据不平衡”时不准,比如垃圾邮件只有5%,模型全判正常,准确率也有95%,但没用。
#架空历史,热血,战争,权谋,爱情,保家卫国#且看热血少年郎如何在沙场上一步步地成长;且看热血少年郎如何驰骋疆场,快意恩仇;热血,袍泽,战争,权谋,复仇,爱情,且看他如何凭借努力,坚韧,智勇守护住大楚王朝。......
钱七七生前忤逆不孝,不学无术,阴差阳错死后借着幽冥莲的力量借尸还魂穿越到古代。在古代的约束让她经常想到疼爱自己的父母,还有曾经做的悖逆之事心中懊悔。得知幽冥莲在公孙府,公孙府势力庞大不是任何人容易接近的。七儿想尽办法进入公孙府。公孙煜掌握全国组织情报的密枢阁,又是名门贵胄,得先皇和新皇信任,闺阁少女的偶像,朝堂上下都礼让三分,一直顺风顺水,美中不足性格孤傲。后来种种不可知的变故中强忍打击和无奈,自己效忠的新皇被杀,忠于自己的密枢阁被自己无奈解散,不能娶自己心爱的姑娘,甚至都不知自己喜欢的女孩是否也同样喜欢自己?因自己身系家族近千口人的荣辱只能委曲求全受制于人,种种的无能为力让他更向往七七说的人人平等和自由生活。七儿的独特让公孙煜对她心生欢喜,七儿不觉中也发现自己爱上公孙煜的霸道。可是自己还想回父母身边,一直隐忍对公孙煜的喜欢。谭维可看着自己从小喜欢的公孙煜居然和别的女人有暧昧心中气氛,把七七视如珍宝的幽冥莲扔进大海,殊不知她这不仅不会让两人分开,还促进七七留下来和她争夺公孙煜的决心。...
重生:权势巅峰情节跌宕起伏、扣人心弦,是一本情节与文笔俱佳的都市言情小说,重生:权势巅峰-弹剑听潮-小说旗免费提供重生:权势巅峰最新清爽干净的文字章节在线阅读和TXT下载。...
内容标签:年下破镜重圆七年之痒女强轻松 主角:娄夏,杜若瑶┃配角:黄珊珊,李薇薇,方思莘,杨青,姜晚清等 慢慢烧起来的追妻火葬场 立意:重要的从来不是距离有多远,而是距离感。...
付英出生在一个穷苦家里,身下姐弟三四个,母亲常年好赌,父亲残疾暴虐。所有的苦难她小小年纪独自承担。到了嫁人的年纪,却无人敢娶,不得已只能远嫁。本以为逃出泥坑,怎知道又跳进了火坑。为了生存,与恶毒刁钻的寡妇婆婆展开了斗智斗勇的生活。同时兄妹四人的命运交织在一起,跌宕起伏。......
弑神天堑情节跌宕起伏、扣人心弦,是一本情节与文笔俱佳的其他类型小说,弑神天堑-慵懒的猫公子-小说旗免费提供弑神天堑最新清爽干净的文字章节在线阅读和TXT下载。...