亲,双击屏幕即可自动滚动
第603章 机器学习里的分类问题和回归问题,一个故事解释(1/2)
用故事解释分类问题和回归问题
1. 分类问题的故事——森林里的神秘果子
在一片神秘的森林里,小明发现了许多奇怪的果子。有些果子可以吃,而有些果子有毒。他想找到一个方法来区分这些果子。
他观察到:
? 颜色:红色的果子通常是可食用的,紫色的果子通常是有毒的。
? 形状:圆形的果子大多能吃,尖尖的果子往往有毒。
? 大小:太小的果子似乎更危险。
于是,小明决定建立一个“吃不吃果子”的规则系统:
? 如果果子是红色且圆形,就吃!
? 如果是紫色且尖尖的,就不吃!
? 其他情况要谨慎判断。
这个过程就是分类问题——它的目标是给每个果子打上一个“可吃”或“不可吃”的标签。
分类问题的典型特征:
答案是离散的类别(例如:“可吃” vs. “不可吃”)
数据用于区分不同类别(红色vs. 紫色,圆形vs. 尖形)
最终输出是一个标签(1=可吃,0=不可吃)
现实中的应用:
? 邮件是否是垃圾邮件?(垃圾 vs. 非垃圾)
? 贷款申请者是否值得批准?(批准 vs. 拒绝)
? 识别图片中的动物是什么?(猫 vs. 狗)
2. 回归问题的故事——小明卖柠檬水
夏天到了,小明在街头卖柠檬水。他想预测明天应该准备多少杯柠檬水,以免浪费或卖不够。
他发现:
? 温度越高,卖出的柠檬水越多。
? 天气越晴朗,卖出的柠檬水也越多。
? 湿度太高时,人们反而不太想买柠檬水。
他收集了一些数据,比如:
? 昨天 30°c,卖出 50 杯
? 昨天 35°c,卖出 70 杯
? 昨天 28°c,卖出 45 杯
他想建立一个预测模型,比如:
这样,如果明天预测是 32°c,他可以计算: