亲,双击屏幕即可自动滚动
第607章 用故事解释softmax函数的概率问题(2/2)
比喻1:冰激凌店的选择
你走进了一家冰激凌店,看到菜单上有 4 种口味:
? 巧克力 - 8分(最喜欢)
? 香草 - 6分(还不错)
? 草莓 - 5分(一般)
? 抹茶 - 3分(不是很喜欢)
你并不会只点你最喜欢的巧克力,而是会按照偏好决定点什么,比如:
? 可能60% 的时候点巧克力,
? 也许 30% 的时候会试试香草,
? 偶尔 也可能想试试草莓。
这就好比 Softax,把你对不同选项的偏好转化成了概率,而不是只选择分数最高的一个。
比喻解释:抢蛋糕游戏
想象你和朋友参加了一个“抢蛋糕”游戏,桌子上有 4 块蛋糕,大小不同:
? A蛋糕:8块大(最大)
? b蛋糕:6块
? c蛋糕:5块
? d蛋糕:3块
规则是:你可以选一个蛋糕吃,但选择的概率与蛋糕的大小成正比。
比如,A蛋糕最大,你选它的概率就最高;d蛋糕最小,你选它的概率最低。但不能说A蛋糕最大,你就只选它——因为其他蛋糕也有一点可能性被选中。
这就像Softax,它不会直接选最大的,而是按比例分配概率,让每个选项都有可能被选中。蛋糕越大,代表的概率就越高,但不会100%锁定。
总结
1. Softax 的核心作用是“概率化”:它将原始分数(打分、点数、偏好)转换为概率,确保所有选项的概率总和为 1。
2. Softax 保证高分更容易被选中,但不是唯一选项:高分选项概率更高,但低分选项仍然有机会被选中,这让决策更加灵活,而不是一味选择最高分的选项。
3. 就像点蛋糕、抢蛋糕,虽然最喜欢的选项更有可能被选中,但其他选择也并非毫无机会!