研究领域:机器学习,认知科学,风险决策郭瑞东|

原郭瑞东集智社被收录进话题#ComplexScienceFrontier202190

介绍

人类的决策过程有时很复杂,而且看似随意——尽管如此,心理学家希望更好地理解这个过程,以便更好地预测人们在复杂情况下可能做出的决定类型。随着人机交互频率的不断提高,预测人类如何做出风险决策不仅成为认知科学的目标,而且具有现实意义和价值。6 月份发表在《科学》杂志上的一篇论文通过大规模实验和机器学习挖掘了人类决策的理论。该研究利用神经网络学习海量的风险决策数据,不仅再现了风险决策领域的现有研究,而且在此基础上找到了更准确的风险决策模型。

研究领域:机器学习、认知科学、风险决策

郭瑞东 | 作者

赵玉婷 | 校对

邓一学 | 编辑

论文题目:

使用大规模实验和机器学习来发现人类决策理论

论文地址:

1. 用前景理论解释风险决策

近年来,盲盒越来越流行。为什么人们更喜欢不确定性。比如你面对一个盲盒A,有30%的概率得到100元的物品,盲盒有80%的概率得到50元的物品。B、为什么有些人愿意选择第一个,即使它的预期回报较低。

诺贝尔经济学奖得主卡尼曼和特沃斯基在1979年提出了前景理论(Perspect Theory)。通过非线性贴现,解释了为什么人们在面对“失去”时会变得冒险,而在面对“获得”时会变得冒险。显示风险厌恶。前景理论在经济建模、心理学、神经科学、商业分析等领域有着深远的影响。通过对消费者选择进行建模,该理论可以帮助决策者确定改善个人和社会福祉的策略。

然而,在随后的几十年中,随着数十种相互竞争的理论的出现,风险决策模型开始自相矛盾:每一个都被证明是不完整的。提出新理论的研究人员往往会对感知、注意力、记忆、情感等问题做出复杂的假设,然后在小数据样本而不是更大的数据集上重现它们。

有这么多相互竞争的理论的原因是人类的决策行为是复杂的,每个理论通常只能从不断增长的假设列表中选择几个来解释某些场景下的风险决策现象。由于上述的多样性和复杂性,关于最佳决策理论或模型的共识仍然很少,而且在其整体预测能力方面也几乎没有获得什么。

但无论模型好坏,还需要比较模型所依据的数据与其对大样本决策数据的预测是否存在显着差异,就像机器学习模型需要执行相同的操作一样在训练集和测试集上确保它没有发生。合身。这样,心理学家提出的假设可以作为优化问题中的一个约束,或者说归纳偏差,看看增加是否有助于模型的预测能力,并决定是否增加这个假设。

2. 机器学习如何为风险决策建模

该研究首先使用亚马逊的 Mechanical Turk 众包平台收集了 10,000 多个场景,如图 1 所示,涉及概率风险决策,这远远超过了之前研究中的风险决策数据。

图1. 风险决策场景示例

每个风险决策场景都可以用一组风险和收益向量来描述;然后通过t-SNE降维,可以将10000个场景全部可视化。如图 2 所示,其中绿色代表历史上类似场景的数据,红色代表之前最大的单个数据集,黑点代表本研究中使用的数据集。与红点相比,黑点的数量要大30倍,分布更均匀,更能体现风险决策本身的多样性。

图2.降维后10000个风险决策场景的可视化

人类所有可能的风险感知函数如图3所示。最简单的期望收益(Expect Value)可以看成是期望收益(Expect Utility)的一个特例,而前景理论使用的是非线性函数。预期收益。这样一来,所有风险感知的包含关系和普遍性可以如图3所示,其中BEAST代表Best Estimate and Sampling Tools,是本研究发现的最佳预测模型。

图片[1]-研究领域:机器学习,认知科学,风险决策郭瑞东|-老王博客

图3.风险感知模型包含关系示意图

将认知模型的假设转化为神经网络中的约束。如图4所示,例如在基于期望收益的模型中,每个收益函数可以用一个神经网络一一表示,然后通过全连接层的组合,最终的预测模型可以通过梯度进行优化血统。

图4. 预期收益假设下的神经网络模型架构

3. 不同的假设对应不同的神经网络预测性能

如果一个神经网络模型可以预测特定场景中的选择,而人类实际预测的概率超过 50%,那么该模型就可以预测该场景。比较训练轮次和均方误差,我们可以判断不同心理理论对应的模型在由 1000 个未知场景组成的测试集上的准确性。

图5.(左)测试数据集上的神经网络(蓝线)模型在预期收益框架下随着训练epoch数的增加而减少;(右)神经网络学习到的相应的效益和效用函数

与预期收益相比,前景理论指出,人们在看待不同概率时也存在非线性认知,因此图 5 最右侧的主观概率效应不像以前那样直接,而是由于引入了这个附加假设使模型的预测更加准确,如图6所示。

图 6. 前景理论预测误差(左)和效用和主观概率函数(右)

在之前的模型中,假设奖励金额和主观概率是相互独立的。人们不会主观上将千分之一的概率视为百分之一,因为收入是一万。环境模型放宽了这个假设。它假设 V(A) =∑i∈Au(xi, c1)π(pi, c2) ,其中每个选项的效用取决于当前场景中的其他选项,以及概率主观认知的多少依赖于概率对应的收益,在进行效用估计时,比如只依赖当前场景,这样的模型就叫做intra-gample模型,如果依赖于其他场景,就叫做multiple inter-gamble 模型,如果不仅效用函数与场景相关,

图7. 不同的基于神经网络的模型,以及传统认知科学模型对风险决策的预测误差比较

通过图 7 的对比可以发现,与传统认知科学提出的模型相比,基于神经网络训练的模型比传统模型具有更好的预测效果,这表明神经网络可以重现和超越现有的模型。心理学研究。其次,通过指出预测误差最低的模型,即更复杂的博弈概率/结果模型,表明人类风险感知本质上是极其复杂的,不能归因于简单的假设。尽管大多数情景可以被视为主观概率和主观效用的产物,但也应考虑不同情景的相对比较以及概率和收益之间的相互依赖关系。

4. 混合模型具有更好的预测能力

当人们面临冒险的决定时,他们往往会想象自己的大脑中有两个小人物在互相争吵。这对应一个混合模型,即每个人都有多组一一对应的主观概率和效用函数(策略),然后根据具体场景机器学习防止过拟合,随机选择一组策略,有偏好,并随机选择该组进行判断。研究指出,使用混合模型的最终预测误差,预测效果与使用场景模型相似,说明混合模型可以包含场景模型中的信息,并且由于模型简单,在训练初期表现较好。

图8.混合模型(左)和效用函数(右)的预测效果

图8中神经网络学习到的混合模型中对应的效用函数和主观概率。值得注意的是,策略中学习到的效用函数显然是loss-averse的,对应的主观概率,正如前景理论所预测的,高估小概率的时间,低估大概率的确定性,其他A策略基本合理。通过找出人们在什么情景下选择理性策略:当人们选择非理性策略时,正如前景理论所预测的那样,研究人员可以更好地了解哪些因素对人类风险决策的影响最大。

究竟是什么因素决定了人们的策略选择,研究人员发现,最重要的因素是不同选项的收益差异程度、最大收益和最小收益,以及有多少选项是负收益。也就是说,当面对1元和10000元之间的巨大差价,或者面对大部分亏损的期权时,人们很可能在这个时候表现得不理智。图 9 显示了在可视化所有场景后,在不同场景中选择非理性主观概率函数和效用函数的可能性。图 9-E 中的蓝点是非理性选项占主导地位的场景。

图9. 风险决策场景二维聚类后,不同选项对应的选择概率热图着色

5. 总结

通过训练一个深度学习模型来预测人类在这些问题中的选择,训练出来的模型可以以非常高的准确率模拟人类的决策”,这明显优于现有模型。这并不意味着心理学家和行为经济学家的工作会被机器取代,我们仍然需要人脑来解释深度学习模型所代表的内容并将其转化为描述性理论。传统模型仅在特定数据集上表现优于机器学习模型更好机器学习防止过拟合,但在海量数据集和算法上表现不佳将大型数据集与机器学习相结合,为发现新的认知和行为现象提供了前所未有的潜力。

在学习模仿人类决策时,神经网络复制了许多已知的认知科学理论,例如前景理论。深度学习模型的灵活性使研究人员能够找到对风险感知的新见解。因此,未来的认知科学将需要更多地使用机器学习进行自动化建模,以及更多实验室场景之外的真实数据集,例如盲盒销售数据。

复杂科学最新论文

集智版图顶级期刊论文速递栏目自上线以来,持续收集Nature、Science等顶级期刊的最新论文,追踪复杂系统、网络科学、网络科学等领域的前沿进展。计算社会科学。现在订阅功能正式上线,每周通过微信服务号“集智点图”推送论文信息。扫描下方二维码,一键订阅:

© 版权声明
THE END
喜欢就支持一下吧
点赞0
分享
评论 抢沙发

请登录后发表评论