2018 年世界杯德国队爆冷,小组赛出局。而之前还曾有人工智能模型预测德国队还将再续辉煌,赢得冠军。德国队不给力,而人工智能又出了什么问题?Bestpractice.ai 联合创始人 Tim Gordon 发文总结了有关于此的十点经验,谈到了我们人类对人工智能的概率性预测结果的理解方式以及人工智能本身的能与不能等问题。
说实话,很震惊!德国队居然被韩国队 2-0 击败,灰溜溜地回国了。要知道德国队四年前就以 7-1 的骄人战绩击败了巴西队,进一步又赢得 2014 年的世界杯。
出现这种情况,无疑会出现很多有待解答的问题。
2015 年机器人足球世界杯现场照片
但是,预计德国队会有良好表现的不只有粉丝。至少有两个不同组织开发的人工智能(AI)模型都预测德国队会挺进决赛。
据 Vice 报道,来自德国多特蒙德工业大学、慕尼黑工业大学和比利时根特大学的一个团队分析了 10 万个场景,最后预测德国队获胜的几率最高。不甘人后的高盛则分析了 100 万个场景,预测巴西队会与德国队在最终决赛相遇并赢得冠军。
只要你没有听从这些人工智能的建议跑去赌球,就没什么损失。
但用在我们的日常生活中以决定对我们真正重要的事情的机器学习技术与预测获胜球队的技术并没有什么不同——而且随着 AI 的发展,未来的应用只会更多。
所以这次事件在人工智能实际应用方面会给我们带来哪些经验教训?
1. 人工智能做的是预测。简而言之,人工智能会寻找数据中的模式,然后使用这些模式来预测模式识别会给出怎样的结果。计算机本身并不理解自己所处理的内容——它只是预测接下来可能会发生的情况。
2. 概率很关键:任何数据科学家都总是会在模型输出的结果上加上概率和置信度水平。确定性不是他们的标志。学术论文《Prediction of the FIFA World Cup 2018 – A random forest approach with an emphasis on estimated team ability parameters》预测德国队有 86.5% 的概率小组赛出线,获胜的概率则为 17.1%(略低于西班牙队获胜概率 17.8%)。(参阅原文献,请点击阅读原文。)
3. 人类大都不能很好地处理概率:我们大多数人都更习惯以二元论的视角看待事物——不是「是」就是「否」。被数学覆盖的灰色地带需要深思熟虑。所以 17.8% 的获胜几率就成了人们眼中「被预测的赢家」。
4. 我们自身关于决策和预测的语言也能反映这个情况。政治家可没法通过讨论某些事情的发生概率来赢得选举。我们喜欢确定性,也响应确定性。
5. 当预测因子和处理过程可以清楚呈现,并且最终成为一个闭环系统时,是有可能得到预测结果的。任何事物都可以被建模,并被提供给计算机处理。值得注意的是,上述学术研究在 8 组预测中有 6 组都预测对了——即至少出现了最高概率的情况。
预测中的德国队获胜之路(来自 Vice)
6. 可获得的数据会得到优先考虑,而这(显然)会影响输出结果。这个学术团队分析了「FIFA 排名、每个国家的人口和国内生产总值(GDP)、博彩公司的赔率、有多少国家队球员在同一个俱乐部效力、球员平均年龄以及他们赢得过多少冠军联赛」。所有球队的这些数据都是可获得的,都有标准化的且可比较的格式,并且可能都是干净的并且有适当的标注的。因此这是人工智能模型需要关注的重点。
7. 但是,实际数据总是多于可被处理的数据。这项研究没有包含的信息实际上还有无限多——球员的睡眠质量、个人身体素质、草地状态、当天粉丝热情的影响……能处理的数据都是可获得的数据。如果不存在让某支球队获胜的绝对公式,那么建模就是不可能的。而人工智能被应用的很多领域其实并不存在这种情况——比如优化工厂流程以制造完美的小部件。
8. 但是,即使最聪明的模型也难以应对突发事件——而且实际上会让其整个前提条件没有意义,甚至有害。如果一场火灾损坏了这个小部件工厂的一部分,那么人工智能管理系统将一无是处。
9. 所以即使机器的作用越来越大了,也仍然需要人类参与其中。想让机器成功,复杂性和动态变化以及用于解决这些问题所需的常识知识仍然是有待攻克的主要难题。
10. 媒体可能会过度解读涉及人工智能的一切。对人工智能故事的炒作往往超出本质——不过就是个厉害点的 Excel 电子表格,媒体往往就因为「人工智能」这个词就将这种技术描绘得具有神秘和神奇的力量。
作为一个英格兰队支持者,现在我只关心一点——高盛更新后的模型认为英格兰队将会进入决赛!