斯坦福人工智能百年研究:2030年的人工智能与生活

本文是斯坦福大学「人工智能百年研究」的首份报告:《 2030 年的人工智能与生活》,这篇报告是计划持续至少 100 年的研究系列中的第一篇。该报告描述了目前人工智能相关技术、法律以及道德上的挑战,并对产业界、学界、政界三方人士提供了人工智能技术、应用、政策上的指导与建议。

「人工智能站」于第一时间对报告进行了全文编译,请 点击这里下载完整版中文报告。

2014 年秋季,人工智能百年研究(One Hundred Year Study )项目启动,这是一项对人工智能领域及其对人类、社区、社会影响的长期学术研究。这项研究包含使用人工智能计算系统的科学、工程和应用实现。监督该「百年研究」的常务委员会(Standing Committee )组建了一个研究小组(Study Panel )来每五年评估一次人工智能所处的状态——这是本项目的核心活动。

本研究小组要回顾从上次报告到现在这段时间人工智能的进展,展望未来潜在的进展并且描述这些进展对于技术、社会的挑战与机遇,涉及的领域包括:道德伦理、经济以及与人类认知兼容的系统设计等等。

「百年研究」定期进行专家回顾的首要目标是:提供一个随着人工智能领域发展的关于人工智能及其影响的收集性的和连通的集合。这些研究希望能在人工智能领域的研究、发展以及系统设计方面、以及在帮助确保那些系统能广泛地有益于个人和社会的项目与政策上提供专业推断上的方向指南及综合评估。

「百年研究」是仿照一个早期的被非正式地称为「AAAI Asilomar Study 」的项目。在 2008 2009 年期间,当时的美国人工智能协会(AAAI )的主席 Eric Horvitz 聚集了一群来自这个领域不同机构与方向的人工智能专家以及认知科学、哲学与法律相关的学者。

参与者在分布的小组中研究近期人工智能的发展、长期的发展前途以及法律与道德上的影响,之后他们在 Asilomar 一起开了三天的会议,分享并讨论了他们的发现。会议给出了其中密集讨论的内容的一份短的书面报告,并且由参与者与其他同事在后续的讨论中充实;这份报告在领域内以及之外引起了广泛的关注与争论。

Asilomar 会议的巨大影响以及人工智能的重要进展(包括人工智能算法与技术在全球范围内开始进入到日常生活中)刺激产生了对人工智能及其对人们与社会的影响进行长期反复研究的想法。这个百年研究项目随后在一所大学中开始,这是为了延伸深度思考以及跨学科的学术研究,激励创新并且给政府机构与产业提供明智的建议。

这篇报告是计划持续至少 100 年的研究系列中的第一篇。常务委员会在 2015 年的暑期成立了一个研究小组来负责组建现在这个初始的研究小组,并任命了得克萨斯大学奥斯汀分校的教授 Peter Stone 担任该小组的主席。这个包含了 17 名成员的研究小组由人工智能学术界、公司实验室以及产业界的专家与了解人工智能的法律、政治科学、政治以及经济方面的学者组成,并于 2015 年秋季中期启动。

参与者代表着不同的专业、地区、性别以及职业阶段。常务委员会广泛讨论了 Study Panel 相应的责任,包括人工智能最近的发展与在工作、环境、运输、公共安全、医疗、社区参与以及政府的潜在社会影响。委员会考虑多种聚焦研究的方式,包括调查子领域及其状态、研究特定的技术(例如机器学习与自然语言处理)以及研究特定的应用领域(例如医疗与运输运输)。

委员会最终选择了「2030 年的人工智能与生活(AI and Life in 2030 )」为主题以强调人工智能的各种用途与影响的发生不是独立于彼此,也不独立于其他许多社会和技术上的发展。意识到了城市在大多数人类生活中的核心作用之后,我们将专注重点缩小到大多数人居住的大都市。

常务委员会进一步将专注重点缩小到具有很好可变性的城市环境以及世界性文化的典型的北美城市,从而限制研究小组的工作量。常务委员会期望该研究中的预测、评估和预先的指导将具有广泛的全球性的实质作用;另外,委员会正在制定将这个项目扩展到国际上的未来研究计划。

既然做出了关注北美城市生活的决定,那么军事项目就不在这篇最初的报告范围中。这不是忽视细致监控与审议人工智能在国防与战争(包括潜在地使发展和部署不平衡)上产生的影响的重要性。这篇报告计划展现给四种读者。

对于公众,本报告的目的在于提供一个可获取的、在科学和技术上准确的对于人工智能当前状态及其潜力的描述。对于产业界,本报告描述了相关技术、法律以及道德上的挑战,可能帮助指引资源再分配。本报告也可以帮助地区、国家、国际政府更好地规划人工智能在政府中的应用。最后,本报告能帮助人工智能的研究者以及他们的机构和资助者设置优先级,以及考虑人工智能研究及其应用所产生的道德与法律上的争议。

考虑到「百年研究」在人工智能上的独特本质,我们期望未来的常务委员会与研究小组,以及研究科学家、政策专家、私人与公共部门的领导以及普通民众,在对人工智能的未来进行评估时能想到该报告。不管是否成功准确预测了人工智能的发展轨迹和影响,我们都希望这个系列中这一份初次成果是有用的。

目录

概述 ...  5

人工智能接下来的研究? ...  8

现在与未来的人工智能政策 ...  9

第一部分:什么是人工智能? ...  10

定义人工智能 ...  10

人工智能研究趋势 ...  12

第二部分:人工智能在各领域的应用 ...  16

交通 ...  16

智能汽车 ...  16

家庭/ 服务机器人 ...  19

医疗 ...  21

教育 ...  25

低资源社区 ...  28

就业和劳资 ...  30

娱乐 ...  32

第三部分:人工智能公共政策的前景与建议 ...  33

如今以及未来的人工智能政策 ...  34

附录 I :人工智能简史 ...  40 


概述

电影和小说中描绘的人工智能主宰的可怕未来塑造了大众对人工智能的想象,但这些都是虚构的。在现实中,人工智能已经在改变我们的日常生活了,而且基本上都是在改善人类健康、安全和提升生产力等好的方面。

和电影不一样,现在并没有什么超人类的机器人正待到来,这甚至完全不可能。而且尽管滥用人工智能技术的可能性应该得到承认和解决,但其中它们更大的可能性是让驾驶更安全、帮助孩子学习和扩展及增强人类的生活。

事实上,有益的人工智能应用已经在学校、家庭和医院里开始了加速增长。大多数研究型大学也划出了单独的人工智能研究科系,苹果、Facebook 、谷歌、IBM 和微软等科技公司也在探索人工智能应用上投入了巨资——他们将其视为未来发展的关键。即使好莱坞在将他们的反乌托邦人工智能幻想故事搬上荧幕时也用到了人工智能技术。

基于计算机的视觉、语音识别和自然语言处理方面的创新是这些变化的驱动力,同时也将推动相关领域的科学和技术的发展。人工智能也正在改变人们与技术的交互方式。许多人已经习惯上了在他们的智能手机上进行触控和对话。

随着人工智能系统学习对个人特点和目标的适应,人机关系的未来将会变得越来越微妙、流畅和个性化。这些人工智能应用将帮助监控人们的生活状态、警告人们前面的风险以及提供人们想要的或需要的服务。

比如,在北美一座城市的未来 15 年里——正是这份报告的时间框架和范围——人工智能应用将很有可能将交通交由自动驾驶汽车接管,实现人与货物的实时接取和运送。光这一项就足以改变城市的整体面貌,因为再也不会有交通堵塞和停车困难的难题了。

本研究刻意重点关注了典型的北美城市,旨在突出人工智能对城市中居住的数百万居民的日常生活的影响。研究小组还进一步将调查范围缩小到了 8 个人工智能可能将带来最大影响的领域:交通(transportation )、医疗(healthcare )、教育(education )、低资源社区(low-resource communities )、公共安全(public safety and security )、就业和工作场所(employment and workplace )、家庭/ 服务机器人(home/service robots )和娱乐(entertainment )。

尽管人工智能技术来自于常见的研究资源,但这些技术已经影响并将继续影响这些不同的领域。其中每个领域都面临着各种不同的与人工智能相关的难题,包括难以创造安全可靠的感知和作业硬件(交通和服务机器人)、难以获得公众的信任(低资源社区和公共安全)、难以克服对人类被边缘化的恐惧(就业和工作场所)、以及还存在减少人际交往的风险(娱乐)。

其中一些领域主要是在商业方面,如交通和医疗,而另一些则更面向消费者,例如娱乐和家庭服务机器人。一些还是跨领域的,例如就业/ 工作场所和低资源社区。

在每一个领域,即使人工智能在不断带来重要的好处,但同时也带来了道德和社会上的问题,其中包括隐私问题。机器人和其它人工智能已经在一些机构里面替代人类工作了。作为一个社会,我们现在正处在一个确定如何部署基于人工智能的技术的紧要关头,从而提振而不是阻碍民主的价值观——例如自由、平等和透明。

对于个人而言,我们生活的质量和我们的贡献所获得的价值很有可能会逐渐发生转变,但这些改变会很明显。在接下来的几年中,人工智能研究、系统开发和社会与监管框架将会塑造人工智能的好处与其代价和风险之间的权衡,以及这些好处如何散布的方式。

人工智能的准确和精细的未来图景——一个与其流行的描述相竞争的图景——一开始就受到了难以精确定义「人工智能」这一问题的阻碍。在研究小组所考虑过的所有定义方法中,没有一个认为现在存在某种「通用的」人工智能。

尽管使用了共同的研究和技术,但人工智能系统都专注于完成特定的任务,而且其中每一种应用都需要数年的专注研究和精心独特的构建。这也造成了这 8 个领域内进展的不平衡。

交通是其中一个典型的例子——其中一些关键技术让人工智能以惊人的速度得到了广泛的采用。自动化交通很快就将无处不在,并将成为大多数人与嵌入了人工智能系统的物理实体的第一次经历,并将极大地影响公众对人工智能的感知。随着汽车自己变成了比人类更好的司机,城市居民的私家车将会更少,也将住得离工作场地更远,花费时间的方式也将发生改变,从而带来一种全新的城市组织形式。

2030 年一座典型的北美城市,嵌入了人工智能应用的物理实体将不仅限于客车,还将包含货车、飞行器和个人机器人。安全和可靠硬件的改进将会刺激未来十五年内的创新,也将带来更好的家庭/ 服务机器人——它们已经进入了人们的家庭,目前主要是以真空吸尘器的形式。

更好的芯片、低成本 3D 传感器、基于云的机器学习和语音理解的进步将提升未来的机器人服务和它们与人类的交互。专用机器人将能够递送包裹、清洁办公室和增强安全性。但在可预见的未来里,技术限制和可靠的机械设备的高成本将继续将商业机会限制在定义狭窄的应用范围内。

在医疗保健方面,在收集用于个人监控设备和移动应用的有用数据上已经出现了巨大的飞跃,这些数据来自医疗机构的电子病历(EHR ),以及小范围的用于辅助医疗手术的手术机器人和支持医院运营的服务机器人。未来几年,基于人工智能的应用将能够改善数百万人的健康状况和生活质量。

尽管临床应用从实验室到真实世界的过程一直都较为缓慢,但有希望的迹象表明创新的步伐将得到提升。通过共享数据的激励和机制以及去除无理的政策、法规和商业障碍,可以促进医疗保健领域的进步。对于许多应用,人工智能系统必须紧密地与医护人员和病人密切合作才能获得他们的信任。改善智能机器与医护人员、病人和病人家庭的自然交互方式是很关键的。

为人类和有前途的人工智能技术带来更流畅的交互同样也是教育领域的一大关键难题,这个领域在这段时间也出现了一些可观的进展。尽管素质教育总是需要人类教师的活跃参与,但人工智能有望改善所有层次的教育,尤其是通过大规模提供个性化教育。

交互式机器导师现在已经被用于根据匹配的学生教授科学、数学、语言和其他学科。自然语言处理、机器学习和众包也已经极大地促进了在线学习,让教育水平更高的教师可以将他们的教室扩大很多倍,同时还能应对单个学生的学习需求和风格。在接下来的十五年的典型北美城市里,这些技术在教室和家庭里的应用将很有可能得到极大的扩展,只要它们能够有意义地和面对面的学习进行整合。

除了教育方面,在协助低资源社区上,人工智能方法也存在很多机会——通过为各种社会问题提供缓解方案和解决方案。传统上,投资者对缺乏商业应用的人工智能研究投资不足。有了针对性的激励和资助重点,人工智能可以帮助解决低资源社区的需求,这方面一些新兴的工作是很有希望的。

比如,使用数据挖掘和机器学习,人工智能可以创造预测模型来帮助政府机关解决防止儿童铅中毒和高效食物分配等问题。这些萌芽中的工作认为还有更多的事情要做,尤其是当机构和组织也能参与进来并与这些社区建立起信任时。

获取公众信任也是公共安全领域内人工智能应用的一大难题。北美城市和联邦机构已经开始在边境管理和执法部署人工智能技术。到 2030 年,他们将在很大程度上依赖于它们,包括用于侦察的改进过的相机和无人机、用于检测金融诈骗的算法和预测性警务。

后者带来了对无辜的人进行无理的监控的问题,我们必须小心谨慎不要给系统引入人为偏见,并保护公民自由。部署良好的人工智能预测工具有望给数据和推断带来新形式的透明,并可能被应用于检测、删除和减少人类偏见,而不是增强它。

在人工智能对就业和工作场所的影响上的社会和政治决策也是类似,比如需要安全网来保护人们免受经济结构变化的影响。人工智能有望在一些特定类型的工作中取代人类,比如驾驶汽车或卡车。但是,在许多领域,人工智能在短期内很有可能将取代很多任务,但不能取代工作岗位,而且还将创造新类型的工作。

但这些将会出现的新型工作目前还比将可能失去的工作更难预想。人工智能还将降低许多货物和服务的成本,有效地使每个人都过得更好。更长期来看,人工智能可能会被视为一种非常不同的财富创造机制,其中每个人都应该从全世界的人工智能所创造的财富中分一杯羹。对于人工智能技术的经济成果的分配方式,不久之后已经就应该会有相关的社会争论出现了。

娱乐已经被社交网络和其它用于共享和浏览博客、视频和照片的平台转变了;这些平台依赖于 NLP 、信息检索、图像处理、众包和机器学习等领域内正被活跃开发的技术。一些传统的娱乐资源已经开始拥抱人工智能,包括谱曲、创作舞台表演、甚至根据自然语言文本生成 3D 场景。

人们对人工智能驱动的娱乐的热情让人惊叹。和人工智能的许多方面一样,在技术对社交的替代或增强方面也一直存在着争议。人工智能能让娱乐越来越交互式、越来越个性化、越来越有参与感。应该引导一些研究来理解如何利用这些性质为个人和社会利益服务。

人工智能接下来的研究?

助力人工智能革命的研究也在快速发展。其中最重要是机器学习的成熟,它受到了数字经济崛起的部分影响。数字经济和机器学习都提供并利用大量的数据。其他因素包括云计算资源的崛起,以及消费者对语音识别和导航支持这样的技术服务的需求。

机器学习由于人工神经网络的成功经验前进了一大步,如今能够使用大型数据集和大规模计算对其进行训练。这一方法也就是我们所熟知的深度学习。信息处理算法的性能也因为传感、感知、目标识别等这些基础操作的硬件技术的重大进步,而取得了跳跃性进展。

数据驱动产品的新型平台和市场以及经济激励发现新的产品和市场,也刺激着研究的发展,如今,随着它称为了社会的核心力量,人工智能领域转向了建立能与人高效合作的、具有更广泛人类意识的智能系统,包括开发人教机器人的交互与可延展方式的创造性方法。

这些趋势引发了如今人工智能基础方法与应用领域研究的热门:

大规模机器学习 涉及到学习算法的设计,延展已有的算法,在极大型的数据集上做研究。

深度学习 是一类学习方法,促进了在图像、视频标记和运动中的目标识别,并且在其他感知领域都有重大影响,比如音频、语音和自然语言处理。

强化学习 是一个框架,能将机器学习的重点从模式识别转变到经验驱动的序列决策上。它有望推动人工智能应用的前进,在现实世界中做出决策。虽然在过去数十年,强化学习限制于学术界,但如今我们也看到了一些实际的成果。

机器人 目前主要涉及到如何训练机器人以一种更泛型的、预测性的方式与周围世界进行交互,如何在交互环境中促进对目标的操控,以及如何与人进行交互。机器人的进步将依靠相应的技术进步,从而改进计算机视觉和其他形式的机器感知的可靠性与普遍性。

计算机视觉 是目前机器感知中最突出的形式。它是受到深度学习崛起影响最大的人工智能子领域,实现了史上第一次计算机能够比人类更好的完成视觉任务。如今更多的研究集中在图片和视频的自动化文字描述上。

自然语言处理 通常与自动语音识别相结合,快速成为有大型数据集的普遍使用的口语语言上的一种商品。目前的研究转向了开发能够与人通过对话交互的精致、可用的系统,而不仅是对程式化的问答做回应。在多种不同语言间进行机器翻译也已经取得了重大进展,在不远的将来将有更多的实时的个人到个人交流。

协作系统研究 主要是研究帮助开发能与其他系统或人类协作的自动化系统的模型和算法。

众包和人类计算研究是研究增强计算系统的方法,增强方式是通过自动调用人类经验,解决计算机不能单独解决的问题。

算法博弈论 Algorithmic game theory )和 计算社会选择computational social choice )吸引了人工智能经济和社会计算领域的注意,比如系统如何处理潜在的不恰当激励机制,包括自私的人类参与者或公司以及代表他们的自动化人工智能代理。

物联网 IoT )研究专注于将大量设备(包括家电、汽车、建筑、摄像头)连接起来,收集并共享各自丰富的传感信息从而达到智能目标。

神经形态计算 是一系列寻求模拟生物神经网络从而改进计算机系统硬件效率和稳健性的技术,它取代了用独立的输入/ 输出、处理指令、存储模块的旧方法。

现在与未来的人工智能政策

人工智能应用是否成功的标准是他们为人类创造的价值。在此角度看,设计人工智能应用应该使得人们成功的理解人工智能系统,参与到其使用中并建立对它们的信任。公共政策应该帮助社会轻松采纳人工智能应用、扩展其收益,并缓和它们的难免的错误和失败。

对人工智能如何开展的争论包括对隐私保护和人工智能收益公平分配的忧虑,这种忧虑是该被鼓励的。在人工智能技术如此快的实现速度之下,也伴随着对其应用的担心。研究小组建议所有的政府律师掌握人工智能技术知识。

此外,要通过移除障碍并增加私营和公共支持,鼓励在人工智能系统公平性、安全性、隐私和社会化应用上的研究。目前在美国,至少有 16 个独立的经济相关的政府部门涉及到人工智能。人工智能研究,特别是其应用的快速进展,需要这些部门的专家开发新的法律、政策概念与隐喻(metaphor )。

当自动驾驶汽车发生车祸、医疗设备事故时谁该负责?如何避免人工智能应用宣传种族歧视或者金融诈骗?谁该得益于人工智能技术带来的效率?对技术过时的人群应该提供什么样的保护?随着人们在产业流程和消费产品中更广、更深的融入人工智能,更好的实践需要被铺开,也须要有更适合的政府制度。

研究小组没有考虑近期人工智能系统会自动选择对人造成伤害,可能的是人们使用基于人工智能的系统做好的以及坏的目的。而且尽管人工智能算法可能比人类做出一些较少偏见的决策,保证用于人工智能决策的数据没有偏见仍是一项技术挑战,这些偏见可能导致基于种族、性别以及其他因素的歧视。

面临人工智能技术产生的重大变革,逼迫生成更多、更严格的条例也可能使不可避免的。错误理解什么是人工智能可能刺激人们反对有益于每个人的这些技术。不合适的条例可能造成悲剧。信息贫乏的条例会而扼杀创新,或者将其转移到其他司法权可能是达不到预期目标的。

幸运的是,领导产生如今数字技术成功条例的原则为我们提供了起点。在私营条例中,宽泛的法律规定配合强硬的透明度需求和有意义的强制措施(而非严格的控制)能够鼓励公司开发流程,鼓励职业人员实施隐私控制,与外部利益相关者结合,并将实践适应于技术发展。这反过来也能支持专业贸易协会和标准委员会在开展最好的实践上的发展。

在人工智能中,监控着也能加强内部和外部问责、透明度、专业度之间活动的良性循环。我们急需一场重要的、有力的、信息丰富的讨论会,讨论如何以一种丰富我们生活与社会的方式最好的控制人工智能,同时鼓励该领域的创造性。

由于高计算能力和大规模数据是很多人工智能技术的燃料且不平等的分布于社会,这使得人工智能技术把机遇不平等性变得更宽。这些技术将促进有机会接触数据和计算能力的那群人的能力和效率。在政策是否培养民主价值观、公平共享人工智能收益,或者是否将力量和收益聚集于少数幸运的人手中,我们要对政策进行评估。

就像本报告记录的那样,人工智能相关的重大进展在过去 15 年中已经对北美城市造成了影响,而且在接下来的 15 年中将会发生更多大量的进展。近期的进步主要是由于互联网带来的大型数据集的增长和分析、传感技术的进步,以及深度学习的应用。

在接下来几年,随着公众鼓励在交通、医疗这些领域的人工智能新应用,它们肯定会以一种建立可靠的、理解的方式被引入,并且还要尊重人权与公民权利。在鼓励创新的同时,政策和流程应该解决道德、隐私和安全影响,还应该保证人工智能技术的收益公平、广泛的分配。

如果人工智能研究与应用到 2030 年以及更远的未来在北美城市生活发挥积极的影响,做上面提到的事情是很重要的。

第一部分:什么是人工智能?

本节介绍了研究人员和从业者如何定义「人工智能」以及目前正在蓬勃发展的人工智能研究和应用领域。它提出了人工智能是什么和不是什么的定义,并介绍了一些当前人工智能研究的「热点」领域。

本节为第二部分的内容奠定了基础,第二部分阐述了人工智能在八个领域和在第三部分中的影响与未来,第三部分介绍了涉及人工智能设计和公共政策的问题,并提出在保护民主价值的同时如何鼓励人工智能创新的建议。

定义人工智能

奇怪的是,人工智能缺乏一个精确的、被普遍接受的定义,这或许有助于该领域的加速成长、繁荣以及前进。虽然人工智能的从业者、研究人员和开发人员由一种粗略的方向感和一个「与它相处」的命令所引导,人工智能的定义仍然很重要,而 Nils J. Nilsson 就提供了一个有用的定义:「人工智能就是致力于让机器变得智能的活动,而智能就是使实体在其环境中有远见地、适当地实现功能性的能力。」

从这个角度来看,对人工智能的表征取决于个人愿意「适当地」并「有远见地」为功能性提供合成软件和硬件的信用。一个简单的电子计算器比人类大脑进行的计算要快得多,而且几乎从来不出错。

电子计算器智能吗?像 Nilsson 一样,研究小组以一种宽泛的视角来看待此问题,认为智力取决于一个多维频谱。根据这一观点,算术计算器和人脑之间的区别不是某一类,而是规模、速度、自主性和通用性的区别。

同样的因素可以用来评估智能的其他各例——智能语音识别软件、动物大脑、汽车巡航控制系统、围棋程序、自动调温器——并将它们放置在频谱中的适当位置。虽然我们的宽泛解释把计算器列在了智能频谱中,但是如此简单的设备与今天的人工智能相比几乎没有相似之处。

从这个角度看,对人工智能的表征取决于个人愿意「适当地」并「有远见地」为功能提供合成软件和硬件的信用。一个简单的电子计算器比人脑计算快得多而且几乎从不出错。

人工智能的边界已经远远走在前面,而计算器可以实现的功能只是当下的智能手机的百万分之一。目前人工智能开发人员正在改进、推广和扩大从当下的智能手机中所建立起来的智能。事实上人工智能领域是一个不断努力推动机器智能向前发展的过程。

具有讽刺意味的是,人工智能正在遭受失去话语权的长期灾难,最终不可避免地会被拉到边界内,即一个被称为「人工智能效应(AI effect )」或「奇怪悖论(odd paradox )」的重复模式——人工智能将一种新技术带到了普通大众中去,人们习惯了这种技术,它便不再被认为是人工智能,然后更新的技术出现了。

同样的模式将在未来继续下去。人工智能并没有「交付」一个惊雷般改变生活的产品。相反人工智能技术以一个连续的、进步的方式正在继续更好的发展。

人类尺度

值得注意的是,作为频谱的智能表征并不授予人类大脑以特殊地位。但到目前为止,即使人类拥有着「推理、实现目标、理解和生成语言、感知和响应感官输入、证明数学定理、玩具有挑战性的游戏、合成和总结信息、创造艺术和音乐甚至撰写历史」的能力,人类智力在纯粹的多功能性上与生物的和人工的世界并不相匹配。

这使得人类智能成为检测人工智能进步的一个自然选择。它甚至可能是作为一个经验法则被提出来,认为计算机能够执行的、以及人们曾经实现了的任何活动,都应该算作智力的一个实例。但是对于任何人类能力的匹配只是一个充分条件而非必要条件。至少在速度上,已经存在许多超越人类智力的系统,比如对机场成千上万的航班进行每日往返行程的调度。

对人工智能在国际象棋游戏中打败人类玩家的长期探索以及最终的成功为人类和机器智能之间的比较提供了一个高知名度的实例。人们已经被国际象棋吸引了数百年。

当建立计算机的可能性即将来临时,被许多人认为是计算机科学之父的 阿兰图灵「提到了以国际象棋作为范例来展示智力的计算机概念。」没有对强大的计算机的访问,「图灵玩了一个模拟计算机的游戏,他每走一步棋大约花半个小时。」

但只是在六十和七十年代,由来自卡耐基- 梅隆大学、斯坦福、麻省理工学院、莫斯科的理论和实验物理研究所以及西北大学的小组所贡献的一长串改进之后,国际象棋游戏程序开始取得成果。终极推动是来自 IBM 的一个长期项目,Deep Blue 程序于 1997 年以 3.5-2.5 的成绩打败了国际象棋冠军 Garry Kasparov

奇怪的是,在人工智能赶上了它的难以捉摸的目标之后没多久,Deep Blue 被描绘成一个「蛮力方法(brute force methods )」集合,而不是「真正的智能(real intelligence )。」事实上,IBM 关于 Deep Blue 的后续出版物提供了有关其搜索和评价程序的丰富内容,完全没有提及「智能的(intelligent )」一词!Deep Blue 是否智能?又一次,边界移动了。

一个可操作的定义

人工智能也可由其研究人员的工作来定义。本报告主要将人工智能视为通过合成智能以研究智能特性的计算机科学的一个分支。虽然人工智能的出现是依靠着硬件计算资源的快速发展,但是这里对于软件的关注反映出人工智能界的一个趋势。尽管,最近在为基于神经网络计算建立定制硬件上取得的进展已经促进了人工智能硬件和软件之间的严格耦合。

「智能(intelligence )」仍然是一个复杂现象,其不同方面已经吸引了几个不同研究领域的注意,包括心理学、经济学、神经科学、生物学、工程学、统计学和语言学。人工智能领域自然是得益于所有这些相关领域的进步。比如人工神经网络,如今已成为若干基于人工智能的解决方案的中心,它最初是受生物神经元中有关信息流的思想所启发。

人工智能研究趋势

直到本世纪初,人工智能的吸引点主要在于它所传递的承诺,但在过去的十五年里,大多这样的承诺已经得到兑现。人工智能技术已经充斥了我们的生活。当它们成为了社会的一股中心力量时,该领域正在从仅仅建立智能系统,转向了建立有人类意识的、值得信赖的智能系统。

几个因素加速了人工智能革命。其中最重要的是机器学习的成熟,部分由云计算资源和广泛普及的、基于 Web 的数据收集所支持。机器学习已经被「深度学习(deep learning )」急剧地向前推进了,后者是一种利用被称作反向传播的方法所训练的适应性人工神经网络的一种形式。

信息处理算法的这种性能飞跃一直伴随着用于基本操作的硬件技术的显著进步,比如感觉、感知和目标识别。数据驱动型产品的新平台和新市场,以及发现新产品和新市场的经济激励机制,也都促进了人工智能驱动型技术的问世。

所有这些趋势都推动着下文中所描述的「热门」研究领域。这种编辑只是想要通过某个或另一个度量标准来反映目前比其他领域得到更大关注的领域。它们不一定比其他领域更重要或更有价值。事实上目前的一些「热门」领域在过去几年中并不怎么流行,而其他领域可能在未来会以类似的方式重新出现。

大规模机器学习

许多机器学习的基本问题(如监督和非监督学习)是很好理解的。目前努力的一个重点是将现有算法扩展到更庞大的数据集上。例如鉴于传统方法能够负担得起若干遍数据集的处理,现代方法是为单次处理所设计;某些情况只认同非线性方法(那些只关注一部分数据的方法)。

深度学习

成功训练卷积神经网络的能力非常有益于计算机视觉领域,比如目标识别、视频标签、行为识别和几个相关变体的应用。深度学习也在大举进军感知方面的其他领域,如音频、语音和自然语言处理。

强化学习

鉴于传统机器学习主要关注于模式挖掘,强化学习将重点转移到决策中,这种技术将有助于促进人工智能在现实世界中更深入地进入相关研究和实践领域。作为一种经验驱动型的序贯决策框架,强化学习已经存在了几十年,但是这个方法在实践中没有取得很大成功,主要是由于表征和缩放的问题。然而深度学习的出现为强化学习提供了「一贴强心剂」。

由谷歌 DeepMind 开发的计算机程序 AlphaGo 在五次对抗比赛中击败了人类围棋冠军,它最近所取得的成功在很大程度上要归功于强化学习。AlphaGo 是通过使用一个人类专家数据库来初始化一个自动代理的方法被训练的,但随后提炼的方法是通过大量地自我对抗游戏以及应用强化学习。

机器人

至少在静态环境中,机器人导航在很大程度上被解决了。目前的努力是在考虑如何训练机器人以泛型的、预测性的方式与周围世界进行交互。互动环境中产生的一个自然要求是操纵,这是当下所感兴趣的另一个话题。

深度学习革命只是刚开始影响机器人,这在很大程度上是因为要获得大的标记数据集还很困难,这些数据集已推动了其他基于学习的人工智能领域。

免去了标记数据需求的强化学习可能会有助于弥合这一差距,但是它要求系统在没有错误地伤害自己或其他系统的情况下能够安全地探索出一个政策空间。在可信赖的机器感知方面的进步,包括计算机视觉、力和触觉感知,其中大部分将由机器学习驱动,它们将继续成为推进机器人能力的关键。

计算机视觉

计算机视觉是目前最突出的机器感知形式。它是受深度学习的兴起影响最大的人工智能子领域。直到几年前,支持向量机还是大多视觉分类任务所选择的方法。但是特别是在 GPU 中的大规模计算的汇合,使得更大数据集的可获得性(尤其是通过互联网)以及神经网络算法的改进导致了基准任务中能的显著提高(比如 ImageNet 中的分类器)。计算机首次能够比人类更好地执行一些(狭义定义的)视觉分类任务。目前的研究多是关注于为图像和视频自动添加字幕。

自然语言处理

自然语言处理是另一个通常与自动语音识别一同被当做非常活跃的机器感知领域。它很快成为一种拥有大数据集的主流语言商品。谷歌宣布目前其 20% 的手机查询都是通过语音进行的,并且最近的演示已经证明了实时翻译的可能性。现在研究正在转向发展精致而能干的系统,这些系统能够通过对话而不只是响应程式化的要求来与人互动。

协同系统

协同系统方面进行的是对模型和算法的研究,用以帮助开发能够与其他系统和人类协同工作的自主系统。该研究依赖于开发正式的协作模型,并学习让系统成为有效合作伙伴所需的能力。能够利用人类和机器的互补优势的应用正吸引到越来越多的兴趣——对人类来说可以帮助人工智能系统克服其局限性,对代理来说可以扩大人类的能力和活动。

众包和人类计算

在完成许多任务方面由于人类的能力是优于自动化方法的,因而在众包和人类计算方面,通过利用人类智力来解决那些计算机无法单独解决好的问题,该领域研究调查了增强计算机系统的方法,这项研究的提出仅仅是在大约 15 年前,现在它已经在人工智能领域确立了自己的存在。最有名的众包例子是维基百科,它是一个由网络公民维护和更新的知识库,并且在规模上和深度上远远超越了传统编译的信息源,比如百科全书和词典。

众包专注于设计出创新的方式来利用人类智力。Citizen 科学平台激发志愿者去解决科学问题,而诸如亚马逊的 Mechanical Turk 等有偿众包平台,则提供对所需要的人类智力的自动访问。通过短时间内收集大量标记训练数据和/ 或人机交互数据,该领域的工作促进了人工智能的其它分支学科的进步,包括计算机视觉和自然语言处理。基于人类和机器的不同能力和成本,目前的研究成果探索出了它们之间理想的任务分离。

算法博弈理论与 ( 基于 计算机 ( 统计技术的 社会选择

包括激励结构、人工智能的经济和社会计算维度吸引到了新的关注。自 20 世纪 80 年代初以来,分布式人工智能和多代理(multi-agent )系统就已经被研究了,于 20 世纪 90 年代末开始有显著起色,并由互联网所加速。一个自然的要求是系统能够处理潜在的不恰当激励,包括自己所感兴趣的人类参加者或公司,以及自动化的、基于人工智能的、代表它们的代理。

备受关注的主题包括计算机制设计(computational mechanism design )(一种激励设计的经济理论,它寻求激励兼容的系统,其中输入会被如实报告)、( 基于) 计算机 ( 统计技术的) 社会选择(computational social choice )(一种有关如何为替代品排列顺序的理论)、激励对齐信息获取(incentive aligned information elicitation )(预测市场、评分规则、同行预测)和算法博弈理论(algorithmic game theory )(市场、网络游戏和室内游戏的平衡,比如 poker ——它在近几年通过抽象技术和无遗憾学习(no-regret learning )已经取得了显著的进步)。

物联网(IoT

越来越多的研究机构致力于这样一个想法:一系列设备可以相互连接以收集和分享它们的感官信息。这些设备可以包括家电、汽车、建筑、相机和其他东西。虽然这就是一个技术和无线网络连接设备的问题,人工智能可以为了智能的、有用的目的去处理和使用所产生的大量数据。目前这些设备使用的是令人眼花缭乱的各种不兼容的通信协议。人工智能可以帮助克服这个「巴别塔」。

神经形态计算

传统计算机执行计算的冯诺依曼模型,它分离了输入/ 输出、指令处理和存储器模块。随着深度神经网络在一系列任务中的成功,制造商正在积极追求计算的替代模型——特别是那些受到生物神经网络所启发的——为了提高硬件的效率和计算系统的稳定性的模型。

目前这种「神经形态的(neuromorphic )」计算机尚未清楚地显示出巨大成功,而是刚开始有望实现商业化。但可能它们在不久的将来会变成寻常事物(即使仅作为冯诺依曼所增加的兄弟姐妹们)。深度神经网络在应用景观中已经激起了异常波动。当这些网络可以在专门的神经形态硬件上被训练和被执行,而不是像今天这样在标准的冯诺依曼结构中被模拟时,一个更大的波动可能会到来。

总体趋势以及人工智能研究的未来

数据驱动型范式的巨大成功取代了传统的人工智能范式。诸如定理证明、基于逻辑的知识表征与推理,这些程序获得的关注度在降低,部分原因是与现实世界基础相连接的持续挑战。规划(Planning )在七十和八十年代是人工智能研究的一根支柱,也受到了后期较少的关注,部分原因是它强烈依赖于建模假设,难以在实际的应用中得到满足。

基于模型的方法——比如视觉方面基于物理的方法和机器人技术中的传统控制与制图——已经有很大一部分让位于通过检测手边任务的动作结果来实现闭环的数据驱动型方法。即使最近非常受欢迎的贝叶斯推理和图形模式似乎也正在失宠,被数据和深度学习显著成果的洪流所淹没。

研究小组预计在接下来的十五年中,会有更多关注集中在针对人类意识系统的开发上,这意味着它们是明确按照要与之互动的人类特点来进行建模与设计的。很多人的兴趣点在于试图找到新的、创造性的方法来开发互动和可扩展的方式来教机器人。

此外在考虑社会和经济维度的人工智能时,物联网型的系统——设备和云——正变得越来越受欢迎。在未来的几年中,对人类安全的、新的感知/ 目标识别能力和机器人平台将会增加,以及数据驱动型产品数量与其市场规模将会变大。

研究小组还预计当从业者意识到纯粹的端到端深度学习方法的不可避免的局限性时,会重新出现一些人工智能的传统形式。我们不鼓励年轻的研究人员重新发明理论,而是在人工智能领域以及相关领域(比如控制理论、认知科学和心理学)的第一个五十年期间,保持对于该领域多方面显著进展的觉察。

第二部分:人工智能在各领域的应用

虽然人工智能的很多研究和应用会基于一些通用技术,比如说机器学习,但在不同的经济和社会部门还是会有所区别。我们称之为不同的领域(domain ),接下来的这部分将介绍人工智能研究和应用的不同类型,以及影响和挑战,主要有八个方面:交通、家庭服务机器人、医疗健康、教育、低资源社区、公共安全、工作和就业、娱乐。

基于这些分析,我们还预测了一个有代表性的北美城市在未来 15 年的趋势。与人工智能的流行文化中的典型叙述不同,我们寻求提供一个平衡的观点来分析,人工智能是如何开始影响我们日常生活的,以及从现在到 2030 年,这些影响将如何发展。

交通

交通可能会成为首批几个特定应用领域之一,在这些领域,大众需要对人工智能系统在执行危险任务中的可靠性和安全性加以信任。自动化交通会很快司空见惯,大多数人在嵌入人工智能系统的实体交通工作的首次体验将强有力的影响公众对人工智能的感知。

一旦硬件做到足够安全和稳健,它进入日常生活的速度将使公众所惊讶,这可能需要时间进行调整。随着汽车逐渐取代人类成为更好的司机,城市居民拥有的车辆将减少,住所和工作地点的距离也会更远,花费的时间也会发生变化。这会导致出现一种全新的城市组织架构。再者,2030 年在典型的北美城市中,人工智能带来的改变将不仅限于车辆,还会影响各种飞行器和个人机器人,这将引发对社会、道德和政策等议题的讨论。

一些关键技术已经催化了人工智能在交通领域的广泛应用。与 2000 年相比,智能手机的普及,各类传感器成本的下降和性能的提升,使得我们今天能获取的关于个人和群体交通数据的规模和多样性获得了惊人的增长。如果没有这些数据、连接、实时传感和交通预测等应用、路线规划,共享乘车和自动驾驶将不可能实现。

智能汽车

2001 年,GPS 被应用于私家车用于定位,目前已经成为交通系统的基础部件。GPS 在辅助司机进行驾驶时也将关于交通模式的大量数据提供给科技公司和城市部门。拥有 GPS 功能的智能手机的广泛应用也进一步增强了链接以及位置信息的共享。

当前的车辆还配备了各种传感设备。根据估算,美国平均每一辆车上装有 70 个传感器,包括陀螺仪、加速器、亿光环境光源传感器和湿度传感器。对于汽车来说,传感器已经不是什么新事物了。2000 年之前制造的汽车已经装配了能够获取自身速度、加速和轮胎状况的传感器。

这些车辆还拥有一些功能,能够把实时传感和决策(例如 ABS )、气囊控制、电气牵引系统和控制和电子稳定程序结合起来。自从 2003 年以来,一些自动化功能就已经被引入了商用车,具体功能见下表。

这些功能能够协助司机,甚至完全取代司机的某些活动来增强安全性和舒适性。现在的汽车能够自动破车,在高速路上可以自适应巡航控制,变换车道时可以提示驾驶员盲区中出现的物体信息。视觉和雷达技术被引入到碰撞预防系统。深度学习也已经应用在了这些方向,通过对周围环境的物体检测和声音识别来提升自动驾驶汽车的性能。

不远的未来,在用于驾驶的功能方面,感知算法将超过人类的水平。包括视觉在内的自动化感知,在处理是被和跟踪等任务时,已经接近人类水平。

除了感知方面的进步,随之出现的还有算法的进一步提升所带来的推理和规划能力。近期一份报告预测,自动驾驶汽车将在 2020 年得到广泛应用。而自动驾驶功能的应用也将不局限于个人交通。

我们将看到自动驾驶汽车和远程操控的运载车辆、飞行器、和自动驾驶卡车。基于用户共享的交通服务也将充分利用自动驾驶汽车。此外,机器人技术的进步也将更有利于其他类型自动驾驶设备的创造和应用,包括机器人、无人机等。

现在还不明确的一点是,自动驾驶汽车需要发展到何种程度才能引起大众的广泛接受。半自动驾驶汽车中的人车合作与人类司机认知符合的潜在意义都还未能完全理解。