Yann LeCun撰文解读:人工智能未来的机会在哪里?

几个小时前,Facebook 人工智能研究实验室主管 Yann LeCun 和 Facebook 应用机器学习部门主管 Joaquin Quiñonero Candela 在 Facebook Code 博客上发表了一篇题为《Artificial intelligence, revealed》的文章,介绍了人工智能的一些基本概念和能力,并讨论了相关应用和研究上的未来前景。除此之外,本文还包含了三段简洁直观的演示视频,其中两段更是由 Yann LeCun 亲自解说的。如果你是一名学生,你还能在这篇文章中看到一些有用的建议。此外,你也可以看看人工智能站整理 Yann LeCun 在Quora上的问答,里面也有很多不错的建议。

现在是早上周二早上八点。你已经醒了,浏览手机头条新闻,回复 po 文,为老妈订购毛衫,锁门,开车上班,一路听着收音机里的美妙音乐

此时,你已经使用人工智能不下十几次了——被唤醒、早间地方天气预报、购买礼物、锁门、注意即将到来的堵车、甚至识别一首还不熟悉的歌曲。人工智能已经渗透进我们的生活,日常生活发生大不同。但是,这并非你在科幻电影里看到的人工智能(神经兮兮的科学家噼啪敲打键盘,试着阻止人工智能摧毁世界)。你的智能手机、房屋、银行和汽车每天都会用到人工智能。有时你感受到你在使用人工智能,比如当你请 Siri 导航到最近的气站时,或者 Facebook 根据你贴出的一张图片为您推荐好友时。有时你就感觉不到,比如,当你要求 Amazon Echo 用你的信用卡进行一次不寻常的购物时(比如愚蠢的节日毛衫),银行并没有发出欺诈警告。

自动驾驶汽车、医学图像分析、更好的医疗诊断以及个性化医疗,人工智能会为这个社会带来很多变化。未来,它还会带来很多极具创造力的应用以及服务。但是,对于许多人来说,它仍然显得神秘莫测。

为了揭开部分神秘之处,Facebook 正在创建一系列在线教育视频,介绍人工智能如何运作。我们希望这些简单精炼的介绍会帮助每个人了解这一计算机科学中的复杂领域是如何运作的。

没有魔法,代码而已

首先你需要知道一些重要的内容:人工智能是一门使用算法技术设计智能系统和机器的严谨科学,而这种算法技术的灵感某种程度上源自我们对大脑的了解。许多现代人工智能系统使用了人工神经网络,一种计算机代码,它能模拟出由非常简单的互联单元构成的大型网络,这有点像大脑神经元构成。这些网络通过修改单元之间的连接而不断从经验中学习,就像人类和动物的大脑不断变化神经元之间的连接进行学习。现代神经网络能够学会模式识别、翻译、简单的逻辑推理,甚至可以创造图像和形成新的想法,模式识别尤为重要——人工智能善于识别海量数据中的模式,对于人类来说,这可不是简单的事。

通过专门用来运行有着数百万单元和数十亿链接的神经网络的一套编码程序,所有这些都能以眼花缭乱的速度发生着。在海量简单元素的交互过程中,智能出现了。人工智能不是魔法,但是我们已经看到了它能使科学研究研究领域取得魔法般的进步,它们能识别照片里的物体、识别语音、驾驶汽车或者将在线文章翻译成多种语言,每天都给我们带来一些奇迹。

在 FAIR 实验室,我们正在研究如何让机器更好地工作,大部分工作内容就是深度学习,亦即如何通过搭建多个处理层的神经网络来增强人工智能。通过使用深度学习,我们可以帮助人工智能学会提取世界的表征。深度学习能有助于改善语音、物体识别之类的活动,在推进诸如物理学、工程学和医学等多种科学领域的研究中,也扮演者重要角色。

一种特别有用的深度学习系统架构是卷积神经网络(CNN 或 ConvNet),它是一种连接神经网络单元的特殊方式,其灵感来自动物和人类的视觉皮层结构。现代的 ConvNet 可以少至七层、多至百层。在公园里我们人类在看见一只柯利牧羊犬或一只吉娃娃时都能够将它们识别为狗,尽管它们大小和体重都不同。对于计算机来说,一张图片不过是一列数字而已。在这一数字行列中,目标物体的边缘等局部模体(local motif)在第一层就能被轻易检测到。接下来的那一层将识别出这些构成简单形状的简单模体(simple motif)的组合,比如车轮或眼部。最后一层将会识别这些组合的进一步组合:一辆车、一架飞机、一个人、一只狗等等。网络的深度——多层——能够让它以这样的层级方式识别复杂模式。

只要有巨大的样本库来进行训练,CNN 在识别图像、视频、音乐甚至文本等自然信号上就会特别有用。为了训练出一个良好的神经网络,你需要提供大量经过了人类标注的图像。卷积神经网络能够学会将每一张图像与其对应的标签关联起来。而让我们感兴趣的地方是它还能够生成其之前从未见过的标签。最终我们能得到一个能梳理大量不同 影像并识别图片内容的系统。在语音识别和文本识别上,这些网络也特别有用,也是自动驾驶汽车以及最新一代的医疗图像分析系统的关键组成部分。

什么是可学习的?

人工智能也解决了人类所面临的核心问题之一:什么是智能?哲学家和科学家们一直在努力解决这个问题。但其答案一直是难以捉摸而又玄之又玄的,然而正是因为这个重要的特性才使得我们成为独一无二的人类。

同时,人工智能也揭露出一个大的哲学和理论性的问题:什么是可学习的(learnable)?因为数学定理告诉我们单个的学习机器不能有效地学习所有可能的任务,那么我们就会感到:不管你投入多少资源,总是有东西不能被学习。

在这个方面,人工智能机器和人类非常类似。我们不总是擅长学习。尽管我们的大脑有明显的适应性,但是它们有着非常强的专业性。而当代的人工智能系统还远远不具有人类所拥有的看似通用的智能。

在人工智能方面,我们一般考虑学习的 3 种类型:

强化学习(Reinforcement learning) ——这是一个关于代理机制如何行动以实现回报最大化的问题,它的灵感来自于行为主义心理学(behaviorist psychology)。在一个特定情形中,机器执行一个或者一系列动作,并且得到回报。这通常用于教机器玩游戏和赢得比赛,比如,国际象棋、西洋双陆棋、围棋或者简单的视频游戏。其中的一个问题在于,在其最初始的形式中,强化学习需要极多的试验才能学会一个简单的任务。

监督学习(Supervised learning) ——一般来说,对于特定的输入,我们告诉机器相应的正确答案。比如对于一张汽车的图像,我们还会给出相应的正确答案「汽车」。它被称为监督学习,因为算法从被标记的训练数据集中学习的过程类似于向一个年幼的孩子展示一本图画书。成年人知道正确答案,孩子们则依据先前的例子来进行猜测。这是训练神经网络和其他机器学习架构常见的技术。比如,根据你的城镇的大量的房屋价格的描述,尝试预测你自己房子的售价。

无监督学习/预测学习(Unsupervised learning / predictive learning) ——大部分人类和动物都是在他们生命中的前几个小时、几天、几个月和几年的时间中以无人监督的方式学习:我们通过观察周围环境以及认识到我们的动作所造成影响来了解世界运转的规律。没有人告诉来告诉我们那些我们观察到的每一个事物的名字和功能。我们可以学习到非常基本的概念,比如,世界是三维的、物体不会凭空消失、没有支撑的东西会掉落。如今,我们还不知道如何让机器来学习这样的一些事情,至少机器不能做到人类和动物可以做到的这些事情。我们缺乏用于无监督或预测学习的人工智能技术,这是限制当前人工智能发展的因素之一。

这些方法经常在人工智能领域中使用,但是在计算设备方面仍然存在很多问题。这就是为什么即使我们造出了了超人(superhuman)的智能机器,它们的能力仍然是有限的——它们可能下棋能赢我们,但是却还没有聪明到知道怎么躲雨。

未来的工作

随着人工智能、机器学习和智能机器人变得越来越普遍,在制造、培训、销售、维护和团队管理方面,将出现新的工作需求。人工智能和机器人能够创造出今天难以想象的崭新服务。不过,第一批因人工智能技术而彻底转型的行业当中,显然会有医疗保健和运输业。

对年轻人来说,人工智能会提供大量的工作机会。所以,我们如何为尚不存在的工作做准备呢?

如果你是一名学生:

  • 数学和物理课程可以学到人工智能,机器学习,数据科学以及未来许多工作所需的基础知识。学习所有可以学的数学课程,包括 Calc I,Calc II,Calc III,线性代数,概率与统计,同时计算机科学也必不可少——你需要学习如何编程。工学,经济学和神经科学也很有用。你还可以考虑一些哲学领域的课程,例如认识论——这是一门研究什么是知识,什么是科学理论以及何为学习的学科。

  • 学习这些课程的目的不是简单的死记硬背,学生必须学会如何将数据转化为知识。这包括基本统计,如何收集和分析数据,注意到可能的偏见,并对通过偏见数据操作来防止自欺的技巧保持警惕。

  • 你可以在学校请教一位教授来帮助你将想法具体化,如果他们时间有限,你也可以寻找高年级的博士生或博士后合作。

  • 申请博士课程吧。现在请忘记学校「排名」,找到一位研究你感兴趣的课题的受尊重的教授,或选择一个你认为写论文质量很高的人。去申请这些教授所在的学校的博士课程,并记得在信中提到你想与该教授合作,同时也可与他人合作。

  • 投入你感兴趣的人工智能有关问题并开始阅读有关文献,尝试用不同的方式思考。在毕业之前,尝试写一篇关于你的研究的文章或者发布一个开源代码。

  • 申请有关行业的实习,从实践中亲身获取人工智能工作原理方面的经验。

如果你已经有了工作但想要转行:

  • 通过在线提供的教程,你可以了解深度学习的概念。网上有很多的在线材料,教程和机器学习课程,包括 Udacity 和 Coursera 讲座。包括 发表在 Nature 上的综述,作者是我、Yoshua Bengio 和 Geoff Hinton,还有很多指向这篇综述的文章《 Deep Learning》,Goodfellow,Bengio 和 Courville 的深度学习教材,以及我最近在巴黎的法兰西学院开展的关于深度学习的 8 个讲座(法语教授,后来已有英译版本)也很有用。

  • 如果你想返校深造,请参考上文。

关于未来

越来越多的人类脑力活动将与智能机器关联起来。人之为人,便是因为拥有智慧;而人工智能便是智慧的延伸。

在建设真正智能机器的征途中,我们正在发现可应用并将改善我们今天、明天、明年日常生活的新理论,原则,方法与算法。这些技术中,有许多已经很快找到了应用到 Facebook 的产品和服务中的途径,如图像理解,自然语言理解等。

谈到在 Facebook 的人工智能时,我们有一个长期目标:即了解智能并构建智能机器。这不仅仅是一个技术挑战,还是一个科学问题。什么是智力?我们该如何在机器中将其再现?这仍是人类所探寻的问题。这些问题的答案不仅会对建立智能机器有所帮助,也让我们更加洞见神秘人类意识与大脑的工作方式。但愿它将能够帮助我们更好地理解生而为人的意义。

入门 Yann LeCun 观点 Facebook 入门