YEXP

YEXP

人工智能潮起潮落,方向始终如一丨数据科学50人·陶大程

来源:互联网

陶大程,悉尼大学教授、优必选悉尼大学人工智能中心主任、优必选人工智能首席科学家。从本科到博士,从大学教授到欧洲科学院外籍院士、澳洲科学院院士,他一直专注于人工智能的研究,在基于数据发展的机器智能时代里,他与世界上大部分AI学者一样,从学界跨入工业界,投身人工智能的第三次浪潮。在这次“数据科学50人”系列专访的对话中,他用自己的学识与眼界向我们阐述了自己对数据科学与人工智能的观察,希望给予读者思索与启发。

赋能——数据科学与人工智能的时代

数据科学、人工智能,当我们把这些粗犷的概念进行逻辑性地叠加时,我们便了解了他们之间的关系。

陶大程教授在解析数据科学时,如此说道:“数据科学是一门利用数据学习知识,并从数据中提取有价值的信息,以分析现实现象、挖掘本质和关系的学科。数据科学是一个对数据理解和分析的交叉学科,除了需要统计学、数据挖掘、机器学习等数据分析、理解和挖掘的学科,还涉及其他学科,包括物理、材料、化学、生物、医学等等。”

逻辑严密是人工智能学者的典型特质,而在国外大学为人师的陶教授也会利用生动的比喻与举例来解释他的观点与想法。“如果我们获取的数据来自一台照相机,并且目标是检测、识别图像数据中特定物体,那么这是机器视觉。机器视觉作为基本工具,获取了图像的基本信息,如何从这些信息中获得更多领域的知识,便是数据科学了。”

目前数据科学正在与基础行业、应用行业相互结合,比如物理、化学、生物以及材料学等。“以天气预报为例,传统的方法是建立物理模型,根据模型回归、解释数据,并进一步预测未来的天气。而使用数据科学的方法就可以完全不同:利用历史数据、专家标注信息,建立统计学习模型就可以达到进一步预测天气的目的,而且有的时候效果更好。”陶教授对数据科学的应用做出了自己的解释。

数据科学,相对于传统解决业务问题的方式与方法,减少了对于传统行业垂直知识的依赖,利用数据解决问题。在陶教授看来,如何通过利用数据科学的工具,从数据处理、分析预测,再到可视化,一步一步赋能产业,解决具体问题、满足实际需求,更是数据科学发挥作用的地方。

说回到自己的研究领域——人工智能,陶教授认为,高质量的数据是人工智能的基础,数据质量与完备性直接影响到人工智能解决问题的能力与效果。

从中国科大语音实验室里学习语音合成、信息处理中心(IPC)里学习图像检索的青涩少年,到香港中文大学多媒体实验室里做相关反馈的研究生,再到英国伦敦大学研究机器学习算法的博士,以及后来在香港理工大学、南洋理工大学、悉尼科技大学和悉尼大学传道授业解惑,陶大程这20年,与人工智能技术为伴,一路走来,方向从未改变。

想要研究人工智能,除了业耕于勤之外,更重要的是对研究目标进行深度认知与理解,有时候可能还要上升到哲学角度,需要更高维度的思考。

未来的AI技术是一场大融合

1956年,“人工智能”一词在美国达特茅斯的一场小型学术研讨会上被提出,直至今日,人工智能的历史走过的63年,历经了三起两落,而当下的人工智能正处于第三次浪潮之中。

今天的互联网充斥着对于人工智能的“赞歌”,部分媒体的报道将人工智能长期的担忧变成了人们短期的焦虑。资本市场更是“火上浇油”,让人工智能的热浪席卷全球。

人工智能虽然成为了从科技界到金融圈,再到街头巷尾的热门话题,但大部分人对于人工智能的理解并不够真实。一方面,大家在看完各种人工智能战胜人类的新闻后,惊叹科技发展的速度,另一方面,担忧下一个被机器取代的会不会是自己。对此,陶大程教授给出了理性的看法。

陶教授认为, AI的第三次浪潮主要是因为现代社会对于人工智能诉求非常大,应用场景非常多,所以带来了很高的期望,叠加产业的投入、政府的支持等因素,人工智能的发展被加速了。

相对于人类感知(Perceiving)、学习(Learning)、推理(Reasoning)、行为(Behaving)的能力,现在的人工智能差得还有些远。“很悲观的讲,目前来说,很难找到一个算法能够在普适条件下全面超越人的水平。”陶教授说。

但在一些垂直、具象的任务中,机器超越了人类。其中最典型的就是AlphaGo击败了韩国天才围棋选手李世石,著名计算机视觉挑战赛Image Net上,冠军队伍使用机器对指定目标的识别准确率超越了人类。

在棋类游戏,以及特定环境下的电子竞技、图像识别等方面,人类都输给了机器,但这并不代表机器拥有了人类的智能,只是解决特定问题的能力超过了人类罢了。陶教授解释说:“目前所说的机器智能,实际上与人类的智能不是一回事儿。目前机器只能在训练和测试数据满足独立同分布的假设条件下才能很好的工作,而人类却不同,因为我们有很强的泛化能力。尽管迁移学习在一定程度上缓解了非独立同分布的问题,但是还有很大的空间需要研究人员去进一步提升。”

与大部分数据科学50人受访专家的观点相似,陶教授认为,当下的人工智能是一种赋能行业、辅助人类解决问题的工具。当问题能够被很清楚地定义出来时,我们就有相当的机会设计出达到甚至超过人类水平的人工智能算法,来解决实际问题,更好地赋能行业。

在过去几轮人工智能的浪潮中,以知识图谱为代表的符号学派支配了人工智能的首次崛起。90年代开始,贝叶斯网络、进化算法、支持向量机等AI技术与方法拔地而起,2006年多伦多大学Geoffrey Hinton教授等人推出深度学习,将深度神经网络技术为代表的联结派推向了AI江湖盟主的宝座上。但十几年过去,无论是学界还是业界,都传来对人工智能未来发展的担忧之声——未来的AI江湖会由哪个门派掌舵呢?

陶教授最近读了一本名为《疑问之书》(The book of why: The new science of cause and effect)的书,是由图灵奖得主、贝叶斯网络之父Judea Pearl所著的因果推断知识读物。书中,作者解释了一个反映认知能力的三层模型(关联、干预、反事实),并系统地介绍了三层模型对因果推论的重要性。在某种程度上,这本书也在触发人工智能学者对于未来AI技术的思索。

对于未来,陶教授表示,人工智能的各个学科之间的发展是循序渐进的,有冷有热。陶教授以现在最受关注的深度学习为例,解释道:“深度学习对于获取基本信息来说,是非常有效的,比如从图像中检测特定物体。”但在他眼中,未来会是各类技术,包括因果推理、逻辑推理、专家网络、神经算法等的有机结合,如此更加有效地通过集成式的人工智能技术,减少我们对于数据的直接依赖性。

陶教授举例说,如果有两张图,第一张图有一千个人在拍集体照,第二张图有几百个人在看足球比赛,那么对于人类来说,看了两张图之后,可能第一时间没法知道两张图片上有多少人,但一眼就能看出来这两张图的区别,第一张的语义分析(Semantic Information)是“拍集体照”,第二张是“看足球比赛”。

而计算机可以快速检测出多少人、他们穿什么颜色的衣服,但是要分析出来照片的语义层面的区别,就需要耗费很大的力气(大量数据集与算力)。在深度神经网络中,我们让计算机学习大量拍集体照和比赛的照片,训练出区分两种类型照片的能力,但如果我们可以用推理的方法来完成,就不需要收集特定的大数据了。

在澳洲做研究

澳大利亚是发达国家,并且地广人稀,这给她得天独厚的条件发展人工智能,并且这个2400万人口的国家已经成为很多先进无人技术的试验田。

“骑在矿车上的国家”——澳大利亚,最具代表性的AI项目就属悉尼大学与Rio Tinto(全球矿业巨头力拓集团)合作的无人矿场。早在2003年,澳大利亚就由悉尼大学牵头成立国家重点实验室(ARC Centre of Excellence for Autonomous Systems),专门研究无人自主系统,希望此类技术能够解决澳洲地广人稀所带来的问题。如今,这个国家重点实验室已经进一步发展成为澳大利亚野外机器人中心(Australian Centre for Field Robotics)。

“澳大利亚科研体系非常开放,研究人员来自于全世界各地。”陶教授介绍到。

不到40岁,陶大程教授被授予澳大利亚国家级科研奖项——尤里卡(Eureka)奖。不惑之年的他还在2018年当选澳大利亚科学院院士,也是当年唯一入选的华人科学家。

顶着学术光芒的华人科学家陶大程,继续着他的人工智能的研究与实践。

学界的一大痛点在于数据的缺失,于是包括纽约大学的Yann LeCun,斯坦福大学的李飞飞、吴恩达等人工智能领域的著名与专家学者纷纷加入诸如Facebook、谷歌等互联网科技巨头,让自己的基础研究能力与数据资源有机结合。

2016年,陶大程教授开始接触工业界,加入人工智能与服务机器人企业优必选,担任人工智能首席科学家一职,主导研发先进的、具备核心技术竞争力的计算机视觉技术,并希望这些技术能够赋予机器人环境感知及认知的能力。

优必选还与悉尼大学合作,建立了优必选悉尼大学人工智能研究中心,由陶大程教授担任创始主任。2018年,研究中心提出了基于演化算法的GAN(对抗神经网络)框架Evolutionary GAN (E-GAN),提升GAN训练的稳定性、减小模型塌缩问题,并期望得到更好的生成效果。该工作入选《麻省理工科技评论》(MIT Technology Review)Physics arXiv的最佳论文(The Best of the Physics arXiv)。

在谈到中国人工智能的发展时,陶大程教授表示很看好,“从学术会议、比赛等情况来看,中国和海外科研进展几乎是无延迟的,发展速度基本同步,在工业应用层面中国的进展也非常迅速。”随着未来5G技术以及物联网的发展,数据红利会进一步迸发,人工智能的发展前景会更好。

正如大量海外华人科学家一样,陶大程明白全球化的浪潮下,每个国家都有自身的优势。海外发达国家滋生了人工智能技术的基础研究能力,中国庞大的市场与海量数据酝酿了人工智能的最佳实践场。在这场人工智能的浪潮中,坚守科研的学者们正在推波助澜。

陶大程坦言,自己除了在学校的科研工作外,没太多时间,想要平衡好学界与工业界的双重角色也并不轻松。他身在这波巨浪之中,扮演着不一样的角色,也许更能理性看待一切,虽潮起潮落,唯大方向始终如一。

数据科学50人成员

陶大程教授,悉尼大学教授、优必选悉尼大学人工智能中心主任、优必选人工智能首席科学家。于2002年毕业于中国科学技术大学,2004年获得香港中文大学硕士学位,2007年获得英国伦敦大学博士学位,2012年入选国际模式识别学会(IAPR)会士,2013年入选国际光学工程学会(SPIE)会士,2014年11月当选电气与电子工程师学会(IEEE)会士,2015年获澳洲国家科学最高荣誉奖项-(Eureka)尤里卡奖,2016年当选欧洲科学院外籍院士),2018年当选澳大利亚科学院院士。陶大程的研究涉及机器学习、机器视觉、数据挖掘、图像与多媒体信息处理、视频监控等领域,并领导开发了一系列表征学习(Representation Learning)的算法,取得丰硕的研究成果,对该领域做出显著的贡献。

关于数据科学50人

“数据科学50人”项目是由第一财经旗下DT财经发起的中国顶尖数据科学从业者的系列专访与社群组织,从数据科学领域选出最具代表性的50位先锋进行深度专访,50人由DT财经独立评审并发布。

本文作者:吴昊

陶教授