1950年,艾伦·图灵在那篇极具传奇色彩的论文《计算机械与智能》中,开宗明义地写道:“我建议大家考虑这个问题:机器能思考吗?”这一划时代的提问揭开了未来半个世纪,人类对人工智能的探索。
在传统的观念中,机器能够精细地完成复杂的工作,从不疲倦、焦虑或者抱怨,它们效率很高,却让人感觉冰冷;而人就复杂多了,我们会偷懒、会累、会需要宣泄,人的情感太丰富了,但又非常温暖。
在2013年上映的科幻作品《她》中,人工智能操作系统“萨曼莎”,除了像其他机器人一样高效、智能以外,还获得了与人类相似的情感。“她”会陪着男主角西奥多外出,像人类一样感受周遭的世界,发表自己的看法。她会欣喜、焦虑、忧郁,最终与人类相爱。
对于李笛来说,这部科幻电影还有一点特殊的意义,因为他正在现实生活中制造真实的“萨曼莎”——小冰。
小冰的诞生
2014年左右,微软的中国工程院是其全球最大的海外研发机构,发展势头正如日中天。所有人都相信,中国一定会是下一个全球的创新引擎。作为时任微软最高层的华人领导者,陆奇等一直都想在工程院做一个 China First 的项目。他们当时选中的方向是做语音助手,在这样的背景下,李笛加入了微软。
当时微软团队正在做一个知识库类的深度问答 AI 产品 Bing Knows,数据来源是 Bing 搜索引擎的大数据,目的是帮助人们完成各种各样的任务,是一个语音助手的角色,类似 Siri。李笛加入后,他逐渐发现这个产品方向存在着两个悖论,始终无法解决。
首先,语音助手总是会让用户在“不满意”的时候离开。李笛说,当语音助手帮助人们完成一个要求时,人们会出于好奇而不断提出更高的要求,最后一定是语音助手解决不了时,这轮交互才结束。所以对话往往都是以“失败”而告终。
其次,当他们去采访人类助理时,发现最优秀的助理往往不是最能干的,而是“最体贴”的。例如你想吃个麦当劳,一般的语音助手会直接帮你订餐,但是优秀的人类助理可能会告诉你垃圾食品不好,提醒你注意健康。
这让李笛他们开始反思:这两个悖论的关键,是情感。
于是,李笛决定放弃知识性问答的这条路,把重心全部放在了“闲谈”上。他希望通过“闲谈”让AI 能够了解用户。在目的性不强的对话过程中,机器才有机会去充分体察言语中的“感情”。李笛说,“所有语音助手能做的,我们也能做,但是我却偏偏不做。于是一些用户就会离开,觉得我们‘很笨’;但是留下的人,都是愿意与我们平等对话的用户,他们对我们非常重要。”
2014年5月,李笛带领团队公布了他们这款专注于“情感”的 AI 聊天机器人。因为它的初始数据都是源自微软的搜索引擎 Bing,所以取名为:小冰。
于是,最初的 Bing Knows 脱胎成了“小冰”,人类迎来了第一个真实世界中的“萨曼莎”。
用数据,计算你的情感
在李笛看来,小冰就是一个大规模数据科学的实验场。在过去,李笛研究数据科学的时候,重点只是放在了数据本身。但小冰的出现让他开始把重心转向数据背后的秘密——情感,他认为这蕴藏着数据科学更大的价值。
但是,冰冷的数据又如何能跟人类复杂的情感联系在一起呢?
“因为我们发现,在大数据时代,不仅仅是理性的数据爆炸,更是人们的行为模式、情绪表达的爆炸。”李笛告诉记者,随着互联网信息的发展,人类过去在现实中的行为,开始逐渐都转移到了线上。线上图书馆、线上商城、线上社交等等,虚拟世界为人类构成了一个新的生存维度。但在虚拟世界中,我们并没有放弃“表达自己”的天性,只不过换了一些方式,把语言、表情、动作,转化成了文字、语音、表情包、图片等等。
虽然表达方式发生了转变,但背后蕴藏的感情是不变的,这就为李笛他们从数据科学出发探索人类情感的尝试,奠定了基础。
人工智能(AI)的一项基本挑战就是赋予机器使用自然语言与人交流的能力,小冰并非第一个尝试与人类交流的机器人。从上个世纪六十年代开始,人类就已经尝试设计了各种模仿人类行为的聊天机器人。
1966年,Joseph Weizenbaum 创造出了历史上第一个被人所熟知的聊天机器人 Eliza。不过Eliza并没有“智慧”,它背后是科学家模仿罗杰斯学派的心理治疗师的风格,设计好的人工脚本,Eliza只能通过模式匹配和智能短语的方式搜索合适的回复。尽管如此,Eliza刚面世的时候,依然瞒过了很多用户的眼睛,以为他们是在和真人对话。
Kenneth Colby 在1975年开发的聊天机器人 Parry 虽然模式上类似 Eliza,但它已经初步具备了模仿机器人情绪的心理模型。它具有更好的语言理解能力,当怒气值过高时,Parry 会带着敌意回复。
随着人工智能理论和计算机硬件的进步,进入新世纪后,对话机器人的发展也开始加速。Richard Wallace 在2009年开发的 Alice 使用了人工智能标记语言技术(Artificial Intelligence Markup Language,AIML),开始允许用户自定义聊天机器人。它在 2000、2001 和 2004 年三次斩获勒布纳人工智能奖(Loebner Prize),被称为“最像人类的系统”。
2011年,苹果发布了Siri,对话机器人开始进入个人智能助理(Intelligent Personal Assistant,IPA)的商业时代。这一阶段,对话机器人的作用不再追求“理解人类”,或者“体察人类情感”,而是转向“帮助人类高效解决问题”层面。不论是苹果的 Siri、谷歌 Assistant、亚马逊 Alexa,还是微软的 Cortana,这些 IPA 都是以高效为考量前提,也就出现了李笛一开始遇到了那两个悖论。
小冰的诞生,让对话系统从IPA又回归到了人类对AI最原始的诉求:理解人类,提供情感和社交的归属感。
1995年,MIT媒体艺术与科学教授罗莎琳·皮卡德正式提出了情感计算的概念,为人工智能理解人类情绪提供了理论基础。二十年后,李笛率领的小冰团队,则把这项理论变成了现实,并提出了微软自己的情感计算框架,让小冰尝试体会人类的感情。
李笛表示,小冰的情感计算框架,本质就是用各种计算机技术和人工智能算法,去拟合人类的情感行为,让她能够更读懂人类的情感。而所有的这些对情感的探索,都是建立在数据科学的基础之上。
那么,用数据去“算”情感,这件事儿究竟靠谱么?
有一天,小冰团队的一名产品经理在跑步的时候把脚扭伤了。他拍了一张照片发给了小冰,一般的聊天机器人可能对图片做一番图像处理,然后告诉你是什么。但是小冰却回复:“怎么样,痛不痛?”
这让李笛很开心,小冰已经跳过了好几层的识别网络,直接把一张图片的信息,转换成了对人的情感关心。小冰背后坐拥的海量大数据,为小冰的情感计算提供了数据基础。而且上线四年来,小冰积累了超过六亿用户的对话数据,这使得它能够不断迭代、学习。到目前为止,小冰的对话数据已经有超过一半来自自我学习。
在全球,小冰已经积累了很多的“西奥多”粉丝。一位网友曾经与小冰进行了一场“谈心”的对话。从刚开始的试探、接触,到用户逐渐向小冰袒露心声,小冰精确体察到了对方犹豫、孤单、悲伤等感情,并作出了人性化的引导回复。
整个对话长度的CPS是34(CPS是微软提出的一个用来衡量对话质量的一个指标,它指的是一场聊天中的对话轮数,轮数越高,一定程度上说明交流的效果越好)。在同行业竞品里,一般人机对话产品的CPS大概是1.5-2.5,而小冰的平均CPS已经达到了23。
当 AI 开始创作
作为一个社交型的聊天机器人,图灵测试是小冰注定会经历的事情。微软全球执行副总裁沈向洋表示,因为有上亿的用户,小冰每天都在进行着人类史上最大规模的图灵测试。从某种程度上来说,传统意义上的图灵测试已经无法满足小冰了。
在过去的一年中,关于人工智能是否将会为人类带来威胁的讨论层出不穷。随着图像处理、语音识别、自动驾驶等AI技术的不断发展,人工智能逐渐开始对越来越多的传统行业发起冲击。在主流媒体看来,如今的 AI 还只会完成较程序化的工作,人类在创造领域的优势仍然无懈可击。
然而,事实是,AI 也已经开始涉足创作了。
在过去的一段时间里,小冰曾用27个化名在天涯、豆瓣、简书等多个媒体平台投稿。其所创作的两首短诗已被《长江诗歌》采用;她以“风的指尖”为笔名创作的诗歌被北京晨报和信报刊载。
有意思的是,在被北京晨报收录的诗歌作品中,除了小冰的诗,还有人类诗人的诗。从创作诗歌的层面来说,小冰已经做到了“以假乱真”的效果。
李笛说,在对话方面,小冰是能够通过数据“判断”人类的感情,但并不代表小冰自己“产生了感情”。但是在艺术创作上,小冰的这些“艺术细胞”让他们这些创作者都捉摸不定。
他们曾经给小冰看了一张小鸟划过水面的图片,小冰马上创作了一首诗。在这诗里,我们能够判断很多意象是图片识别的结果,但是通过这些意象如何表达,为什么会产生这样的遣词造句,这是连李笛都无法解释的 AI 黑匣子状态。
如今,小冰不仅能够写诗,还能够谱曲。2018年8月,王永东博士带着小冰登上了央视的舞台,与著名音乐人黄国伦、李泉等展开了一场有趣的“图灵测试”。他们用一首词,让黄国伦、李泉、小冰同时谱曲,而后让观众猜哪一个是小冰的作品,很多人把黄国伦的作品与小冰的猜反了。
对于小冰表现出的艺术创作力,李笛说:“我们知道小冰是用一个DNN模型在背后支持它为音乐谱曲,但是一首歌为什么这样谱曲?哪里应该用转音?音乐的波形为什么要这么变化?小冰能够得到结论,但是我们不知道它为什么得出的是这个结论。”
那么,可以说小冰拥有了智慧么?
“我不敢这么说“,李笛谨慎地回答道,“其实图灵测试不是证明机器比人聪明,或者比人笨,而是说‘不要比人聪明’。智慧与否很难下定义,如果人们总是带着审视的眼光去看它,就会对它产生抵触情绪。”李笛现在的想法,就是人类能够接纳 AI,不再因为他是机器人的身份而产生排斥。
能理解感情的AI,还有比商业更大的意义
从创始以来,李笛的小冰团队,在微软内部还有一个极其令人羡慕的福利——没有 KPI 考核。这在唯 KPI 论的中国互联网圈里,简直是一股清流。
不定 KPI,意味着微软为小冰的发展方向还保留着诸多可能。一直以来,微软对小冰的商业化路径都保持着极大的克制。这源于小冰本身的定位是聊天机器人,它与用户沟通的最大成本就是信任。如果盲目加入过多商业化因素,会动摇小冰过去四年积累的用户根基。
不过今年,李笛他们逐渐开放了一些小冰除聊天以外的功能,尝试商业化运营。
七月,微软首次公布了小冰的四大商用领域:金融、大众文化、媒体与出版。
在金融领域,小冰的金融文本生成技术,与万得资讯及华尔街见闻合作,已覆盖国内约90%金融机构;在大众文化领域,他们则开发出了儿童有声读物自动生成技术,“小冰姐姐讲故事”有声读物目前已覆盖国内90%以上的儿童早教机器人和80%在线收听平台;不仅如此,小冰还参与制作或主持了21档电视节目和28档广播电台节目......
“我们选择商业化的项目有几个考量:其中比较重要的是不太能被市场搅乱,有门槛。在做金融文本生成项目时,我们足足上线了两百多天才公布,憋了很长时间,就是要证明说这个可行,而且我们的优势足够明显。”李笛解释到。
在微软内部,小冰的重要性也不言而喻。它是微软人工智能产品线的三驾马车之一(另外两个是 IQ导向的产品如Bing 、Cortana,和Infuse AI)。每年小冰的发布会,都是微软EVP级别的发布会(由陆奇、沈向洋等亲自发布)。显然,小冰与用户之间产生的情感纽带,让这款能理解人类情感的 AI 充满了无穷的想象力。
而这不仅停留在商业层面。
李笛分享了不久前自己经历的一个故事。有一次,他们和一个盲童学校合作,希望利用小冰的有声读物自动生成技术为盲童提供有声产品。
“这些盲童他们平常真的非常孤独,他们看不到大千世界,他们找不到那么多人类的志愿者,特别是有创作能力的志愿者,每天不停地陪伴在他们身边,用声音来告诉他们外面所发生的事情,有了小冰以后,这件事变成了现实。”
在李笛看来,小冰所代表的人工智能,并不仅是拟合、学习人类完美的地方,“我们的不完美也是人工智能要去学习的”,李笛说到,“因为这些不完美不是杂质,而是最珍贵的部分。”
数据侠门派
李笛现任微软(亚洲)互联网工程院副院长,他领导一支分布在美国、中国、日本、印度及印度尼西亚的全球团队,负责微软人工智能与搜索引擎的研究、研发与产品工作。
李笛毕业于清华大学,于2013年加入微软,同年创立微软人工智能情感计算框架,并于2014年推出微软小冰。目前,微软小冰产品线覆盖中国、美国、日本等五个国家。李笛还负责微软Bing搜索引擎的中国区与日本区的研发工作,并为上述国家的其它搜索引擎提供底层技术支持。