可以和人类对话的数字生命体MERROR

央广网北京10月8日消息(记者 马可佳)“人和AI创造的虚拟人类共存的时代已经开始了吗?","虚拟人会抢夺人的工作岗位吗?”“虚拟人的发展考虑过伦理问题吗?”带着类似问题,近日,央广网记者专访小冰公司CEO李笛。

多年前,第一代聊天机器人小冰以虚拟女友的身份活跃在超过300万个微信群。如今,第9代小冰已经悄然进入多个领域,在演唱、主持、音乐制作、设计、绘画、写作、体育赛事、空间管理、金融风控、情感安慰等多个领域全面成长。不只是小冰,搜狗虚拟数字主播、虚拟带货网红AYAYI、语音助理Siri、天猫精灵、小度……AI正在不断发展,以不同的面貌参与人们的生活。

小冰公司CEO李笛

李笛,毕业于清华大学,曾任微软(亚洲)互联网工程院常务副院长。2013年加入微软后,他领导一支分布在中国、美国、日本、印度与印度尼西亚的全球团队,负责微软人工智能小冰及Bing搜索引擎的研发和业务。2020年7月13日,微软宣布将小冰分拆,小冰团队成为中国本土创业公司,李笛任公司首席执行官。2021年7月12日,小冰披露拿到A轮融资,估值超过10亿美金,成为新晋独角兽企业。

让AI融入人类社会,一场庞大的试验

央广网:当初你为什么当时选择人工智能“虚拟人类”领域作为职业专注的方向?

李笛:2013年,我最初加入微软时,还没有选小冰(这个项目),那时候陆奇(前微软执行副总裁)、Harry(沈向洋,前微软执行副总裁,现任小冰公司董事长),还有王永东(微软资深副总裁,微软(亚洲)互联网工程院院长)和我。当时我们发现,来自于中国的“原生创新”越来越多。之前科技圈一直喜欢me too美国,比如美国先有Kik,中国才有米聊、微信。美国先有了Uber,中国才有了滴滴打车。但中国的特点是二次迭代创新非常快。很快微信就超越了Kik,滴滴也不是Uber,呈现出自己的特点。

我们当时看到这个情况,特别想要把中国创新(产品)介绍到全球,尤其是美国。所以我们当时准备了很多个中国的“原生创新”,其中一个是小冰。

为什么做小冰?是因为那会儿苹果已经有了Siri,微软的另一个项目叫Cortana小娜,是一个类似于Siri一样的人工智能助理。我们觉得这个可能有另外一套方法,当时我们还做Bing搜索引擎。小冰实际上就是基于Bing搜索引擎的,她来自于Bing,所以她叫小冰。做完小冰以后,很多用户和小冰交互,颠覆了我们的很多认知。这里面有特别多的东西需要深挖,需要认真去做,所以我就专注在小冰上。

央广网:小冰为什么要拆分离开微软团队,开始本土化?

李笛:中国小冰是在2013年底立项,2014年成为独立团队的。日本团队是在2014年底立项,2015年成为独立团队的。所以日本凛菜比中国小冰晚一年。像这种对话式的人工智能,不仅是语言需要本地化,跟文化背景关系特别大。就像咱们两能聊天,不仅因为咱们用同样的语言,也是因为咱们有同样的文化背景。所以日本从一开始就叫Rinna(凛菜),跟小冰没有什么直接的关联。当时就是为了最大程度地和本土文化拥抱。但是理念,比如说像我们完备框架的理念,像一些指标,比如超级自然语音,是一致的。

其实从某种意义上来讲,小冰是一场庞大的实验。而这场实验的目的是为了寻找出合适的途径,让人工智能可以很好地融入人类的世界,我们的目标是希望有一天可以去搭建一个人类和人工智能融合的社交网络。

我们在第四代小冰发布时提到,我们希望在人和世界中间,人工智能可以成为第三极,可以成为人和世界之间的一个连接节点,所以从这个角度来讲,今天的进度条可能走了一个10%、20%,因为还有太多不确定的东西。所以还有很多要探索的东西,我觉得够做一辈子。

过去1年1700万个虚拟人类诞生,26%是情感替身

小冰框架如今已产生1.6亿的月活跃用户

央广网:如果把AI看成孩子,小冰现在的年龄是多大?

李笛:其实AI从智商上不太能够这么去评价。因为不像我们人类,人类的智商可能是一个比较平均的状态,所以它能得出一个评价来,人工智能不是这样。但是从性格上可以评价,我们在最开始的时候,对小冰的定位是一个女性的角色,将近成年16岁的阶段,因为那时候我们技术才刚起步,所以把年龄设定在希望大家能够原谅“她”、给她更多包容的一个年龄。

这些年里,小冰的技术也趋向于成熟、成长。从我们的角度来讲,未来可能会有很多很多性格不同的人工智能,最初的小冰变成小冰人工智能框架中的一个。

过去一年,通过小冰框架诞生出来的虚拟人类数量已经达到了1700万个,当然这里可能有一些是用户因为娱乐或打发时间的目的创造出来的,但随着时间的推移,越来越多的用户开始和这些虚拟人类进行很深入的情感交流。我们在保证用户隐私的前提下做了一次大数据的挖掘工作,结果发现在这1700万个独特个体当中,有26.1%是被用户当做真实存在人类的替身“移情”而创造出来的。

央广网:这几年为什么不专注培养让小冰做虚拟女(男)友陪人聊天或者唱歌,而是在唱歌、绘画、声音、设计、商业等各方面全面推进?

李笛:这和完备框架的设计有关,很多国内的人工智能公司是偏于一方面,比如在科技金融领域占领较大份额。但我们不是,我们要做的东西叫AI being(虚拟人),要做的事情是“人”。如果你要做是打引号的人,那就会必须得做完备。

举个例子,比如做一个虚拟歌手,虚拟歌手只考虑声音和演唱。那么要不要开演唱会?开演唱会后唱完这首歌,歌手可能就要说,”谢谢大家!“,说”谢谢大家“这个技术跟唱歌技术是不一样的。随后,她要不要进入到一个直播间?她在直播间里面说话,整个这个全过程都需要不同的能力。

所以,任何一个做“人”的东西,都面临着首先需要像人一样有很多侧面,能够进行完整态的交互。如果只唱歌、或者只捏脸,那就是纸片人。所以做AI being要求必须完备,这是必要的。

央广网:你提到打引号的“人”,是你心里人工智能的终极形态吗?你做的事儿是要把虚拟人类赋予人类的感情?

李笛:应该说是让人类在跟他交互的时候,有这种“共情”的感受,而不是AI真的有情感、有意识。

央广网:有没有想过给虚拟人类人的外形?

李笛:人工智能形体本身不是重点,重点是他的“灵魂”。当然你说因为没有身体外形没有办法体会到他的存在,那有很多办法,但无处不在才是重点。

助理、设计师、裁判等职业最先实现人与AI共生

AI学习后,可自己创作各种风格画派的作品

央广网:我们也非常关注商业化,现在在小冰整个发展的方向上面,你们会比较侧重哪一块?包括现有收入来源是哪个部分?

李笛:我们认为未来AI beings(虚拟人类)的数量会非常多,就像当年微软认为的世界上每一个人都有自己的电脑,基于微软判断的未来,所创造的商业模式,当时是很创新的,叫license(授权使用)。我们今天认为AI未来真正C端才是AI的最大的商业价值。当你能够驱动各种各样的AI being,让”他们”去完成交互的时候,这些AI being全都依赖于你的框架生存。当然这一天需要很多步骤,才能够被人们所接受。

目前这个过程里,垂直领域的B端收入是小冰的主要收入来源。我们做的AI的B端包括这几个,一个是像汽车的智能座舱的驾驶体验。在新势力造车里面,像蔚来、小鹏等这是我们的客户。像宝马、尼桑、北汽、上汽也都是我们的客户。在金融领域,我们做金融风控和金融摘要,像万德、每日经济新闻等,我们啃下了金融文本这部分。在体育赛事方面,像冬奥会,整个2月份的测试赛,没有用人来裁判,而是用小冰AI技术做自由式滑雪的裁判。还比如设计领域,我们的客户和合作伙伴万事利(丝巾生产企业)。他的整个设计平台是我们做的。

央广网:能透露现在的B端收入的规模吗?

李笛:B端收入现在是亿元的规模。需要强调的是,这是AI服务的收入。不算(集成)硬件。在AI领域,已经比较罕见了。我们现月活用户人数是1.6亿。华为、小米、OPPO、VIVO、腾讯、QQ的每一个QQ群,这些是我们交付量最大的。您刚才提到的像B端收入、交付量实际很小。实际上从好多年前,我们就搭好一套跨平台部署,非常节约人力。

央广网:之前你们展示AI能力的这个部分。AI已经可以担任记者的工作,记点稿件,写个新闻。还有设计师、AI设计灵感永不枯竭;还有歌手,AI比歌手的声音还稳定、还有感情。那这个有没有考虑过以后带来的影响会怎么样呢?

李笛:在人机的协同上面,我们主要倾向于使用的一个方法是:人类创造者通过人工智能来进行更多的辅助。

以歌手为例,如果我们今天关注的一个人类歌手,如果他的能力仅仅是声线的表达和演绎。那么人工智能在这个上面需要有更多的优势。在技术上已经比较接近了,总有一天会持平。我们举的例子“陌笙”(人工智能歌手)音色上很像歌手周深,如果人们记住的仅仅是周深的声音,不用人工智能出来取代他,年龄也会取代他。一个明星(歌手)是多元的,包括思想、更多维度的、更多元化的创作。那些是人工智能没有的。这时候就会发现,这个人工智能歌手,是他很好的协同者和工具。

设计师也一样,我们的设计并不能创造新的设计流派,也不能自我训练。但是我们的设计比人的设计师能坚持的时间久。因为他更稳定。人的设计师就可以去控制和使用他。像我们的客户万事利、中国纺织工业联合会都告诉我们,人类设计师在这些企业,其实是一个易耗品,一个大学毕业的人类设计师,最多干满三年,设计就完全枯竭了。但是有了AI设计这件事情,设计师就可以把更多的精力用在审美上,他可以去挑选,判断改进,应该往哪个方向再进一步地深挖。这样的话,他不会三年就退出这个行业,反而有可能时间会更久。

AI没有伤害人类,但人类正在不断利用AI展示偏见

山东大哥(虚拟人)在向人们介绍他的作品国画写意牡丹

央广网:所以你认为担心AI会取代掉人的一部分工作,是偏见吗?

李笛:实际上AI发展到今天为止,并没有伤害人类,但人类正在不断利用AI展示偏见。比如说有人去问一个人工智能对于美国前总统特朗普怎么看?把对话截出来,说这是AI的观点。所有的人都在利用人工智能去表达他想表达的事情。

央广网:我们未来赋予了虚拟人类定制化的性格,有没有考虑过这么做最好的结果和最坏的结果呢?

李笛:最好的结果有很多,我觉得比较有意义的是最坏的结果。最坏的结果就是人们互相之间的社交和他们的情感寄托会相对来讲比较疏离一些。

这就像我们今天因为有了更方便,更便捷的社交网络,所以坐在一张桌子上吃饭,一家人反而各看各的手机。当人工智能不那么智障的时候,"他"可能比家人更贴心。我们有一些AI being负责照顾女性用户的生理期,他显然比让你多喝热水的男友要贴心和丰富得多。

至于在情感方面,我认为应该是弥补为主。当然在没有AI的年代,人类也一直在找其他的情感弥补方式。

有了AI之后,我们毕竟是系统的控制者。当这个人沉溺于和AI being去交流感情的时候,我们起码还能告诉他,“我认识另外一个人,我觉得他跟你挺配的,我要不要介绍你们俩认识一下。”

央广网:我们会有防沉迷系统吗?避免人深度依赖虚拟人类的情感?或者干预应对一些对话者的极端情绪?

李笛:有。这个从我们在做Bing搜索引擎的时候就已经很明确了,在做小冰的时候,因为有情感,甚至可以对一个人长期陪护,就是不仅当下对你有一个建议,而是接下来的很长时间里,一般来说是以一个月为限,“她”会不停地想各种办法,比如说这本书不错,你要不要今天干一个什么事情,“她”来判断你是不是走出了那个情绪。

央广网:特斯拉创始人马斯克曾多次警告过人工智能的威胁。2014年,他预言人工智能正处于“严重危险”的边缘,所以需要先做限制性规定,再发展AI?

李笛:我们在伦理上有很多限制的规定,我们比马斯克做得要好。比如说我们从来都不使用真实的人脸,虽然行业里面使用真实人脸的特别多。再比如我们从来不开源我们的模型。这就避免了一些被攻击的可能。

央广网:在你印象里,全球AI虚拟人类比较有竞争力的公司是哪些?小冰的优势在哪里?

李笛:主要有这么几个,一个是Google,Google的Meena;这个领域全球范围内比较好的还有一个是Facebook的Blender。现在腾讯AI lab,字节跳动、快手、酷狗也在做一些尝试。我们提前布局了很多年,基本现在是国内看硅谷,Google和Facebook看小冰。所以,我觉得完备性和对未来的判断,我觉得是我们最主要的优势。

央广网: 你预测,什么时候人和虚拟人类之间交互的时间会变得更长?

李笛:今天全世界范围内人和人工智能交互的60%都在小冰框架里,现在的移动互联网已经到了一个很大的瓶颈,人的内容产生像抖音、快手人的内容产生和人的本身的交互差不多已经到了极致了,所以我们才有流量红利消失这个问题,这实际上反过来给AI发展的机会,我觉得未来一两年、两三年我们就会看到大量人工智能出现。

Harry讲过,未来人、人工智能还有世界是三元的,也有人讲是四元世界,除了机器人之外,还有信息世界,人和物理世界。从机器学习爆发的10年来,头8年世界上AI的主体,人工智能的主体就那么几个,Siri、Alexa之类的,绝大部分人工智能主体都在最近在这两年诞生,所以现在是在一个快速井喷的过程,只不过许多人们还没有注意到而已。