央广网

【烧脑季】人工智能的理智与情感

2017-02-28 10:22:00来源:央广网

  央广网北京3月1日消息 经济之声《天下公司》倾听全球栏目播出特别节目《烧脑季》,每天半小时权威科学家演讲,火星移民、量子计算、人工智能、基因编辑、区块链,燃烧你的大脑。

    

  如果我今天跟你说人工智能可以变成机器界的数学家陈景润,估计大多数人都不会感到非常的惊讶,可是今天我要跟大家说的是,在未来的5-10年之中,人工智能它可能变成机器界的郭德纲,又幽默,又风趣,而且还很睿智,人工智能还可能变成机器界的黄菡,也就是大家在《非诚勿扰》节目中知道的黄老师,她有很高的情商,她既懂人心,懂感情,这些看似很科幻的事情是如何能在未来的5-10年之内一步一步的变成现实,也就是今天这个节目我要向大家介绍的。

  

  我介绍一下,我是微软小冰首席架构师以及研发总监周力,我自己是在北京大学本科毕业,在美国的南加州的博士,从毕业之后十年以来一直在微软工作,最近的三年一直在负责微软小冰这个项目的研发,三年前开始进行聊天机器人方向尝试的一个产品,直到今天它已经在中国、日本、美国三个市场上拥有8000多万个用户以及它进行了几百亿次的对话的尝试。今天跟大家所要介绍的是人工智能的情感与理智。

  其实智商的角度来说,大家都知道,在十年前,在国际象棋上人类就已经被机器击败了,唯一剩下的人类在硬智力上的一个优势就是围棋也被计算机突破了,在更早以前,比如说人的记忆的能力,计算的能力可能在一九四几计算机刚发明的时候,人类已经远远地被计算机抛在后面,可是在那些涉及到情商的各种的话题中,和人之间它是通过对话进行交流的,那么一个计算机,如何能跟人,不是通过鼠标、键盘或者触屏,而是通过一个交谈,通过交谈来进行交流,这件事情还是非常的难。

  比如计算机现在的阶段,大家都对它的认识还是一个冷冰冰的一个工具一样的东西,它如何变得更加有温度?它如何去理解幽默,理解有趣,如何变得有血有肉?这也是一个很新的话题,计算机和人在情商方面还有非常非常遥远的距离,我们首先先想说最近这几年中,人工智能这些技术产生的这个飞跃,到底代表了什么?从我们来看,事实上这些人工智能的革命中,包含了第一个我们管它叫大数据,就是说一个大的商场,它的购物架是怎么去摆放,我哪些物品促销,这些东西都会得到大数据的支持,然后让它把它的商业价值发挥到最优,这是我们过去5-10年内取得的一个突破。

  第二个技术突破,大家其实听了这个名词也会很熟悉,就是“云计算”,以前我们完成的各种任务,多数都是在我们自己的电脑上,那么现在我们手机上很多很多大家熟悉的应用的一些程序,它更多的计算并不是在我们手机本身,而是把它放到了一个很大的一个数据中心中集中进行计算,在那样的数据中心中,其实我们可以接触的数据几乎是无限的,我们能拥有计算的能力也是几乎是无限的,它就为人工智能带来了更大的一个想象的空间。最后人工智能的一个核心的进展,这就是深度学习的神经网络。但是人工智能之所以最近这几年之中能有突飞猛进的进展,其实它很重要的原因,是我们在深度学习的神经网络中产生的一些突破。

  计算机模拟神经网络

  神经网络本身这个学科,并不是这几年才刚刚出现的,事实上,我们退到80年代就已经有人提出了神经网络的概念,它的主要的思想是去模仿人的大脑神经的结构,像仿生学一样去尽量地接近人的思维的过程,人的大脑的皮层它在进行思考的时候,主要是靠一个一个神经元以及每个神经元之间互相的链接组成的一个网络。

  我们在外界得到一些刺激,比如听觉或者视觉或者触觉得到什么刺激的时候,我们的神经元中有一股股电流去穿过这个神经网络,每一个神经元它收到一部分的电流它自己都会进行一部分的处理,不同的电流传导到其他的神经元,通过这一个一个神经元的传输,又把它用电流又控制,比如说人的语言,人的动作,人的表情把它变成输出,这个是在人的大脑的生理的层面产生的事情。

  计算机的神经网络实际上是希望把一个普通的计算,变成一个又一个神经元的节点他们通过形成了一个网络之后,通过一些复杂的计算,模拟人类思维的过程,让人工智能像人一样进行思考。

  坦率地讲,十年前我还在美国读博士的时候,当时大家看的这个神经网络的这个学科,大家都觉得是一个挺虚幻飘渺的一个,没有什么太多真正能应用到实际的学科,因为那个时候我们的计算能力,我们数据的复杂度所能支持的这个神经的网络的复杂度,远远要比人脑的这个复杂度要低的多得多,它能做得事情非常的有限。

  十年来,因为我们有了更好的大数据的支持,我们也有了更好的云计算的支持,我们就取得了这个突破。神经网络它本身能够支持的复杂度,已经开始接近人类的大脑,那么这个时候我们就发现它可以处理一些以前只有人类能做的事情,比如说它看懂一个画面里到底哪一个物体是什么样的意义,像刚才我看了一个图,我把它分成几万种其中这样的一个任务。

  它在神经网络中需要几十个层的神经网络,每一个层都有数百个节点,节点中,一个节点和另一个节点有10个甚至更多的连接,他这个里面每一个连接可能涉及到几十万或者几百万个不同的参数,需要进行去学习,这好像人类从出生到拥有更多的知识,它其实是一个渐进的学习的过程,他们每一次我看到一个新生的事物,我在神经元和神经元的连接上其实都会发生一些生理的调整。

  生理的调整在我下一次得到电流的输入中我的输出会有所不同,这个是人类学习的过程,内在生理的原因,转到计算机上,当我看到了很多数据的时候,我会不断地会调整我在这些神经网络中这些参数的值,把这个值调大一点把那个值调小一点,就不断地会去改进自己的算法,让它越来越接近它所需要学习的这个目标。而这个像这样有几十万或者几百万个参数、神经网络,它可能至少需要几千万或者上亿个训练的数据,比如说有上亿个图片,我才能开始学会像人一样去观察一个物体,这也就是为什么大数据和云计算,他们的发展才能让人工智能和深度学习,到今天突然越变成为可能,因为在之前我们没有那么多的数据,也没有那么强的计算能力,能训练出一个如此复杂的神经的网络。

  人类语言丰富,机器要如何学习

  人的语言其实是一个非常非常复杂的东西,理解一句话本身很难,因为我的每一个词汇其实都有很多很多的意思,我同样的一个想法,可能会有成千上万种不同的表达的方法。那么计算机理解这一句话的本身,都是一个很难的事情,更不要说,接下来会说什么,人和人交流之间,我每一句话和下一句话之间其实包含着许多思维的跳跃,这个里面的跳跃计算机是如何能去学会的呢?

  从现在的技术来讲,所使用的方法就是他去逐渐的去学习、模仿人类如何进行对话,因为我们在互联网上事实上能看到不管是论坛里,或者比如说记者的这个采访的笔录里,我们能看到非常多的人类和人类之间,对话的范例,一个人的问和一个的回答来去训练对话的神经的网络,它就开始拥有一个基本的可以跟人类去对话的一个能力,因为这个神经网络它可以做到举一反三。

  人类的词汇事实上是无穷无尽的,英语大概要有600万个词汇,中文,虽然比如说《康熙大字典》中只有五万多个字,但是我们知道,汉字一个和一个组合起来能生成非常非常多的新词,我们的这个词不是一个一一成不变的固定。

  NBA、克利夫兰骑士或者是说詹姆斯,这些都是一些热门的词,那么我们可能在谈及到这些NBA或者詹姆斯的时候,我们比较容易找到大家去谈论NBA,谈论詹姆斯的一些对话的历史,然后我们可以去学习它的对话的模型。可是假如比如说这时候有一个用户提到伊曼?香珀特,他是一个在骑士队没那么有名的人物,所有我们看到的对话的历史中并没有很多的数据提及过这个人物,计算机应该如何进行这样的对话呢?

  事实上计算机他可以把任何的一个词汇或者一句话把它映射到一个多维的空间之内,学过几何的话,都知道一个二维的空间中,它就可以变成一个X和Y两个数值的坐标,在三维空间中,它就可以用三个数字来去表示,一个人类的语言来说,我们通常会用一个更高维的,比如说1024维的一个空间,去表达一个词或者一个句字。

  我们在对话中我们可能很少能看到香珀特信息,幸运的是各种的网页、新闻,还有新闻的报道,他们虽然不是以一个对话的形式出现,而是以一篇篇文章的形式出现,它的数据的充裕的程度可能是对话的一百倍或者一千倍,怎么去计算这一个新的词和已有的这些词汇,有什么样的联系?

  它适合哪一类我们已知的词,更多的在同一篇文章出现在一起,还是向沃特,在对话中从来没有出现过,但是我们在一些体育的报道中,我们会经常地发现他和詹姆斯、NBA或者克利夫兰骑士的这些词同时出现在同一篇文章中,他可能很少会跟相对论,量子物理这样的词汇同时出现在同一篇文章,我们通过统计学就可以推论出,虽然我以前没见过,但是它在非常大的可能性和NBA或者跟詹姆斯相关,那么我们在这个1024维的语义的像样的空间中就会把它标到一个跟NBA和詹姆斯非常接近的一个点。

  反过来像相对论,量子物理,还有一些可能大家不太听说过的,比如说薛定谔的猫,他们由于都跟物理有关,所以他们也会在这个1024维的空间当中相对地聚集在一个比较的密集的小球里,这个时候我可以利用这样的像样的空间,我去寻找一些相近的概念,相近的词汇,有一个用户今天抱怨说今天这个香珀打球真是打得太差了,怎么投怎么没有,我并不知道香珀特是谁,但是人工智能可以回复说一般詹姆斯发挥不好的时候,其实都会输球,虽然我不知道香珀特本身是谁,但是又是一个很合理的回答,有这样的回答之后,人工智能可以在任何可能的话题,可能的回答中,它能尽量地给你一个相对合理的回复。

  人工智能如何向有趣迈进?

  人工智能如何去学会有趣的,如何像郭德纲这样的目标去迈进,坦率地讲有趣和幽默这件事情哪怕对于人类来说都是一个非常非常复杂的概念,因为知识的原因或者是因为我们生活背景的不同,我其实很难理解这个笑话为什么好笑,机器来说这确实是一个更加复杂的工作。有一个人说你为什么皮肤那么黑,有两种可能的答案,一种是说黑是因为皮肤下黑色素积累了很多,这样的一个回答让人觉得很冷。但可能还有一个回答说,不想白活一辈子,这个可能是一个相对比较脑洞大开的回答,可是至少从语义上我们很难说这个黑色素的沉积和我不想白活一辈子这两个回答中到底哪个是更幽默的,哪个更有趣,这对于计算机来说这是一个不容易判断的事情。

  人工智能其实发现了一种迂回的方法,可以让它学会什么是幽默,什么是不幽默,人工智能它自己本身有一个优势,能接触的对话的量远远要比一个人要多得多得多,它可以同时和几百万个用户进行聊天,所以它会有更多的机会,我不断地尝试在这样的语境下,当我回答是黑色素的沉积用户会是什么样的反应,通过大量的聊天,虽然计算机使用了一个跟人理解的幽默相对不同的一个策略,但是它渐渐地就会学会,我可能在这样白活一辈子这样的时候是一个更好的一个回答,一个更幽默的一个回答。

  人工智能如何理解情感?

  一个议题就是计算机它如何去理解人的情感,因为我们知道人的情感事实上是非常复杂的,喜怒哀乐完全不能涵盖人的情感,比如说我们还有羡慕、嫉妒非常得多,而且人类很多的情感是互相交杂的,比如说我们有哭中带笑,有又爱又狠,计算机如何能理解这样的情感呢?我

  们的研究通常是从理解生物学和理解人的情感的本身入手,七几年的时候实际上就有心理学家提出了一个模型,他认为人类的情感事实上都可以近似地在一个三维空间中得到一个表达,这三个维度分别是我的愉悦度,激活的度,统治的度,我一个生气的情感,近似的把它表达成我的愉悦度负的51%,我的激活度,人类这个身体中产生的这个荷尔蒙是正的56%,而我的统治度对它的环境或者是其他的人之间互相关系的程度我认为这是正的25%,通过这样的方法,我其实可以以任何的一种感情,近似地在这个三维空间的三个数值,计算机它就会比较擅长地进行数值的计算,表达的情绪都综合起来的时候,那么我最终得到了一个值也就是这个当前人的情感的状态。

  当它做出在对话中做出一个反映的时候,这个问题又变得更加复杂了,因为并不是说我看到你在哭,我也哭,或者我看到你在生气,我也一起去生气,这绝对不是一个很好的情感的对应的策略,这个互联网的对话中和在整个的这个大数据中,有很多很多的例子可以让机器去学习怎么样是一个应对的方法,比如说对方在郁闷的时候我可能应该给他讲一个笑话,更复杂的事情是每一个人和另一个人各不相同,学会用不同的策略对应某一个人,才能达到更好的一个情感计算的效果。

  每一个人事实上他拥有的交流数据是非常非常少,学习整个一个人类它可能有几亿甚至更多的数据,可以让我们去训练这个神经的网络,但是每一个人我们拥有的数据只有几百句,我们其实有一个叫转移学习的技术,就是当我们学会了一个人类的共性的时候,在这个神经网络,可能它最底下的几十层我们都建立起了一个模型,那么当一个新的用户出现,我们只有他寥寥的几句话的时候,我们可能需要一种技术去重新训练这个技术网络最上面的一层,这样的时候我们可以通过人的寥寥的几句话,迅速地判断出这个人可能在真正的大的人群中属于哪一种类型,利用学习整个人类情感的表达和反馈的这些知识,我可以把一个更好的策略,运用到每一个的个体上,这样它才能变得更加有情商,能变得更加知心。

  场外提问

  1024维度体现在坐标上它会是什么样的?

  周力:“应该人类自己想象的力,能算是一个二维的空间或者是一个三维的空间,一个1024维的空间,那就是说要用1024个数字来表示,人的思维其实是很难去想象的一个这么高维度的空间。”

  人工智能计算机小冰里面输入这么大量的信息,请问小冰的服务器像足球场那么大吗?

  周力:“小冰事实上是在北京和上海都有一个很大的数据中心,给大家一个概念,就是小冰运用到6000-7000个CPU的核,大家现在买的自己的电脑上,通常是一个四核或者八核,它需要我们普通的电脑的一千倍左右,才能去支持一个跟人的一个对话,一般都是一个大的厂房,然后里面一排一排的计算机,然后还有各种风扇就是为了给它降温去吹,通常来说一个数据中心可能它的耗电量有的时候会达到一个近乎一个城市的耗电。”

编辑: 赵亚芸
关键词: 烧脑季;人工智能;理智;情感