央广网

科技频道 > 精选专题 > 2016移动生活峰会 > 全新闻

央广网

阿里云初敏:数据将是语音识别最大挑战

2016-12-23 18:34:00 来源:央广网

  央广网科技12月22日消息 12月21日,环球网Global Tech智能起源世界大会在京召开。阿里云iDST技术总监初敏在大会期间接受媒体群访时表示,阿里云基本用两年的时间就做到别人十几年二十年积累的水平,并且目前肯定在TOP10水平里面。“这个行业非要说谁是第一,并没有意义,而是谁能把真正的场景做出来。”初敏说。

  初敏在现场示了阿里云的语音实时转化技术,她表示,这种语音的转写,最开始在公司内部年会上做,后来到云栖大会上做,未来,她更关心的是能否帮助合作伙伴在任何一个场景下都能完成,真正的使用起来。

  初敏坦言,像这种语音实时识别转化,如果从算法上讲,是做了一个双向神经网络结构,是一个序列的结构,所谓双向,从左往右看的同时还从右往左看,复杂度高,学术上有人做,没有在工业界上用,认为实时性不够好。

  “但我们也做了,比如反向看,意味着我得讲到那儿才能反向看到,这就有延迟。”初敏表示,阿里云最近做了一些新的技术,计算速度至少快了三倍,意味着在一台都要到了退役服务年龄的服务器上也能跑起来,并发度很高。“这些都是我们(阿里云)的强项。”

  这种语音识别转化在某些专业行业领域还需要进一步的机器训练。“如果讲演的人是医疗领域,我估计肯定不行,我们今天没有用医疗语音训练它,不是做不到,而是没有训练而已。”初敏如是说。

  谈到未来的挑战,初敏表示,数据是最大的挑战,今天所有的人工智能其实多是从数据中学习,从数据中学习人看不出明显的规律,不能用语言描述起来,但是它是存在着一种隐性的影射关系,深度学习最大的能力就是把这个关系影射好,但是如果数据是偏的,就会完全被数据误导了。

  当被媒体问及是否考虑将这种语音识别技术推出消费级产品时,初敏称:最初做并不面向to C,但近期也有考虑到做一个应用,一款专门面向记者的产品。“但不能期望太高,语音转换与录音条件和设备相关,还有设备的压缩率码率等因素,条件可控的情况下可以转换得很好;但如果手机放中间录音两人开始聊,识别难度会大一些。”初敏表示。

编辑:贾斯曼

关键词:阿里云;初敏;环球网

说两句

相关阅读

阿里云金邦达联手打造GCaaS云平台

GCaaS云平台是金邦达与合作伙伴及客户联手打造的服务平台及产业链生态系统,可为全球发卡机构、商户、持卡人提供包括电子商务、业务综合管控、数据任务综合处理以及智能卡应用服务等一站式解决方案。

2016-10-17 09:46:00

阿里云“牵手”天津于家堡 阿里云+优客工场9月试运营

天津滨海新区中心商务区管委会昨天与阿里云计算有限公司签订战略合作协议,未来将通过支持企业上云、培养专业人才以及共建互联网+教育等举措,加快推进互联网相关产业等新兴服务业态在中心商务区的聚集发展,“提速”本地云计算应用技术及上下游产业和云产业生态建设,在双创特区更好营造“大众创业、万众创新”的氛围。

2016-08-13 17:19:00

阿里Q1财报公布 阿里云连续5季度营收增幅超100%

2016-08-11 19:26:00

参与讨论

我想说

编辑推荐

视觉焦点

推荐视频

央广网官方微信

手机央广网

点击排行

违法和不良信息举报电话:010-56807188 新闻热线:4008000088 E-mail:4008000088@cnr.cn
网上传播视听节目许可证号 0102002 京ICP证150508号 京公网安备11040202120007
中央人民广播电台介绍 | 央广网介绍