央广网合肥4月26日消息(记者徐鹏)4月26日,讯飞星火大模型V3.5春季上新。面向用户高效准确知识获取的痛点,科大讯飞发布业界首个长文本、长图文、长语音大模型,不仅能够把各种信息来源的海量文本、图文资料、会议录音等进行快速学习,还能够在各种行业场景给出专业、准确回答。

科大讯飞进一步升级星火语音大模型,首发多情感超拟人合成,具备情绪表达能力,并推出一句话声音复刻功能,让科技更有温度。

同时,面向企业应用场景,科大讯飞推出星火智能体平台,帮助企业解决大模型落地的最后一公里难题。

持续用技术进步解决真实刚需,讯飞星火也在获得越来越多用户的认可。据七麦数据显示,讯飞星火APP在安卓端的下载量已经超过9600万次,在国内工具类通用大模型APP中排名第一。

讯飞发布首个长文本、长图文、长语音大模型(央广网发 科大讯飞供图)

据介绍,本次讯飞星火长文本功能全新升级后,具备长文档信息抽取、长文档知识问答、长文档归纳总结、长文档文本生成等能力。为了解决大模型应用效率和准确率问题,基于讯飞星火V3.5对长文本的理解、学习、回答能力,科大讯飞进行了重要的模型剪枝和蒸馏,从而推出业界性能最优的130亿参数的大模型,在效果损失仅3%以内的情况下,使得星火在文档上传解析处理、知识问答的首响时间以及文字生成方面都获得了极大的效率提升。

面向复杂的图文场景,科大讯飞首次推出星火图文识别大模型。相比传统小模型逐行文字识别的限制,星火图文识别大模型具有三大优势:能够直接处理非常复杂的版面分析,目前已经覆盖31个典型场景,同时能自动识别标注出18类不同的版面要素;融合篇章上下文语义进行文字识别,识别更精准;面向教育、金融、医疗、科研等专业领域深度优化,能自动实现更多领域的专业符号识别。

此外,面对广泛的音视频信息高效获取需求,科大讯飞也推出长语音功能,将国际领先的语音识别和翻译技术结合起来,可以实现会议录音、学习视频等的一键研读,实现音视频场景的高效知识获取。

讯飞星火长文本、长图文、长语音能力的升级,进一步推动大模型在招投标、日常生活及教育等各个场景的落地。

自今年1月30日发布以来,讯飞星火V3.5作为首个全国产算力训练的大模型,受到了各行业伙伴和开发者的广泛欢迎。据科大讯飞董事长刘庆峰透露,讯飞将在6月27日发布讯飞星火大模型V4.0,进一步解放生产力、释放想象力。

编辑:赵家慧
更多精彩资讯请在应用市场下载“央广网”客户端。欢迎提供新闻线索,24小时报料热线400-800-0088;消费者也可通过央广网“啄木鸟消费者投诉平台”线上投诉。版权声明:本文章版权归属央广网所有,未经授权不得转载。转载请联系:cnrbanquan@cnr.cn,不尊重原创的行为我们将追究责任。
长按二维码
关注精彩内容