央广网北京7月7日消息(记者 马可佳)拿起展台上篆刻着形象丰富的甲骨文龟,打开高扫仪进行识别提取与翻译:“单身狗”、“白富美”、“买它买它”,这样一些流行网络热词被识别翻译出来,令人忍俊不禁。原来甲骨文也可以萌萌哒。这是本届世界人工智能大会上,由智能文字识别领域头部企业——合合信息所展示的热门“黑科技”之一


  2021世界人工智能大会于7月8日-10日在上海世博展览馆召开。图为合合信息的人工智能文字识别场景。

  甲骨文背后的“智能文字识别”技术

  甲骨文,最早出现于3400年前的商朝。是中国发现最早的象形文字。当时的王室贵族为了占卜和记,将“文字”契刻在龟甲和兽骨上,图案种类十分丰富,同时又透露着古代文化的神秘。由甲骨文引发对中国古文字的破解,对中国考古学具有划时代的意义。如今,合合信息借助AI技术,用数字化的方式尝试破解更多甲骨文背后的世界。

  “这一技术我们还处于内测阶段,也是首次在人工智能大会上展示。”位于上海世博展览馆H1馆A1024展台的合合信息相关负责人告诉记者,甲骨文作为珍贵文物,曾汉晋木简、敦煌文书、明清档案一起被誉为中国近代学术史的“四大发现”,此次合合信息专为甲骨文识别开发了新的系统,通过大量数据的生产识别、图像聚类和主动学习等一系列技术算法对甲骨文字进行检测与识别并翻译成现代汉字,不仅将甲骨文研究资料电子化、数据化,也拉近了年轻人与中华文化的距离。

  识别甲骨文,仅是合合信息对于智能文字识别领域一个分支的尝试性探索。此负责人表示,上海世界人工智能大会(WAIC)已经成功举办三届,今年合合信息紧扣大会方向,以“AI读懂文字信息”为主题,在大会期间向外界展示公司在人工智能领域的更多研究成果。


  人工智能是上海落实国家战略部署、重点发展的三大先导产业之一,在这片沃土上,近年来人工智能领域出现了许多创新场景和前沿进展。合合信息作为上海本土科技企业代表,2019和2020年成功在世界人工智能大会举办金融科技落地论坛,并先后邀请两位诺贝尔奖获得者参与发言。

  据了解,当前合合信息的智能文字识别技术,支持中、英、俄等56种语言的文档图像、100+种证件的快读智能分类,以及全球不同国家、不同行业的卡证、票据、定制识别等多个AI场景的产品和解决方案。全球累计用户下载量超23亿,合作企业已经遍布各行各业。

  能落地的黑科技,才是硬科技

  让黑科技落地,才是技术的精髓。“无论多么炫酷的黑科技,能真实服务我们生活的都是硬科技,比如名片录入,原来录一张名片要花上几分钟,现在几秒钟就可以,这是个数量级的变化,能带来10倍的好处才能吸引客户。”合合信息相关负责人这样解释。

  他所说的正是合合信息2006年开发的一款产品——名片全能王。是一款智能名片及人脉管理工具,可将复杂场景下的纸质名片一秒读懂,字符识别率平均值达99.43%。同时升级版本如数字名片,能够多语言精准识别、一秒保存到手机,是用户人脉智能管理的一个“利器”。这款产品也为合合信息打开了美国、日本、印度等全球市场。

  “扫描全能王”是合合信息全球用户最多的一款产品。它不仅集文件扫描、证件扫描、图片文字提取识别、PDF 内容编辑、电子签名等功能于一体,也是一款非常实用随身扫描仪,移动的文件资源库。这款产品在 Apple Store 125 个国家和地区效率类免费应用总下载量排名第一。

  不提的还有“启信宝”,合合信息启信宝是2015年上线的一款基于合合商业大数据平台的企业信息查询APP,主要为泛金融、泛法务、泛商务、政务等行业的职场用人群,提供企业查询、商业尽调、风险合规、营销拓客、企业服务等场景下的数据服务。

  除了以上三款C端产品,合合信息基于文字识别加大数据衍生出“数字客商平台”、“企业智能解决方案,也积极为企业降本增效,资产数字化升级提供赋能,更多应用场景实现落地。

  以客户关系管理场景为例,合合信息为德国软件公司SAP提供供应商智能风控、财务进销项应收应付以及费控管理等场景助力企业数字化升级集成合合信息CamCard名片识别功能的SAP C/4HANA具备“快、准、多、全、实时”等五大特点,为企业解决了海量名片快速识别,帮助业务人员快速把名片上的信息保存成SAP账户管理系统中的线索。数据显示,使用该系统后名片录入时间可以从3天减少至15分钟,相关业务部门可以100%摆脱手工录入,人力成本节约57%。

 斩获ICPR2020大赛11项冠军,“看不见的”技术软实力

  “看得见的王者看不见的力量”。一家企业背后“看不见的”技术力量是决定王者风范的真正要素。

  作为智能文字识别领军企业,看起来平平无奇的智能识别技术,背后是获得过国际级大奖的技术团队。合合信息的创始团队都是技术出身,从而建立起技术先发优势。在合合信息的人才架构中有一个博士团队:负责未来3-5年科技的发展趋势,确保在技术上的领先性和前瞻性。

  这支团队在2020年举办的国际模式识别大会(ICPR2020)上,被誉为“冠军收割机”。曾联合华南理工大学、联想研究院共同组队,斩获了所有七个赛道14个子任务中的11个冠军据公开资料,合合信息目拥有100余项世界领先、自主知识产权的发明专利,境外专利超30项,Google Top Developer全球顶尖开发者


  值得关注的是,展会上合合信息另一大产品亮点也吸引很多人关注。现场,合合信息还向外界发布了“数字政务大脑”,基于商业大数据平台,对全量企业、全产业链和区域经济进行多维度政企数据融合、分析、挖掘。协助政府部门精准招商,实时了解区域经济动态和企业信息,辅助政务部门从被动了解消息到主动管理服务具有重要意义。

  帮助政府和更多的企业整理、转化数字资产,是合合信息下一步的发展思路。毫无疑问,合合信息通过“AI+大数据”为商业数据和现代企业赋能,在智能文字识别领域将继续领跑,未来发展前景不容小觑。