央广网北京9月27日消息(记者 马可佳)9月27日,据上海证券交易所官网信息,人工智能和大数据科技企业合合信息已递交招股说明书,拟登陆科创板。

招股书显示,成立于2006年的合合信息,基于自主研发的智能文字识别及商业大数据核心技术,为全球C端用户和多个行业的B端客户提供数字化、智能化的产品及服务。

合合信息的B端业务是为企业客户提供以智能文字识别、商业大数据为核心的服务,形成了包括基础技术服务、标准化服务和场景化解决方案的业务矩阵,满足客户降本增效、风险管理、智能营销等多种需求,助力客户实现数字化与智能化的转型升级,目前已在银行、保险、证券、汽车、政府、物流、制造、地产、零售等近30个行业实现成熟应用。三星、联想、亚马逊、招商银行、建设银行、中国银行、中国人寿保险、中国太平洋保险等超过80家世界500强企业都是合合信息的客户。

在C端业务方面,合合信息旗下的扫描全能王、名片全能王、启信宝3款产品,覆盖全球百余个国家和地区的亿级用户。2021年3月,3款App月活合计约1.2亿。

招股书显示,2018-2020年,合合信息的营业收入分别为19,603.14万元、34,038.94万元、57,824.64万元,年复合增长率高达71.75%。2021年一季度,公司营业收入达17,101.22万元。其核心技术相关业务收入占营业收入比例达90%以上。

111项境内外发明专利

对于冲击科创板企业来说,“硬科技”成色至关重要。合合信息的招股书中披露,截至2021年3月31日,公司及其控股子公司已取得发明专利授权合计111项,其中境内发明专利授权73项,境外发明专利授权38项。

在业内人士看来,成立于2006年的合合信息算是AI行业老兵。人工智能的关键技术模式识别,主要包含文字识别、语音识别和图像识别。与其他两种识别技术不同的是,智能文字识别早已在生产、生活中随处可见:证券开户,身份证、银行卡的识别提取;财务流程里,票据、单据、合同的关键文字信息识别提取、比对;快递寄件时,面单信息的识别提取和自动填写……随着企业与个人实现生产、工作或者生活方式的数字化升级,智能文字识别的实际应用价值越来越高。

合合信息成立至今,在智能文字识别领域已拥有超过10年的研发经验及技术积累,融合了智能图像处理、基于深度学习的复杂场景文字识别、自然语言处理(NLP)等多项人工智能(AI)技术。在AI助力下,相比传统简单文字识别(OCR),合合信息的智能文字识别技术具备更多认知与理解能力,识别准确率高,且识别精度可随着数据的积累、算法模型的深度学习优化不断提升。可适应多语言、多版式、多样式等复杂场景,并可应用到多个商业化场景中并形成落地的产品或服务,例如票据分类、证照票据结构化、合同关键信息抽取、智能审核等。

目前,合合信息的智能文字识别技术可识别超过100种证照,包括不同国家的身份证、驾驶证、行驶证、结婚证、营业执照、税务登记证等,还可识别包含56种语言的文档图像,支持全球不同国家、不同行业的银行卡识别,包含储蓄卡、借记卡、信用卡等。合合信息提供在各种复杂的场景中,识别和提取文档图像中的文字和关键信息,从而将非结构化的文档图像转化为结构化的文档数据,以实现进一步分析决策,为个人和企业客户提供文档数字化、文档数据资产智能化管理服务,帮助客户降本增效。

研发投入占总营收约30%

至于科创板上市公司“含科量”的另一大体现研发投入,在合合信息的招股书中能看到,截至2021年3月31日,研发人员占全职员工总数的比重约58%。今年1-3月,研发费用占到总营收约30%。

持续的研发投入带来了领先行业的技术优势,2012年,合合信息被谷歌评为“全球顶尖开发者”。在2019年的国际文档分析识别大会(ICDAR)中,合合信息研发团队取得表格识别竞赛的冠军。在2020年国际模式识别旗舰会议(ICPR)中,合合信息研发团队与华南理工大学、联想研究院团队合作,在信息图表识别竞赛的7大任务14个子任务中获得11项第一。

未来,合合信息还将持续保持高强度的研发投入,以保证产品的核心技术有较强的市场竞争力,并且,此次募集资金将用于人工智能C端产品及B端服务研发升级项目、商业大数据C端产品及B端服务研发升级项目、人工智能核心技术研发升级项目、商业大数据核心技术研发与数据中台建设项目。

“人工智能+大数据”

除了智能文字识别外,合合信息在商业大数据领域基于大数据挖掘、知识图谱、NLP技术开发了启信宝App,以及可服务于多种行业、多类型企业客户的商业大数据服务,通过“数据-信息-知识-智能”4个层次,挖掘商业数据背后蕴藏的价值,赋能各行各业。

合合信息对于AI和大数据的布局,是基于对这两项技术和行业需求的深入理解。据称,这两项技术相辅相成,海量的大数据可以帮助深度学习算法模型的设计和优化,同时AI模型也可实现更高效、深层的数据挖掘。并且,AI与大数据业务的客户需求也具有一定程度的重叠,两者协同耦合可以实现更多应用,能更好的解决各行业数字化转型遇到的问题。

同时,我国政府近年来先后发布了多项AI与大数据的行业利好政策。例如,2020年4月,我国发改委首次将AI与数据中心明确为新基建建设的方向之一,从政策端加大建设投入,加速AI与大数据在各行各业的产业化应用。

在需求端,根据Grand View Research报告,全球智能文字识别服务市场规模2020年达75亿美元,预计2020-2025年复合年均增长率约18%。而据灼识咨询数据显示,2020年,中国智能文字识别服务市场规模为人民币30亿元,预计2025年市场规模将达人民币129.6亿元,复合年均增长率达34%,远超全球市场总增速。

根据IDC数据,中国企业级数据量将从2015年占中国数据圈的49%增长到2025年的69%。伴随着企业数量增加、信息技术发展、大数据、AI应用场景丰富,商业类数据将保持高速增长。根据灼识咨询,2020年,中国商业大数据服务市场规模为284.1亿元,预计2025年市场规模达到873.7亿元,复合年均增长率约25.2%。

合合信息作为行业内少有的在C端产品与B端服务拥有完善布局矩阵的人工智能及大数据科技企业,受益于行业及政策利好,实现业绩强劲增长。招股书显示,公司净利润在2020年扭亏为盈,实现净利润12,952.93万元,今年1-3月,公司净利润达到4,300.3万元,增长迅速。