人民网

智能文字识别技术再次亮相世界人工智能大会

本文转自:人民日报客户端

谢卫群

“克曰穆朕文且師華父悤譲氒心宁静于猷淑哲氒”要怎么断句?2022世界人工智能大会期间,一篇镌刻在西周青铜鼎面的钟鼎文难倒了不少参观者,最先“解题”成功的是合合信息技术公司推出的智能文字识别AI人工智能)系统。在无人工干预的状态下,钟鼎文从内凹状态被拉平,并被转译成简体字,原本连在一起的文字经过“AI断句”功能自动处理后被正确区分开来,获得现场观众的赞叹。

针对图像处理及内容识别中文档图像质量退化严重、文字检测及版面分析困难、非限定条件文字识别率低、结构化智能理解能力差等难题,合合信息技术公司重点展示了智能文字识别技术的创新成果及产业应用示范。

合合信息智能文字识别技术主要由以“弯曲矫正”为代表的智能图像处理,基于深度学习的复杂场景文字识别,自然语言处理(NLP)三大核心模块组成。智能图像处理技术可对曲面、阴影、摩尔纹等复杂场景下的文档图像进行精准的矫正处理,为接下来的文字信息提取、识别创造条件;复杂场景文字识别技术主要利用手写印刷混排识别、抗强干扰识别、扭曲文字识别等深度学习技术进行文字提取及识别,并结合领先的NLP技术,对识别出的结果进行语义理解。

在大会现场,观众还可使用公司旗下产品“扫描全能王APP”,用“拍图识字”功能一键识别竖排的繁体古籍《桃花源记》,将其转化为易于阅读的横排、简体版本。

合合信息技术人员介绍,“选择钟鼎文、古籍等素材来识别,是因为与常规文本相比,鼎面的文字形小细密,竖排的格式也与正常的文本不同。从载体上看,青铜鼎面存在弯曲、反光、凹凸不平的状况,古籍表面也可能有模糊、框线等因素的干扰,整体识别难度极大。这些问题的解决,不仅对文物保护和文化传承意义重大,也有助于技术在各行业的应用向纵深拓展。”

合合信息“PS篡改检测”功能,是智能文字识别技术的另一亮点。从个人证件、票据到各类商业材料,诈骗团伙经常会使用PS过的材料来进行伪装行骗。该技术主要采用神经网络捕捉图像在篡改过程中留下的细微痕迹,基于百万级的数据学习图像被篡改后统计特征的变化,不仅可以判断图片是否被篡改,还能定位修改区域,以热力图形式展示图片的PS区域篡改置信度,检测准确率远超传统技术方法和人眼判断。这种直接针对图像特征信息的篡改检测方法在行业中属于创新应用,覆盖身份证、护照等多种证照识别,适用于保险、银行、证券、政务等多种场景。

创立于2006年的合合信息在智能文字识别领域中已有10多年深耕经验。其扫描全能王APP针对常规的印刷体文档字符平均识别率达到99.77%, 手写体文档字符平均识别率为97.00%;“AI+OCR”行业解决方案可识别上百种卡证、票据、行业单据内容,支持50多种语言的信息提取。

智能文字识别技术再次亮相世界人工智能大会

免责声明:本文来自网络投稿,观点仅代表作者本人,不代表芒果财经赞同其观点或证实其描述,版权归原作者所有。转载请注明出处:https://www.mgcj.net/931339.html
温馨提示:投资有风险,入市须谨慎。本资讯不作为投资理财建议。