6月9日消息,日前,360数科在ICDAR 2019 SROIE国际大赛OCR单项任务中,与全球148个国家的队伍竞赛,获得了赛事榜首。
360数科在本次竞赛中,提出了一种基于RARE改进的新文本识别算法,并与优化后的CRNN模型进行了模型融合,并在此基础上使用了带有初始值的center loss。除了模型优化外,360数科还利用大规模公开数据集用于预训练模型,并且生成了大量与训练集相同图像风格的仿真数据,在预训练模型的基础上进行finetune。最后,应用已训练完成的自然语言模型,纠正文本识别中的错误。
据360数科首席算法科学家费浩峻介绍,360数科一直把业务作为技术成长的最有力土壤,本次ICDAR竞赛便是对业务实践过程中技术积累的一个有效检验。未来,除了对端到端网路结构的进一步探索,如何设计更适用于移动端使用的轻量化模型也是公司OCR技术的重点研究方向,只有兼顾效率和精准度的模型才能更好服务于用户。
他还谈到,“当前,OCR技术已在金融、保险、医疗、交通、教育等诸多行业有了深入成熟的应用。未来随着传统行业的数字化转型,OCR应用范围和场景将进一步扩展,市场规模将进一步增大。”(一橙)