钛媒体9月24日消息,百度AI技术在国际技术比拼中再夺佳绩。在文档智能国际权威榜单文档视觉问答DocVQA任务中,百度ERNIE-Layout在4项文档理解任务上刷新世界最好效果。
ERNIE-Layout,是一个基于文档布局知识增强的跨模态预训练模型。它看似高冷,但可能正在你的身边,帮你解决问题。比如报销过程中,ERNIE-Layout可以自动、快速、准确地识别和提取票据中的关键信息,实现智能化的实时财务报销审核。
被ERNIE-Layout刷新记录的文档视觉问答DocVQA,是一个跨模态的文档抽取任务评测,需要AI模型在抽取和理解文档中文本信息的同时,还能充分利用文档的布局、字体、颜色等视觉信息。简单来说,就是让AI看图回答一些“刁钻”问题。