在 OCR 识别领域最权威的会议之一 ICDAR(国际文档分析与识别会议)上,360 数科在 ICDAR2019- SROIE 榜单上斩获第一。
文本行字体模糊不清。官方给出的比赛数据集,均来自商超结算小票扫描图像,由于小票均为机打且存放时间过长,导致扫描出来的文本行存在较为严重的磨损和缺失,字体笔画不完整等情形,这给 OCR 识别算法带来很大挑战。 文本行图像出现弯曲。给出的文本行图像中出现较大比例的弯曲,现今主流文本行识别算法对水平文本识别较为稳健,弯曲文本行识别是 OCR 识别业内难点。 标注歧义。给出来的文本行在对应的文本图像中根本不存在、空格标注错误以及形近字标注错误,这给算法的泛化性带来了很大的冲击。