持续发力AI领域 搜狗刷新ICDAR2019榜单三项新记录

持续发力AI领域 搜狗刷新ICDAR2019榜单三项新记录
11月8日电 近来,搜狗在OCR辨认威望竞赛ICDAR2019应战中,改写了恣意形状文字辨认(ArT)中检测、辨认、端到端三项使命的新记载,充分表现了搜狗在文字辨认范畴的抢先优势。  ICDAR世界文档剖析与辨认竞赛是图画范畴文本检测与辨认的威望赛事,备受业界重视。ICDAR2019-ArT是在2019年提出的新使命,因其使命的高应战性,招引了旷视、华为、阿里等传统强队参加。与从前的赛事使命不同的是,2019年的数据集旨在推进恣意形状文字检测和辨认技能的开展与立异,因而数据层面聚集在恣意形状,特别是不规矩场景文字的检测与辨认,这就要求算法结构具有更高的鲁棒性。并且,该数据集为天然场景图画,场景类型覆盖面大、布景杂乱,一起存在很多非规矩形状文字,是现在业界最大的恣意形状场景文字数据集,杂乱性和难度更大。  在本次使命中,搜狗选用了根据实例切割的文字检测办法,练习及测验过程中引进了掩码交融、打分机制优化、多标准等技能。针对文字辨认,搜狗以干流的Encoder-Decoder技能作为结构,以SE-ResNet作为Encoder主干网络,引进薄板样条插值算法(TPS)和通道注意力机制(Channel-Attention),立异性地将残差思维引进多层Bi-LSTM中,不同层的LSTM特征经过残差衔接进行特征交融,增强了模型的鲁棒性。在Decoder模块中,选用注意力解码机制完成对特征解码辨认。  文字检测与辨认技能在实际生活中有广泛的运用,如扫描录入、摄影搜题、摄影翻译、路标辨认等。搜狗OCR技能在很多笔直范畴落地,满意着广阔用户多样化、个性化需求,协助用户提高输入的功率,在搜狗翻译及输入法等产品中得到用户的广泛运用和好评,并一起为vivo等合作伙伴赋能。  搜狗此次改写ICDAR2019-ART榜单的成果,是其在OCR范畴继续耕耘的成果,也是在AI范畴的才能表现。未来,搜狗还将不断扩展技能成果的落地场景,带给用户更多实在便当及惊喜体会。

发表评论

电子邮件地址不会被公开。 必填项已用*标注