海康威视基于深度学习的“文字识别技术”在国际竞赛中斩获第一

应急安全在线 2017-03-30 来源：指挥调度网　字体【大中小】

　　近日，海康威视研究院预研团队基于深度学习技术研发的OCR——图像中文字识别技术，刷新了ICDARRobust Reading竞赛数据集的全球最好成绩，并在“互联网图像文字”、“对焦自然场景文字”和“随拍自然场景文字”三项挑战的文字识别（Word Recognition）任务中，大幅超越国内外强劲参赛团队，标志着海康威视的文字识别技术达到国际领先水平。

　　 ICDAR即“文档分析与识别国际会议”，由国际模式识别协会(IAPR)主办。它组织的文档分析与识别竞赛是当前OCR技术领域全球最具影响力的比赛，从2003年至今已举办5届。其中2015竞赛两年来，已吸引了来自82个国家的2367支队伍参加，其中包括Google、微软、百度、三星、旷视等团队，竞赛中涌现的许多方法都对文字识别技术的发展起到了强大的推动作用。由国际模式识别协会(IAPR)主办。它组织的文档分析与识别竞赛是当前OCR技术领域全球最具影响力的比赛，从2003年至今已举办5届。其中2015竞赛两年来，已吸引了来自82个国家的2367支队伍参加，其中包括Google、微软、百度、三星、旷视等团队，竞赛中涌现的许多方法都对文字识别技术的发展起到了强大的推动作用。

RobustReading竞赛的三项主要任务

　　这些任务中待识别的文字位于复杂图像背景中，成像存在噪声、模糊、透视、倾斜以及排列随意等不利因素，甚至字体格式种类繁多。海康威视的OCR技术，克服种种困难，在三项文字识别任务中均取得了世界第一，分别在Web and Email Born-Digital Images任务中以5.6%的优势超越第二名，在FocusedScene Text和Incidental Scene Text任务中超越第二名3.4%和3.1%。

Born-Digital Images识别评测结果显示HIK_OCR排名第一

Focused Scene Text识别评测结果显示HIK_OCR排名第一

Incidental Scene Text识别评测结果显示HIK_OCR排名第一

　　近年来文字识别技术的突破，很大程度上依赖于深度学习的发展。海康威视预研团队设计了一个数十层的卷积神经网络来完成图像的信息编码，然后使用启发式的注意力模型，实现从特征到文字的解码。其中，专为文本识别设计的启发式机制，能够对注意力模型提取的特征进行合理性评估，使注意力模型在复杂场景中，具有强大的稳定性。

海康威视文字识别技术原理示意

　　借助先进的OCR技术，海康威视的文字识别系统能够应对更为复杂文字识别场景，如污损及模糊、背景干扰及形变、恶劣天气等。目前，基于全新OCR技术的海康威视车牌识别系统已经覆盖全球六十余个国家和地区。基于车牌识别技术的卡口、电子警察、出入口控制、停车系统等应用也已经全面铺开。

　　除此之外，此次竞赛成果还可以应用到机器视觉领域的标签表单识别、民生领域的卡证执照识别、互联网领域的恶意图片识别、汽车辅助驾驶领域的路牌识别、城市管理领域的横幅标语和街景识别等产品中，大幅提升产品性能与应用效果。

　　在如今人工智能的浪潮里，海康威视将充分利用自身大数据的积累及人工智能技术优势，快速提升OCR技术性能，并不断推动机器的智能化和自动化水平的提高，在视频监控、智能感知和场景理解等方面为客户持续创造价值。

分享到：

关键词： 海康威视视频监控

共0条 [查看全部] 相关评论

• 智慧景区发展峰会代表团200余位代表参访海康威	• 不断积蓄力量，海康威视看好智能物联未来前景
• 海康威视遭“滑铁卢”：21年来利润首现负增长，	• 连红绿灯都会随“车”应变南浔交警携手海康威
• 海康威视首次回购公司股份回购资金总额为20-25	• 中国计量大学与海康威视达成战略合作，共同推进
• 海康臻全彩：海康威视重新定义全彩摄像机	• 绵阳市政府与海康威视签署战略合作协议
• 海康威视前三季度实现营收556.29亿元，同比增长	• 北京交通大学与海康威视达成合作共建机器感知

应急安全在线

海康威视基于深度学习的“文字识别技术”在国际竞赛中斩获第一

品牌推荐

人物专访

资讯排行榜

应急安全在线

海康威视基于深度学习的“文字识别技术”在国际竞赛中斩获第一

推荐文章

品牌推荐

人物专访

资讯排行榜