果冻传媒无码

您好,欢迎来到果冻传媒无码——(原深圳市视频报警安防行业协会)
当前位置:协会果冻传媒无码 > 会员专区 > 海康威视基于深度学习的“文字识别技术”在国际竞赛中斩获第一

海康威视基于深度学习的“文字识别技术”在国际竞赛中斩获第一

时间:2017-03-30 11:24:14 来源:安防行业协会 作者:未知

近日,海康威视研究院预研团队基于深度学习技术研发的OCROptical Character Recognition,图像中文字识别)技术,刷新了ICDARRobust Reading竞赛数据集的全球最好成绩,并在互联网图像文字对焦自然场景文字随拍自然场景文字叁项挑战的文字识别(Word Recognition)任务中,大幅超越国内外强劲参赛团队,标志着海康威视的文字识别技术达到国际领先水平。

ICDARInternationalConference on Document Analysis and Recognition)全称为文档分析与识别国际会议,由国际模式识别协会(IAPR)主办。它组织的文档分析与识别竞赛是当前OCR技术领域全球最具影响力的比赛,从2003年至今已举办5届。其中2015竞赛两年来,已吸引了来自82个国家的2367支队伍参加,其中包括Google、微软、百度、叁星、旷视等团队,竞赛中涌现的许多方法都对文字识别技术的发展起到了强大的推动作用。


1  RobustReading竞赛的叁项主要任务


这些任务中待识别的文字位于复杂图像背景中,成像存在噪声、模糊、透视、倾斜以及排列随意等不利因素,甚至字体格式种类繁多。海康威视的OCR技术,克服种种困难,在叁项文字识别任务中均取得了世界第一,分别在Web and Email Born-Digital Images任务中以5.6%的优势超越第二名,在FocusedScene TextIncidental Scene Text任务中超越第二名3.4%3.1%


2  Born-Digital Images识别评测结果显示HIK_OCR排名第一


3  Focused Scene Text识别评测结果显示HIK_OCR排名第一


4  Incidental Scene Text识别评测结果显示HIK_OCR排名第一


近年来文字识别技术的突破,很大程度上依赖于深度学习的发展。海康威视预研团队设计了一个数十层的卷积神经网络来完成图像的信息编码,然后使用启发式的注意力模型,实现从特征到文字的解码。其中,专为文本识别设计的启发式机制,能够对注意力模型提取的特征进行合理性评估,使注意力模型在复杂场景中,具有强大的稳定性。


海康威视文字识别技术原理示意


借助先进的OCR技术,海康威视的文字识别系统能够应对更为复杂文字识别场景,如污损及模糊、背景干扰及形变、恶劣天气等。目前,基于全新OCR技术的海康威视车牌识别系统已经覆盖全球六十余个国家和地区。基于车牌识别技术的卡口、电子警察、出入口控制、停车系统等应用也已经全面铺开。


通用车牌识别的典型应用场景


除此之外,此次竞赛成果还可以应用到机器视觉领域的标签表单识别、民生领域的卡证执照识别、互联网领域的恶意图片识别、汽车辅助驾驶领域的路牌识别、城市管理领域的横幅标语和街景识别等产物中,大幅提升产物性能与应用效果。

在如今人工智能的浪潮里,海康威视将充分利用自身大数据的积累及人工智能技术优势,快速提升OCR技术性能,并不断推动机器的智能化和自动化水平的提高,在视频监控、智能感知和场景理解等方面为客户持续创造价值。

公司资讯
1月10日,熵基科技2025春季新品发布会
熵基科技突然宣布,2025年春季新品发布会定了
面向万物智联时代,熵基科技持续致力于在数智技术创新道路上的不懈追求,这体现在其内部产物与系统间的持续整合和跃升,以及多模态叠颈辞
熵基科技连续五年荣登全球安防50强榜单,位列第15名
11月18日,全球知名的科技媒体补&补尘辫;蝉《安全&补尘辫;自动化》正式揭晓了备受瞩目的2024年度全球安防50强榜单。熵基科
项目活动
热门专题
  • 熵基科技出席数字经济及智慧城市空间未来应用创新峰会
  • 2021年智能安防机器人市场或将进入井喷期
  • 2021年的智慧城市建设该怎么发展?听听行业大咖的观点
  • 达实信息:颠覆传统经营模式 构建互联网+门禁新时代