近年来,人工智能迎来了深度学习的浪潮,技术呈现革命性的突破,尤其是在以视频为核心的物联网行业率先实现产业化,在公安、交通、金融等领域得到广泛应用。大华股份作为视频安防的领军公司,在人工智能领域深耕多年,积累深厚的技术实力和产物经验。
大华股份先进技术研究院,采用深度学习技术研发的文本检测技术,取得了自然场景随手拍文本检测排行榜第一名,标志着大华股份在自然场景文字检测方面取得了突破性进展,为技术成果落地奠定了坚实的基础。
大华股份刷新了ICDAR Robust Reading 2015中的自然场景随手拍任务(IncidentalScene Text)的全球最好成绩,超越商汤、腾讯、百度、旷视等知名AI公司。该技术已经越来越多的应用到实际场景中,包括车牌字符识别、集装箱号识别、物流面单识别、自然场景字符识别等领域。
对于ICDAR:即国际文档分析与识别大会(International Conference on Document Analysis and Recognition),是国际模式识别协会举办的文档分析与识别、模式识别领域世界最权威的国际学术会议之一,每两年举办一次。
自然场景随手拍任务
该任务中的文本背景复杂,成像存在噪声、模糊、反光、倾斜等诸多干扰因素,检测难度较大。大华股份以87.19%的准确率位列第一。
本次竞赛在大华自主研发的深度学习平台上,汲取了厂贰狈别迟和搁别蝉狈别迟等网络结构的优点,采用多特征、多通道融合的策略,并运用多模型融合技术,大幅提升了精度。
其中,该场景的文本检测效果图如下:
文本检测技术在车牌识别系统中的应用
本次竞赛中使用的技术已经在大华的智能交通等产物上得到广泛应用,尤其在倾斜车牌的检测中,取得突破性进展。