近日,大华股份基于深度学习算法的图像语义分割技术,刷新了KITTI语义分割竞赛(The KITTI Semantic Segmentation Evaluation)全球最好成绩,取得语义分割排行榜第一名,超越其他一流AI公司和顶尖的学术研究机构,这标志着大华股份在语义分割领域处于领先水平。
(网址: www.cvlibs.net/datasets/kitti/eval_semseg.php)
大华股份已建成用于算法训练的超大规模计算中心和数据中心,重点研究并商用化多个领域算法,已形成核心竞争力。2017年大华股份在场景流、光流和文字识别检测等领域分别取得第一;2018年在2顿车辆目标检测、惭翱罢跟踪、行人重识别等国际竞赛中分别取得第一;2019年初,在实例分割国际竞赛中取得第一。本次在语义分割算法领域再次取得新突破。
对于碍滨罢罢滨:
KITTI数据集由德国卡尔斯鲁厄理工学院和丰田美国技术研究院联合创办,是目前国际上最大的计算机视觉算法评测数据集之一。数据集用于评测立体图像(Stereo)、光流(Optical Flow)、视觉测距(Visual Odometry)、物体检测(Object Detection)和跟踪(Tracking)、道路分割(Road)、语义分割(Semantics)等计算机视觉技术在车载环境下的性能。KITTI包含市区、乡村和高速公路等场景采集的真实图像数据,每张图像中最多包含15辆车和30个行人,且存在不同程度的遮挡与截断。
语义分割:
语义分割是指将计算机输入图像的每个像素分类为所属对象类别的过程。它不仅是计算机视觉的基本任务,同时在自动驾驶、机器人场景理解以及虚拟现实方面有着非常重要的应用。
在碍滨罢罢滨语义分割任务中,需要把各种场景下的汽车、行人、道路、摩托车、自行车、交通标志、建筑物和植被等19类物体准确分割出来。同时,训练集只提供200张数据,属于小样本学习。
本次国际比赛,大华股份为提升语义分割精度,汲取了图像分类、单目标分割和全像素语义分割等先进算法的优点,构建了基于多位置和通道特征的全局关注机制,并采用迁移学习和增量学习方法,有效提升了算法的分割精度。
该竞赛语义分割效果:
在大华实际产物和未来产物中的应用
车道线分割
机器人场景理解及语义地图构建: