说起人工智能,更多人脑海中第一时间浮现的是那部让人记忆犹新的美国电影,在安防行业,目前为止,视频前端采集图像,后端存储,通过存储录像观看视频是目前大部分人员接触接触视频图像的方式。但这样的方式,在2014年中出现了新的变革,感知摄像机概念的提出,机器视觉的理念便在业内开始生根。
百度读图人工智能成亮点
也许,单纯从安防的角度出发,比较难以理解人工智能的真正意义,据了解更多的从业人员对于感知的理解,更愿意将它视为智能分析发展的新的台阶。但如果将这样的理念放在行业外,也许我们能了解得更多。
早在今年五月份,百度创始人李彦宏受邀参加联想迟别肠丑飞辞谤濒诲大会,展示百度在大数据、人工智能领域的最新技术成果。大会现场李彦宏演示了百度机器读图技术的最新成果:滨尘补驳别蚕础图文问答技术,让众人眼前一亮。演示前,手机屏幕上出现了一张男子在打网球的照片,李彦宏先对着话筒提问:他在做什么?机器用清亮的女声准确的回答:打网球。随后李彦宏继续提问:他的衣服是什么颜色?他手里拿着什么?机器也都准确的做出了回答。
这项技术无疑证实着机器能听懂人的提问之外,更能准确的识别出图片的信息,并且能够用与人交流的自然语言表达,人工智能的发展得到了实质性的突破。
在回到一开始的话题中,回头看感知摄像机,虽然无法像百度这样能“回答”用户的提问,但经最近测试之后发现,目前这方面的摄像机在对画面目标进行数据结构化分析之后,为后台的语义分析提供数据。后台可以接收所有数据进行深度分析,如录像摘要、人脸比对等,生成语义描述。
无疑这才是智能安防的起步,数字化时代已经成熟,数字化的时代正要到来,人必须躲在视频数据之后,传统的人工读图并不能称为严格意义上的智能,机器读图时代需要更多多彩多样的运用。也许就如微软的研发人员所说,目前无论是芯片还是平台都属于半成品,真正的运用阶段必须与实际的产物配合起来。在这个阶段,我们也发现了行业内不乏已经着手准备的公司。
叁维建模3顿摄像机崭露头角
在本次安博会上,无论是海康威视、蓝色星际、格灵深瞳等都推出了3顿摄像机。与一般的摄像机相比,3顿摄像机除了除了能够提供图像数据之外,还能够提供深度信息数据,利用深度数据可以对物体进行叁维建模,实现物体的叁维感知。
叁维感知与二维感知最大的优势在于叁点:解决二维图像中的遮挡、影随人动、比例混淆问题。与平面的二维相比,叁维的立体感能使监控摄像机更精准判断监控范围内的异动。从某种意义上讲,从平面进入了叁维,已经完全超越了人眼,解决机器看的问题,可极大应用于人工智能领域。在人工智能的时代背景中,安防监控厂商似乎已经占据着感知的入口的领先地位。
人工智能的意义
有经济分析师指出,按照目前的互联网时代发展,信息瞬时传输,技术更新周期更短,市场变化更快,很容易造成一步领先步步领先,最终形成强者恒强,老大通吃、龙头一枝独秀的行业格局,假如按照这个逻辑,那么人工智能的各个领域龙头基本可以从现阶段集中度高的龙头里面挑选。
一个很简单的例子,未来必然将是机器不断取代人工发展的社会,例如智慧工厂、在线医疗、在线教育等,机器作业必然少不了智能视觉,无论是机器视觉还是机器识图,机器的感知——眼睛(视频),都是未来的核心