中国在计算机视觉领域的人工智能公司


2018年4月7日至6月9日,张学友在南昌、赣州、嘉兴、金华举办了4场巡回演唱会,警方在前三场演唱会现场各抓获了一名在逃犯人,在金华演唱会上更有两名逃犯落网。“歌神”张学友也成了“逃犯克星”。

这一切是怎么发生的呢?原来,在演唱会的安检门,公安部门设置的摄像头可以逐一捕捉到进入演唱会人员的人脸图像。之后通过和后端数据库进行人脸识别比对,这样就可以帮助警方抓获逃犯。
这就是人工智能“人脸识别”的威力。
人脸识别,是计算机视觉领域的一个重要的应用。
5亿4000万年前,地球上出现了第一个拥有视觉的动物三叶虫。今天的人类所拥有的视觉能力,也是经历了漫长的岁月进化迭代才形成的。
对于人类的视觉来说,眼睛只是捕捉光线的镜头,真正能够对人眼看到的图像进行处理识别的是大脑。我们人类的大脑皮层有三分之一是用于视觉计算的。
视觉是人类最重要的感知系统,人类所接受的大部分信息来自视觉。
模仿人类的视觉,计算机也可以拥有视觉。
要想让计算机拥有视觉,必须使用人工智能技术。在计算机视觉领域,中国涌现了很多有创造力的人工智能公司。
什么是计算机视觉?
计算机视觉是用电脑去识别物体的一种新技术。作为视觉来讲,必须要有眼睛与大脑两部分。计算机视觉的主要组成部分不是“眼睛”,而是“大脑”。
2011年,计算机视觉迎来了最伟大的突破。当年,谷歌人工智能实验室的杰夫·迪恩与斯坦福大学计算机系教授吴恩达合作,他们动用上万台电脑的计算资源,让计算机用深度学习算法在YouTube上观看了一千万段关于猫的视频,最后计算机终于完成了“猫脸识别”。这个项目是谷歌大脑在计算机视觉领域取得的巨大成功。
到了2014年,计算机视觉领域的ImageNet比赛第一次超越了人类肉眼识别图片的准确率——这标志着计算机视觉已经比人眼更加精准,因此具有极大地应用价值。
ImageNet国际挑战赛是计算机视觉领域最著名的比赛,被誉为国际计算机视觉领域的“奥林匹克”。它是2010年由美国斯坦福大学人工智能实验室的李飞飞教授主导推出的。早在2009年,ImageNet对1500万张图片进行了标注,涉及22000个类别的物体,李飞飞她们建立了一个规模空前的数据库。而且,她们公开了整个数据库,免费提供给全世界的人工智能研究团队。有了这个培育计算机大脑的数据库,科研工作者教会了计算机识别物体。
计算机视觉的基本原理
想要实现计算机视觉,首先需要有一个摄像头,然后把拍摄的照片成像在CCD上形成电子照片。这些电子照片是以像素为单位存储在计算机上的。每一个像素都可以看成是三个矩阵元,这些矩阵元给出了像素的RGB数值(每个数值都是整数,取值在0到255之间)。其中,R表示红色,是red的首字母; G表示绿色,是green的首字母;B表示蓝色,是blue的首字母。有了这三种基本颜色,就可以按照不同的权重叠加出千变万化的色彩。
计算机视觉所处理的主要对象就是这个RGB数值,因为每一张照片的像素很多,因此整张照片可以被看成是三个大的矩阵。
计算机视觉的本质,其实就是处理这三个矩阵,然后从这三个矩阵中提取出“特征信息”,比如对于动物的图片,可以提取的特征是“有没有尾巴?”以及“有没有毛?”等。通过对特征信息的提取与判断,可以实现“猫脸识别”或者“人脸识别”。人工智能是通过机器学习的方法,提取不同物体的特征,然后用分类器对各种事物进行分类识别。
计算机视觉的头部公司之一商汤科技与华东师范大学合作,编写了中国第一本人工智能教材《人工智能基础(高中版)》,在书中详细介绍了计算机视觉的算法实现及其基本原理。
计算机视觉有哪些相关企业与落地应用?
计算机视觉领域的应用非常广泛,其主要的落地应用有以下几个大类。
在安防摄像头领域,主要有无人值守的场地看管、刷脸门禁、以及发现异常自动报警装置等。在这里主要的代表性公司有海康威视、大华股份等传统大公司与商汤科技、云从科技、依图科技以及旷视科技等独角兽企业,这四家公司被称为人工智能计算机视觉的“四小龙”,它们的产品在本文一开头提到的张学友演唱会上抓逃犯的过程中发挥了重要作用。
在交通摄像头领域,主要是识别车辆车牌,进而进行车辆套牌分析、交通违章分析等智慧城市解决方案。在这个领域的人工智能计算机视觉的头部公司有格灵深瞳等。
在金融领域,计算机视觉主要用于快速信贷审核、刷脸支付与刷脸开户等应用。在这个行业的代表性企业有商汤科技、旷视科技Face++等。
在医疗领域,计算机视觉主要用于智能诊断与疾病研究和精准医疗方面。在这个垂直领域的代表性企业有阿里云ET医疗大脑等。
在汽车领域,计算机视觉主要用于无人驾驶,代表性的企业是百度。百度最近与金龙汽车合作发布了阿波龙无人驾驶汽车。
在无人机领域,计算机视觉主要应用于物流运输以及路径规划、地质灾害监控等。在这个领域的代表性企业是大疆科技。
除了以上的垂直领域,人工智能计算机视觉还有非常多的应用领域,比如在手机领域,计算机视觉主要用在美图拍照与直播特效等领域;在虚拟现实领域,计算机视觉主要用于虚拟现实游戏以及3维电影等领域。
计算机视觉已经落地并且全面开花,《互联网周刊》整理了中国在计算机视觉领域的人工智能公司排行榜。
人工智能计算机视觉的核心竞争力分析
深度学习算法已经打破了图片分类的瓶颈,而且也突破了物体识别的技术瓶颈。物体识别的技术难度比图像分类要高。图片分类问题只需要判断图片中包含哪个物体,而物体识别则需要在同一张图片包含多个物体时,给出所包含物体的具体位置。
目前,基于深度学习算法的计算机视觉已经实用化,张学友演唱会上警方抓逃犯的成功案例说明人工智能在计算机视觉方面已经真正落地了。
当然,人才依然是人工智能计算机视觉的核心竞争力。以商汤科技为例,商汤科技的创始人之一是香港中文大学的汤晓鸥教授,其CEO徐立也拥有人工智能的博士学位。在商汤科技,有120个博士,这无疑是其核心竞争力的体现。
计算机视觉的核心并不在于摄像头,也不在GPU,因为这些都可以在公开市场上买到。对于企业来说,买不到的核心技术是人工智能的算法——这些算法需要相应的人才去编写去改进,只有不断研究新的算法,改进现有的算法,才可能让人工智能工作地越来越好。
人工智能计算机视觉虽然取得了长足的发展,但想要在这一领域拥有一席之地,企业必须拥有真正掌握人工智能算法的核心技术人员。否则随着时间的推移,在人工智能的融资退潮之后,那些没有掌握人工智能算法的企业都会被人发现其实是在“裸泳”。想了解更多的相关互联网知识欢迎翻阅《 互联网周刊》杂志学习哦~