计算机视觉技术:让机器“看懂”世界
张天池在办公室。受访者供图
人物简介:张天池,重庆人,1989年出生,留学归国创业者,重庆天量电子科技有限公司创办人。
张天池所率领的“天量科技”团队主攻深度学习技术运用于计算机视觉领域,旨在解决人工智能“看”与“思考”的问题。
重庆天量电子科技有限公司自主研发的芯片及深度学习算法,通过核心算法和核心硬件的设计生产,搭载不同的载板与驱动可应用各个行业。目前,国内从事该领域探索的研发型科技公司还很少。
人类正一步步向“塔斯”靠近
重庆日报:一部风靡全球的《星际穿越》激起了无数人对探索浩瀚宇宙奥秘的渴望,也让许多人记住了塔斯(Tars)这个能看、能听、能说的智能机器人。长期以来,让计算机能看、能听、能说,一直是计算机技术研究者们孜孜以求的目标。那么,计算机视觉领域的研究目前究竟到了什么阶段?
张天池:对人类而言,“认人”几乎是与生俱来的能力。然而,这件对人类而言轻而易举的事情,对计算机来说却十分艰难。
长时间以来,让计算机能看、能听、能说一直是我们孜孜以求的目标。虽然计算机暂时还无法像科幻电影中所展现的那般聪明,但在科技工作者的不懈努力下,已取得很多令人欣喜的进展。
计算机视觉技术的发展,主要得益于计算机技术、传感技术和数学算法等学科的进步。目前,人们正在学习如何适当使用应用数学与工程技术来解决计算机视觉问题。因此我认为,目前计算机视觉领域已发展到了作为一种人工智能方法的前深度学习时代。
重庆日报:人工智能,是基于移动互联网的未来发展的平台。目前有分析认为,在未来五年,计算机视觉领域将得到快速拓展。对此,你如何看待?
张天池:计算机视觉领域近几年来一直处于快速发展阶段,计算机视觉技术早已从实验室的理论研究层面,发展延伸并实际应用于工农业生产、军事领域以及日常生活之中。
随着芯片技术的智能化,神经网络技术、数学等学科的飞速发展,计算机视觉系统已显露出广阔的发展前景。可以说,计算机视觉在未来五年应该呈指数级增长,实际应用会变得越来越广泛。
在社会文化生活中,人工智能主题的好莱坞电影一直广受影迷们喜爱,人类用无穷的想象力和精湛的电影特技构筑了一个个无比精彩、令人炫目的未来世界。虽说电影终归是电影,要研发出一个像“塔斯”一样能看懂周围世界、听懂人类语言并和人类进行流畅对话的智能机器人,还有许多事情要做、有很长的路要走,但在科学家们锲而不舍的努力下,我们正在一步步向“塔斯”靠近。
深度学习技术,为机器装上一颗“大脑”
重庆日报:有人认为,深层神经网络能不断完善计算机的视觉能力,这是否意味着计算机能成功取代人眼呢?研究人员是如何将深度学习技术与计算机视觉相结合,以期解决人工智能“看”与“思考”的问题?
张天池:计算机从“看”到“思考”的过程,具体来说也就是计算机从获取图像到读懂图像的过程。计算机视觉是从图像和视频中提出数值或符号信息的计算系统,更形象一点说,计算机视觉是让计算机具备像人类一样的眼睛,既能“看到”图像并且还能“理解”图像。
尽管科学家已逐步揭开人眼识别的奥秘,但要将相关技术直接应用在计算机上却并非易事。我们会发现计算机识别总是在“雾里看花”,一旦光线、角度等条件发生变化,计算机就难以跟上环境变化的节奏,就会出现误识。
以人脸识别技术为例,最初研究者试图将人脸想象成一个模板,用机器学习的方法掌握模板的规律,然而只要观察角度、环境光线等发生变化,人脸的样子就有差别,令模板难以匹配所有人脸。人脸识别的核心问题在于,如何让计算机忽略同一个人在不同环境条件下的差异,同时又能发现两个人之间的区别。
人类是通过不断感知周围的事物,逐渐理解这些事物到底是什么。而机器同样如此,通过大量样本数据训练机器,机器可根据训练的信息判断出一张图里面有什么东西,这些东西在什么位置等等。
采用深度学习技术,就仿佛给机器装上一颗人类的“大脑”,让机器以人类的思维模式去“理解”人类的世界。
计算机视觉技术与生活息息相关
重庆日报:从理论研究到实际应用,计算机视觉能力目前是如何服务于普通用户的?
张天池:从上世纪70年代到现在,40年间计算机视觉技术得到迅速发展,计算机视觉的应用出现在了许多社会生产、生活领域。例如,对道路交通等自然场景进行数字化分析、OCR应用在邮局分拣信件以及人脸识别门禁系统……等等。
其间,多视图几何和图像分割、视觉跟踪和运动分析、大型图像和数据库等研究,对计算机视觉发展起了很大的推进作用。
计算机视觉还可应用在许多别的工作上,比如在拍照人微笑瞬间自动按下快门,帮助汽车驾驶员泊车入位,在工厂中准确地焊接部件并检查缺陷,在忙碌的购物季节帮助货物仓库分拣商品……计算机视觉应用技术与人类生活息息相关。
基于深度学习的图像识别技术出现,极大地提高了计算机视觉的识别精确度。这些算法的可靠性促进了其在各行各业中的应用,比如目前我们天量科技的产品已应用于安防、工业检测以及ADAS(高级驾驶辅助系统)等领域,显现出光明的发展前景。
未来,ADAS技术的演进与普及
重庆日报:ADAS(高级驾驶辅助系统)是你们研发的内容之一。但据了解,无论是正常驾驶还是在危险环境中驾驶,目前市场上多数驾驶辅助系统都是通过提供附加信息来帮助司机驾驶的。未来,高级驾驶辅助系统是怎样一种发展趋势?
张天池:ADAS是无人驾驶的一个分支,也是推动实现无人驾驶的重要环节。安装了ADAS的车辆对于驾驶者来说意义非凡。比如,当司机驾驶的车辆开始偏离车道时,系统会发出警报;当驾驶的车辆和前方车辆、行人存在碰撞风险时,系统也会发出警报。
“无人驾驶”这个看似遥远的概念离我们的生活已越来越近。事实上,无人驾驶技术并非完全创新,而是在ADAS基础上的演进。目前ADAS能否得到广泛应用的决定性因素还是成本。虽然ADAS技术越来越复杂,但传感器和处理器技术的进步,足可以支持工程师以中端汽车甚至是经济型汽车能够承受的价格来设计ADAS应用。
降低成本以及通过功能集成来降低复杂度,是推动ADAS技术在各类车辆中得以广泛应用的关键因素,这也是天量科技目前正着手解决的问题。
在可见的未来,人类将通过逐步开启计算机的“天眼”,让它在看懂这个多彩世界的同时,帮助人类更高效地完成工作,为人类创造更高品质的美好生活。