视觉检测领先者
全国咨询热线:13812953225

的卢深视CEO户磊:3D视觉将迎来全面取代2D的拐点

发布时间:2023-10-17 10:52:58 人气: 来源:下载雷火电竞亚洲先驱
案例介绍

  应用领域和范围、硬件规模逐渐加大,3D应用成本将随之降低。当3D硬件成本趋近于2D时,用户将更多的选择更优性能。

  10月16日,FUS猎云网2020年度AI产业峰会在北京金茂万丽酒店隆重举行,近百位知名资本大咖,独角兽创始人、创业风云人物及近千位创业者共聚一堂。

  峰会上,的卢深视CEO户磊受邀发表《技术落地的试金石,规模与体验让3D视觉成为机器标配的眼睛》的主题演讲,他表示:由于神经网络基础浪潮的来临,大众认为经过算法能力的提升和算力的加持,以及更多的数据采集,很快就能形成人工智能AI的大规模应用,因而计算机视觉技术的发展,曾在2018年出现过一个波峰。

  然而在2020年却又步入了低谷期,是因为在发展过程中大家认识到了,真正成熟的计算机视觉或者机器视觉的应用,需要与行业场景结合,不止是简单的行业、系统和算法相加,就能够处理问题。而是需要从数据、传感到总系统设计,再到与行业的结合,才能够形成一个真正落地的完整方案。这个过程与技术的演进,标准规范的建设都有关系。

  户磊强调,3D视觉帮助机器实现更好的人机交互,这是人工智能升级迭代的核心动力之一。经过前些年的市场培育,大家对于AI应用或者视觉应用开始有了认知,并养成了一定的用户习惯,开始希望将体验和效率提升,应用到更多行业,应用到更多场景当中。而这些应用对规模和安全性的要求又提升了一个量级,因此产生并增加了对3D技术的需求。

  在3D硬件相对成本较高的时期,还是需要从更强刚需领域切入。随着应用领域和范围越来越大,硬件规模越来越大,3D的应用成本也将逐渐降低。当3D硬件成本趋近于2D时,在整个系统、产品中差异就趋近于零,用户就会选择更优性能,也将迎来3D全面取代2D的拐点。

  的卢深视创建于2015年,专注于3D视觉,专攻毫米级三维成像、三维重建、三维测量、空间定位跟踪、识别、理解,六大核心技术方向。总部位于北京,研发中心和产品中心位于合肥和杭州,并在深圳建有营销中心,拥有十余个服务网络,能够提供本地化服务。的卢深视始终坚持3D需要软硬件一体的设计,通过系统的垂直整合以及系统优化的提供,可大规模普及交互距离内的高精准3D感知系统和解决方案。

  本次峰会由猎云网主办,猎云资本、企业管家、猎云财经、锐视角协办。峰会以“AI UP!”为主题,聚焦人工智能产业的应用,通过展示多领域多维度人工智能技术和产品以及分享讨论AI在不同场景中最新落地应用,展现人工智能产业落地应用的最新成就;并围绕人工智能产业的“进击”与“破圈”,探讨AI技术如何为产业赋能。

  我们的卢深视从事的方向更多是做关于人的交互、识别和感知,今天给大家分享一些我们的认知。从Gartner关于计算机视觉技术成熟度曲线的发展和预测,可以看出自技术发展早期,曾出现过一个波峰,即2018年。因为在神经网络基础浪潮来临时,大家认为经过算法能力的提升和算力的加持,以及可以采集到更多数据,很快就可以形成人工智能AI的大规模应用。

  然而2020年又出现了一个低谷期,这个过程当中大家认识到了,真正成熟的计算机视觉或者机器视觉的应用,需要与行业场景结合,不止是简单的行业、系统和算法相加,就能够解决问题。而是需要从数据传感到整个系统模块设计,再到与行业的结合,才能够形成一个真正落地的完整方案。这样的一个过程与技术的演进,标准规范的建设都有关系。

  对于视觉,之前我们所讲的图像视觉,是2D视觉,以人为对象。而以后AI应用更多的是机器视觉,是以机器为对象,为了让机器能够更好的感知和理解这个世界。同时利用机器可以24小时无休、快速计算的能力,为人服务解放人,所以机器视觉会是未来很重要的因素。

  为了让机器更好理解这个世界,我们就不会完全受限于原始图像信息,而是更多的把物理世界当中更丰富的3D信息提取出来,输送给机器,让机器更好理解。这也将是升级迭代非常重要的核心动力。

  另外,分享一些3D视觉应用的趋势和方向。首先经过前些年整个市场的培育,大家对于AI一些应用或者视觉的应用开始有了认知,落地实践中最常见的应用就是人脸识别,经过了初期普及,大众开始习惯了通过人脸这种比较低配合、无感的生物识别,进行身份验证。

  因此,人们开始希望把体验和效率提升,应用到更多行业,应用到更多场景当中。比如用身份识别直接支付、直接坐地铁。

  这些应用的规模和整个安全性的要求又提升了一个数量级,比人证核验的场景需求要求更高,对安全性要求也更高,就开始逐步应用到3D的技术。比如在3D刷脸支付领域当中,我在线下的刷脸支付APP上面通常都会用到3D摄像头,对于平面的假体有更好的防护能力。

  总体来看,因为3D刷脸活体和技术革新,可以带来更高的安全性。比如在更大数据库,更大底库情况下可以实现更精准的识别,同时提升识别的交互体验,对于刷脸角度有更大的容忍度,包括对于活体检测,对于伪装有更好防护能力。在更大数据库、更大规模、更高安全性普及性应用当中,3D相关的人脸识别技术将会成为主流。

  同时,获得3D信息,一定会带来成本,在感知阶段就要获取3D数据,就需要拥有3D硬件,或者获取3D数据的能力。不过随着应用规模的提升,成本就会逐渐下降。我们认为在3D硬件相对成本比较高的时期,还是需要从更强刚需领域切入,随着应用领域和范围慢慢的变大,硬件规模慢慢的变大,就会逐步降低成本。等3D硬件成本趋近于2D时,在总系统、产品中差异就趋近于零,用户就会选择更优性能,也将迎来全面取代2D的拐点。我们认为现在成本已经非常接近,预计明年或者后年就会迎来拐点。

  3D整个视觉的应用肯定从一些领域开始,逐步延伸,需要一个过程。但是在这样的一个过程当中,我们作为技术公司,需要与行业市场结合,并且在结合过程中逐步完成技术的升级和产品的迭代,最终形成不断演进的能力。

  而公司自身的整个技术研发体系是非常重要的。我们的思路是,从市场需求出发,将技术规划分成两部分,一个是实现技术领先性的规划,另外一个是支撑产品落地的规划,通过新技术的预研和产品验证,再加上产品研发的瀑布式迭代方式,形成可规模量产的产品。我们与高校和科学家团队都有非常紧密的合作。同时,底层有我们三维视觉工程化平台进行支撑。

  我们将三维视觉工程化平台分成四部分,第一是光学、另外一部分是算法,我们认为光学和算法是密不可分的,我们有原型验证和可靠性验证的设备。另外机械和电气,也是要做完整的应用产品和解决方案,所必不可少的。光学、算法、机械和电器共同形成一个产品的迭代和技术发展。

  最后三维视觉是一个完整的产业链,上游最前面是光学的起点,不管是结构光,还是各种各样光学器件,中间会有整个模组装配环节,我们从成像系统模块设计开始,再上层光学的相机系统加上3D算法形成一个完整3D软硬一体的模组,提供完整的算法能力,再嵌入到产品当中,去支撑下游的客户或者合作伙伴,形成完整的行业解决方案。

  我们认为3D视觉发展到现在,光学系统和算法系统的紧密结合,或者一个交互的一体设计是最终能够落地应用,能更快速在产业当中赋能最重要的思路,两者之间是没办法分开的。

  对于3D视觉的应用,将来还会在哪些方面产生更多的可能的变革,我们想法相对谨慎。主要是做场景重建、重建之后的结构化和数据化,也可以做医疗影像,或者做一些物体,我们整个标的是人。

  我们的理念一直是人的智能,希望最终能轻松实现从轻配合到无配合,实现机器跟人的交互变得像人与人一样自然。我们探究的是人如何去认识人、跟人交互。首先想要识别身份,然后对人的行为想法进行预测,并且不断沿着这个路径进行演进。从整个技术架构来讲,我们以“人”为标的物,我们最终希望可以做到对于人,对于物理世界中一个3D存在的身份、行为、轨迹的精细数字化的认知。

  技术演进路径上与一般的图象识别不同的是,3D有数据、有算法,同时有传感。从数据角度需要海量实战的3D数据采集和标注,要求能够建立3D数据库和相关的标准。在算法层面,包括人脸识别、表情识别、动作捕捉、体貌,从传感器侧面,需要更好地通过低成本的硬件去实现3D原始数据的获取。

  最终通过结构光的方式,包括双目,我们大家都希望能够在远距离下得到3D更高的感知精度,以覆盖更大场景,在各种各样光照条件下都能获得3D数据,且能获取到更高分辨率的数据,更能做到更小更低成本。最后都将更好地应用和服务于行业。