3D 测量

的卢深视CEO户磊：3D视觉将迎来全面取代2D的拐点

发布时间：2023-10-17 10:52:58 人气：来源：下载雷火电竞亚洲先驱

案例介绍

应用领域和范围、硬件规模逐渐加大，3D应用成本将随之降低。当3D硬件成本趋近于2D时，用户将更多的选择更优性能。

10月16日，FUS猎云网2020年度AI产业峰会在北京金茂万丽酒店隆重举行，近百位知名资本大咖，独角兽创始人、创业风云人物及近千位创业者共聚一堂。

峰会上，的卢深视CEO户磊受邀发表《技术落地的试金石，规模与体验让3D视觉成为机器标配的眼睛》的主题演讲，他表示：由于神经网络基础浪潮的来临，大众认为经过算法能力的提升和算力的加持，以及更多的数据采集，很快就能形成人工智能AI的大规模应用，因而计算机视觉技术的发展，曾在2018年出现过一个波峰。

然而在2020年却又步入了低谷期，是因为在发展过程中大家认识到了，真正成熟的计算机视觉或者机器视觉的应用，需要与行业场景结合，不止是简单的行业、系统和算法相加，就能够处理问题。而是需要从数据、传感到总系统设计，再到与行业的结合，才能够形成一个真正落地的完整方案。这个过程与技术的演进，标准规范的建设都有关系。

户磊强调，3D视觉帮助机器实现更好的人机交互，这是人工智能升级迭代的核心动力之一。经过前些年的市场培育，大家对于AI应用或者视觉应用开始有了认知，并养成了一定的用户习惯，开始希望将体验和效率提升，应用到更多行业，应用到更多场景当中。而这些应用对规模和安全性的要求又提升了一个量级，因此产生并增加了对3D技术的需求。

在3D硬件相对成本较高的时期，还是需要从更强刚需领域切入。随着应用领域和范围越来越大，硬件规模越来越大，3D的应用成本也将逐渐降低。当3D硬件成本趋近于2D时，在整个系统、产品中差异就趋近于零，用户就会选择更优性能，也将迎来3D全面取代2D的拐点。

的卢深视创建于2015年，专注于3D视觉，专攻毫米级三维成像、三维重建、三维测量、空间定位跟踪、识别、理解，六大核心技术方向。总部位于北京，研发中心和产品中心位于合肥和杭州，并在深圳建有营销中心，拥有十余个服务网络，能够提供本地化服务。的卢深视始终坚持3D需要软硬件一体的设计，通过系统的垂直整合以及系统优化的提供，可大规模普及交互距离内的高精准3D感知系统和解决方案。

本次峰会由猎云网主办，猎云资本、企业管家、猎云财经、锐视角协办。峰会以“AI UP！”为主题，聚焦人工智能产业的应用，通过展示多领域多维度人工智能技术和产品以及分享讨论AI在不同场景中最新落地应用，展现人工智能产业落地应用的最新成就；并围绕人工智能产业的“进击”与“破圈”，探讨AI技术如何为产业赋能。

我们的卢深视从事的方向更多是做关于人的交互、识别和感知，今天给大家分享一些我们的认知。从Gartner关于计算机视觉技术成熟度曲线的发展和预测，可以看出自技术发展早期，曾出现过一个波峰，即2018年。因为在神经网络基础浪潮来临时，大家认为经过算法能力的提升和算力的加持，以及可以采集到更多数据，很快就可以形成人工智能AI的大规模应用。

然而2020年又出现了一个低谷期，这个过程当中大家认识到了，真正成熟的计算机视觉或者机器视觉的应用，需要与行业场景结合，不止是简单的行业、系统和算法相加，就能够解决问题。而是需要从数据传感到整个系统模块设计，再到与行业的结合，才能够形成一个真正落地的完整方案。这样的一个过程与技术的演进，标准规范的建设都有关系。

对于视觉，之前我们所讲的图像视觉，是2D视觉，以人为对象。而以后AI应用更多的是机器视觉，是以机器为对象，为了让机器能够更好的感知和理解这个世界。同时利用机器可以24小时无休、快速计算的能力，为人服务解放人，所以机器视觉会是未来很重要的因素。

为了让机器更好理解这个世界，我们就不会完全受限于原始图像信息，而是更多的把物理世界当中更丰富的3D信息提取出来，输送给机器，让机器更好理解。这也将是升级迭代非常重要的核心动力。

另外，分享一些3D视觉应用的趋势和方向。首先经过前些年整个市场的培育，大家对于AI一些应用或者视觉的应用开始有了认知，落地实践中最常见的应用就是人脸识别，经过了初期普及，大众开始习惯了通过人脸这种比较低配合、无感的生物识别，进行身份验证。

因此，人们开始希望把体验和效率提升，应用到更多行业，应用到更多场景当中。比如用身份识别直接支付、直接坐地铁。

这些应用的规模和整个安全性的要求又提升了一个数量级，比人证核验的场景需求要求更高，对安全性要求也更高，就开始逐步应用到3D的技术。比如在3D刷脸支付领域当中，我在线下的刷脸支付APP上面通常都会用到3D摄像头，对于平面的假体有更好的防护能力。

总体来看，因为3D刷脸活体和技术革新，可以带来更高的安全性。比如在更大数据库，更大底库情况下可以实现更精准的识别，同时提升识别的交互体验，对于刷脸角度有更大的容忍度，包括对于活体检测，对于伪装有更好防护能力。在更大数据库、更大规模、更高安全性普及性应用当中，3D相关的人脸识别技术将会成为主流。

同时，获得3D信息，一定会带来成本，在感知阶段就要获取3D数据，就需要拥有3D硬件，或者获取3D数据的能力。不过随着应用规模的提升，成本就会逐渐下降。我们认为在3D硬件相对成本比较高的时期，还是需要从更强刚需领域切入，随着应用领域和范围慢慢的变大，硬件规模慢慢的变大，就会逐步降低成本。等3D硬件成本趋近于2D时，在总系统、产品中差异就趋近于零，用户就会选择更优性能，也将迎来全面取代2D的拐点。我们认为现在成本已经非常接近，预计明年或者后年就会迎来拐点。

3D整个视觉的应用肯定从一些领域开始，逐步延伸，需要一个过程。但是在这样的一个过程当中，我们作为技术公司，需要与行业市场结合，并且在结合过程中逐步完成技术的升级和产品的迭代，最终形成不断演进的能力。

而公司自身的整个技术研发体系是非常重要的。我们的思路是，从市场需求出发，将技术规划分成两部分，一个是实现技术领先性的规划，另外一个是支撑产品落地的规划，通过新技术的预研和产品验证，再加上产品研发的瀑布式迭代方式，形成可规模量产的产品。我们与高校和科学家团队都有非常紧密的合作。同时，底层有我们三维视觉工程化平台进行支撑。

我们将三维视觉工程化平台分成四部分，第一是光学、另外一部分是算法，我们认为光学和算法是密不可分的，我们有原型验证和可靠性验证的设备。另外机械和电气，也是要做完整的应用产品和解决方案，所必不可少的。光学、算法、机械和电器共同形成一个产品的迭代和技术发展。

最后三维视觉是一个完整的产业链，上游最前面是光学的起点，不管是结构光，还是各种各样光学器件，中间会有整个模组装配环节，我们从成像系统模块设计开始，再上层光学的相机系统加上3D算法形成一个完整3D软硬一体的模组，提供完整的算法能力，再嵌入到产品当中，去支撑下游的客户或者合作伙伴，形成完整的行业解决方案。

我们认为3D视觉发展到现在，光学系统和算法系统的紧密结合，或者一个交互的一体设计是最终能够落地应用，能更快速在产业当中赋能最重要的思路，两者之间是没办法分开的。

对于3D视觉的应用，将来还会在哪些方面产生更多的可能的变革，我们想法相对谨慎。主要是做场景重建、重建之后的结构化和数据化，也可以做医疗影像，或者做一些物体，我们整个标的是人。

我们的理念一直是人的智能，希望最终能轻松实现从轻配合到无配合，实现机器跟人的交互变得像人与人一样自然。我们探究的是人如何去认识人、跟人交互。首先想要识别身份，然后对人的行为想法进行预测，并且不断沿着这个路径进行演进。从整个技术架构来讲，我们以“人”为标的物，我们最终希望可以做到对于人，对于物理世界中一个3D存在的身份、行为、轨迹的精细数字化的认知。

技术演进路径上与一般的图象识别不同的是，3D有数据、有算法，同时有传感。从数据角度需要海量实战的3D数据采集和标注，要求能够建立3D数据库和相关的标准。在算法层面，包括人脸识别、表情识别、动作捕捉、体貌，从传感器侧面，需要更好地通过低成本的硬件去实现3D原始数据的获取。

最终通过结构光的方式，包括双目，我们大家都希望能够在远距离下得到3D更高的感知精度，以覆盖更大场景，在各种各样光照条件下都能获得3D数据，且能获取到更高分辨率的数据，更能做到更小更低成本。最后都将更好地应用和服务于行业。

返回列表相关案例