视觉检测领先者
全国咨询热线:13812953225

全栈3D视觉交互技术Untouch赋予智能设备与人、与场景的视觉交互能力

发布时间:2023-12-21 15:02:09 人气: 来源:下载雷火电竞亚洲先驱
案例介绍

  原标题:全栈3D视觉交互技术,Untouch赋予智能设备与人、与场景的视觉交互能力

  人机交互方式经过半个多世纪的技术迭代,越来越朝着人性化的方向发展,业界普遍认同的观点是继键盘、鼠标和触控操作之后,在AI时代,AI语音交互将会成为新一代主流人机交互方式,人们正在通过种种技术方法力图让身边的智能设备越来越像人。

  现阶段,语音交互技术已成为全球热潮,智能设备逐渐具备了听和说的能力,然而语音技术应用场景毕竟有限,如何让设备看见并认知这个更立体的世界呢?Untouch(未动科技)通过自主研发的3D视觉AI交互技术让这一步成为可能。

  Untouch(未动科技)创始人兼CEO孙铮说:“为什么我们最终选择做这一个项目呢?其实这是早在2010年就看到的技术趋势,当时无论是学术界还是工业界都有一个预判就是未来的智能化会体现在“云和端”,在“端”侧会有两个重要技术方向——视觉和语音。现在终端手机、机器人、无人机等所谓的智能化,就是设备能像人一样感知这样一个世界,人工智能虽然还没达到人们的预期,但起码在和人的交互上能够更便捷,人有耳朵有眼睛,我们考虑更多的是眼睛。”

  Untouch(未动科技)成立于2014年,是一家toB的技术型公司,公司的定位是基于智能视觉交互技术,赋予新型消费级智能设备与人、与场景的视觉交互能力,日前,Untouch刚发布了旗下4款3D视觉交互产品:黎曼平台—3D手势识别,欧拉平台­——3D人脸识别,笛卡尔平台——运动跟踪SLAM,及高斯平台——场景重建。

  黎曼平台基于深度图,可实现高效精准的3D手势交互功能,可以为智能手机、机器人/无人机、AR/VR等设备提供手部23个关节点识别与26自由度追踪,最大帧率90fps,支持安卓、Linux、Windows等操作系统,通过手势完成人机互动。

  与传统的手势识别技术相比,黎曼平台采用了深度学习算法LSTM(Long Short-Term Memory),把手势动作当做一个时间序列来处理,大幅度提高了识别精度与运算效率,延迟小,抗自遮挡,支持预定义手势,可定制化。另外,传统手势识别产品基于PC,而黎曼平台经过深度算法裁剪与工程优化,使得3D手势识别可以流畅精准地运行在手机等移动电子设备上,小型化、嵌入式是一大亮点。

  据悉,全球著名的ToF深度传感器厂商PMD日前宣布选择Untouch(未动科技)的黎曼平台作为中间件为客户提供非接触式的交互方案,双方合作推出了完整的手势识别软硬件一体方案。PMD公司是全球唯一将深度传感器成功植入手机的ToF技术提供商,也是Google Tango项目3D传感模块的主供应商。

  欧拉平台可实现人脸的实时建模与3D特征识别,对人脸3D表情进行实时追踪、识别与分析,识别准确度高,防欺骗性强。除了身份识别验证与表情分析,欧拉平台还可以让用户建立自己的头像,体验更有趣、好玩的社交体验。

  这项技术有什么应用场景?孙铮举例说:“据外媒消息透露,苹果的iPhone8将配备3D深度摄像头,除了进一步升级移动端的交互方式,3D人脸识别在加密技术方面相对更安全,3D需要建一个跟人脸精准匹配的模型才能通过一系列分析测试。此外,3D人脸识别技术在手机拍照、图像美化等方面也都有很大用途。”

  笛卡尔平台可实现空间计算与位置追踪功能,可以为智能手机、机器人/无人机、AR/VR等提供6 DoF inside-out位置追踪、路径规划软硬件解决方案,拥有厘米级别精度、低延迟、低功耗的特点。视觉技术与激光定位导航相比哪个更具有优势?孙铮表示视觉导航技术算法很复杂,但是更便宜一点,而激光雷达成本十分昂贵,两项技术各有优缺点可以优势互补,比如说无人驾驶汽车就需要集成几十个sensors,不仅包括视觉和激光的定位导航,可能还需要超声波、红外线等等,优劣势还要根据产品的具体需求而论。

  高斯平台基于深度摄像头与RGB摄像头,可实现实时的空间计算,重建与渲染出真实的物理场景结构,以此来实现障碍物躲避、AR追踪、三维重建等功能,为计算设备的判断与决策提供较为可靠的三维场景信息。比方说,机器人在室内要拿起桌子上的一个水杯,机器人第一步是要知道桌子在哪儿?水杯是什么?而不是有障碍物只做规避动作,高斯平台可以让机器人通过视觉技术扫描出整个房间的3D模型,赋予机器人看见感知空间环境的能力。

  随着AI时代的演进,语音交互跟视觉交互那个应用前景更好一点?孙铮认为:“终端的智能化在未来5到10年会发生颠覆性的变化,只能说两项技术的市场空间和前景都非常巨大,就好比人的眼睛和耳朵一样咱们不可以说那一方面更好,两项技术之间实际上更多的是合作需求。”

  据了解,Untouch(未动科技)创始人兼CEO孙铮早年曾是全国数学奥林匹克竞赛获奖者,保送北大数学系,在数学领域做了多年学术研究,其发现的数学定理被国际数学权威著作命名为“孙氏定理”。 后离开学术界去工业界发展,拥有17年跨国高科技企业工作经验,历任爱立信瑞典高级系统工程师,中兴西欧区副总经理、中兴芬兰分公司总经理、微软中国移动事业部总经理。CTO吴昊来自于微软亚洲研究院,是机器视觉方面的专家,研究方向覆盖多目视觉,计算摄影学等。COO柳莎莎拥有超过10年的高科技企业工作经验,曾任职微软全球消费者产品集团运营商渠道部总监,对产业链及商业运作认知深刻。小组成员多来自于微软、中科院、清华、北大等。

  Untouch(未动科技)成立于2014年,2015年完成数百万人民币天使轮融资,由英诺资本及大河资本领投,2016年底完成数百万美元Pre-A轮融资,汉能创投独家投资。