视觉检测领先者
全国咨询热线:13812953225

Meta推出实时3D头像合成方法 光线可调节

发布时间:2023-12-15 09:13:04 人气: 来源:下载雷火电竞亚洲先驱
案例介绍

  Meta 的 Codec Avatars Lab 提出了一种高保真、光线可调节的虚拟头像合成方法。

  Meta 的 Codec Avatars Lab 最近提出了一种名为 Relightable Gaussian Codec Avatars 的方法,可以合成逼真且光线可调节的虚拟头像。这样的解决方法通过可学习辐射传输和球面高斯实现了全频率反射的实时重新照明。传统的头像合成方法存在着一些挑战,例如如何准确地表示人体头部的多种材质,以及如何精确跟踪和建模运动中的底层几何体。Relightable Gaussian Codec Avatars 通过引入可重新照明的外观模型和基于3D 高斯的几何模型,解决了这些挑战。

  Relightable Gaussian Codec Avatars 的核心思想是使用可学习辐射传输来表征人体头部的多种材质。由于人类视觉对于头部外观非常敏感,因此就需要一种能够准确地表示皮肤、头发和眼睛等不一样的材质的方法。这样的解决方法使用球面高斯来实现全频率反射的实时重新照明,能够捕获3D 一致的亚毫米细节。此外,该方法还引入了基于3D 高斯的可驱动化身,使用 Gaussian Splatting 技术来渲染复杂的几何细节。

  Relightable Gaussian Codec Avatars 在实验中展现出了令人印象非常深刻的结果。重建的虚拟人物能拥有新的表情、视图和光照,包括点光源和高分辨率环境图。即使是眼睛中的光反射也能忠实地再现周围环境,不会丢失高频细节。该方法在几何表征和外观表征上都取得了优异的性能,能够更好地建模皮肤细节和发丝,并能实现高频反射。实验结果为,Relightable Gaussian Codec Avatars 可以捕获动态面部序列上的发丝和毛孔等亚毫米细节。

  Relightable Gaussian Codec Avatars 的推出为实时3D 头像合成提供了一种高保真、光线可调节的方法。该方法能够捕获头部多种材质的细节,实现了全频率反射的实时重新照明。通过引入可重新照明的外观模型和基于3D 高斯的几何模型,这样的解决方法能够精确地表示人体头部的复杂特征。这种虚拟头像合成方法在元宇宙和虚拟现实等领域具有广泛的应用前景,有助于提高使用者真实的体验和真实感。

  Relightable Gaussian Codec Avatars 是一种创新的实时3D 头像合成方法,具有高保真、光线可调节的特点。利用可学习辐射传输和球面高斯来表征人体头部的多种材质,该方法能够捕获头部细节的亚毫米级精度。实验结果为,重建的虚拟人物能够拥有新的表情、视图和光照,还可以忠实地再现周围环境。Relightable Gaussian Codec Avatars 为实时3D 头像合成提供了一种先进的解决方案,有望在元宇宙和虚拟现实等领域得到普遍应用。

  查看更多相关信息

  在MetaAI的一项开创性研究中,研究人员成功解决了动态3D头像的高保真重新调整光线的挑战。传统方法在实时应用中捕捉面部表情的细节常常有必要进行改进,尤其是对于捕捉亚毫米级细节的要求。通过将基于3D高斯函数的几何模型与革命性的可学习辐射转移外观模型相结合,研究团队超越了现有方法的局限,为头像的逼真程度树立了新的标准。

  Adobe研究人员与斯坦福大学团队联合提出了一种名为DMV3D的全新3D生成方法。该方法旨在解决增强现实、虚拟现实、机器人技术和游戏等领域中3D资产创建的共同挑战。该研究为通过统一3D重建和生成的2D和3D生成模型的领域之间的鸿沟,以解决3D视觉和图形领域中的各种挑战,提供了新的视角和可能性。

  在谷歌推出Gemini之后,Meta也不甘示弱,在网络上推出了基于其Emu图像合成模型的免费独立AI图像生成器网站——ImaginewithMeta,允许用户通过自然语言描述来生成图像。ImaginewithMetaAI网站截图Meta使用了11亿张Facebook和Instagram上公开可见的图片来训练这个AI模型,该模型能够准确的通过文本提示渲染新图像。根据你的态度以及你对AI图像合成速度的看法,这种乐趣可能会被同等程度的关注所

  Meta最近宣布推出Ego-Exo4D,这是一项具有重大影响的举措,为视频学习和多模态感知研究提供了一套基础数据集和基准套件。该数据集是MetaFAIR与ProjectAria以及15所大学两年合作努力的结晶。Ego-Exo4D是实现这一未来的关键一步,他们迫不及待地期待看到研究社区如何应用它。

  斯坦福大学与FAIRMeta的研究人员合作开发的CHOIS系统,通过引入基于语言描述、初始状态和稀疏对象航点的方法,成功解决了在3D场景中生成对象和人物同步运动的难题。该系统通过在指定的3D环境中产生逼真且可控的运动,控制了人物与对象之间的交互。将学到的交互模块应用于基于3D场景对象航点生成长期交互也将拓展CHOIS的适用性。

  MetaPlatforms和IBM最近联合推出了一个名为AI联盟的合作项目,该联盟由50多家人工智能公司和研究机构组成。这个联盟旨在推动一种被称为“开放模型”的AI发展方式,并希望在迅速增加的市场中取得进展。该联盟希望能够通过开放式创新的方式推动人工智能的发展,并为公司可以提供更多的选择和机会。

  Meta将要求广告商在其平台上发布的政治广告中是否包含任何用AI生成或数字修改的内容做披露。该公司的全球事务总裁尼克・克莱格在周二宣布了这些要求,并认为这是Meta对软件辅助内容调整的现有立场的延伸。监督委员会决定将该视频作为一个测试案例,以检验Meta的政策是否足够涵盖可能误导人们相信政治家采取了非言论行为的修改视频。

  TurnVoice 是一个命令行工具,能转换和翻译 YouTube 视频中的声音。它提供了语音转换和语音翻译的功能,可以替换特定的发言人声音,支持本地文件处理,并保留原始背景音频。该工具使用了多个语音合成引擎,并支持多种语言。TurnVoice 适用于各种场景,如创意视频制作、语音翻译等。该产品目前处于开发阶段,支持的功能和定价等详情信息请参考官方网站。

  Pitivi:基于GStreamer Editing Services的美丽而强大的视频编辑器。

  Pitivi是基于GStreamer Editing Services构建的视频编辑器。它旨在成为一款直观灵活的应用程序,既适合新手又适合专业技术人员。Pitivi的优点是其强大的视频编辑功能、直观的用户界面以及灵活的应用场景。定价方面,Pitivi无偿提供使用。

  Alpha Sender是一个一站式的电子邮件营销工具,集智能化、拖放式电子邮件编辑器、活动参与度分析等功能于一体,助力企业通过电子邮件营销获取更高转化率。它提供个性化电子邮件、拖放式电子邮件编辑器、活动参与度分析等功能,还有弹出窗口、嵌入式表单等高级营销功能,能够在一定程度上帮助企业锁定增长机会,提升销售业绩。

  Fablerr是一个Chrome插件,它是你个人的AI写手,用于提高社会化媒体的帖子和评论的质量,从而更有效地与你的受众互动。它与各种平台兼容,包括Twitter、Reddit、Gmail、YouTube等,无论您访问哪个网站,都能够在一定程度上帮助您撰写更好的帖子和评论。它能大大的提升您的在线互动效果,使您的内容更有吸引力。基本功能包括:快速高质量的自动回复,自定义语气和风格,兼容各大社交平台,智能情境感知回复等。使用场景包括社会化媒体营销,个人博客写作等。

  AirBrush Studio是一个人像编辑和生成平台。它利用AI技术,可以一键生成专业级的人像照片。基本功能包括:支持上传图片或在线拍照,一键去除背景、美白、缩小脸型等;提供多种模板和滤镜创建素材,批量处理图片;生成不同场景的人像,支持证件照、婚礼照等。优势是简单易操作,快速生成素材,大幅节省拍摄时间成本,适合个人用户、企业用户批量使用。

  千面AI模特是基于人工智能技术实现的虚拟模特服务,能够给大家提供多种模特形象,包括不同的年龄、肤色、性别、发型等,以满足多种客户的需求。致力于帮助客户降低产品拍摄成本、提高效率和创造更多的营销价值。该产品提供一键换脸、换色、换景等功能,可定制模特面孔、身材、罩杯、动作,背景等,并可交付精品成片。客户案例中有服装品牌、内衣商家、跨境电子商务等多个行业的用户反馈。产品兼顾效果和速度,受到用户好评。

  Universal Summarizer:快速概括任何网络内容-从文章到书籍!

  Universal Summarizer是一个快速概括任何网络内容的工具,包括文章、书籍、PDF、PPTX、音频和视频等。它使用最新的自然语言处理技术,以最少的单词传达最多的信息。用户都能够选择不同的文档类型,并选择输出语言。该产品的优势在于速度快、精度高、易于使用。定价方面,该产品提供API和付费服务。定位于提高用户的生产力和节省时间。

  KG_RAG:基于知识图谱的检索增强生成框架,赋能大型语言模型处理知识密集型任务

  KG-RAG是一个任务无关的框架,它结合知识图谱的显性知识和大型语言模型的隐性知识。这里,我们利用一个巨大的生物医学知识图谱SPOKE作为生物医学上下文的提供者。KG-RAG的主要特征是它从SPOKE知识图谱中提取“与提示相关的上下文”,这被定义为响应用户提示所需的最小上下文。

  Quetta Browser:隐私优先的浏览器,拥有广告和播放列表

  Quetta是一款隐私优先的浏览器,提供安全、无缝的浏览体验。拥有先进的隐私功能,如追踪器拦截和数据加密,确保您的在线活动保持机密。浏览器不会收集、存储或分享任何数据。同时,Quetta还提供强大的广告拦截技术、速度优化的浏览、无缝视频观看体验等功能。适用于个人和企业用户。

  Wavemaker是一款小说创作软件,能够轻松地构建小说结构,包括章节、场景,做笔记并轻松整理它们。支持跨平台运行,可在几乎任何设备上安装和运行。无需网络连接即可使用。拥有规划板和研究数据库功能,帮助用户组织笔记和规划小说内容。此外,还提供Snowflake工具,采用创新的Snowflake卡片方法,帮助用户将想法转化为完整的小说。

  Xmirror是一个基于AI的超级逼真图像生成工具,用户可以无限制地生成和下载自己的数字化头像。核心功能有:1)用户上传一张照,AI系统即可生成数字化头像;2)提供无限量的图像生成;3)用户可以再一次进行选择并下载喜欢的图像。主要优势是图形质量高、超级逼真,还支持多种使用场景,如业务头像、节日问候、社会化媒体形象等。

  Campedia AI Camera:Campedia是一个包含AI功能的手机照相机App

  Campedia是一个集成AI功能的手机照相机App。用户只需要对准想查询的物体拍一张照片,App就能利用AI技术自动识别图片中的物体或文字,并给出详细解释。该App包含图像识别、文本识别、语音识别等功能,可识别植物、食物、画作等上万种物体,还可回答用户提出的各类问题。