视觉检测领先者
全国咨询热线:13812953225

一周AI最火论文 模型是否遗忘了我删除的数据?这个算法可以评估!

发布时间:2023-09-19 11:50:00 人气: 来源:下载雷火电竞亚洲先驱
案例介绍

  呜啦啦啦啦啦啦啦大家好,本周的AI Scholar Weekly栏目又和大家见面啦!

  AI ScholarWeekly是AI领域的学术专栏,致力于为你带来最新潮、最全面、最深度的AI学术概览,一网打尽每周AI学术的前沿资讯。

  考虑以下场景:有几个提供者,正计划为开发深度学习模型来解决分类任务提供数据。突然,提供者之一决定离开并要求删除数据,但更大的问题是,怎么确保该模型“忘记”这份数据。

  在本文中,研究人员首次提出了一个具有挑战性的问题:模型是否忘记了数据?他们假设了解查询数据集和模型输出激活的分布情况,并建立了统计方法,将目标的输出与使用不相同数据集训练的模型的输出进行比较。

  2.提供一种可用于检测模型是否忘记了特定数据的解决方案,包括当数据源有重叠时这样具有挑战性的情况

  研究人员将该方法用在了自动心脏诊断挑战赛(ACDC)的中一个心脏病理学的诊断任务上,并试验了几种基准数据集(MNIST,CIFAR-10和SVHN)。他们盼望能够鼓励人们调查模型保留的信息,并激发模型在更复杂的环境中的扩展。对细分或回归任务的扩展,计划在未来完成。

  本文介绍了Karate Club,它是一个结合了30多种先进的图形挖掘算法的Python框架,能解决无人监督的机器学习任务。该框架由Karate Club设计,有着一致的应用程序界面、可伸缩性、易用性、合理的即用型模型行为、标准化的数据集提取和输出生成等特性。该研究还通过实际示例讨论了框架背后的设计原理。

  该软件包的主要目标,是使机器学习研究人员和从业人能方便使用社团发现,节点以及整个图向量等算法。

  研究人员表明,Karate Club在处理众多现实世界中的聚类问题,分类任务效率很高,而且有很多实验结果支持这个结论。

  为了实现机器人在复杂多变的世界中的自主运行,学习适应性策略至关重要。在本文中,谷歌AI研究人员与哥伦比亚大学合作提出了一种新的元学习方法,该办法能够使机器人快速适应动态变化。

  与依赖于二阶梯度估计的元学习算法相比,研究人员引入了更耐噪声的Batch Hill-Climbing适应算子,并将其与基于进化策略的元学习相结合。针对机器人应用中很常见高噪声环境设定,该方法显着改善了动态变化的适应性,。

  与基于策略梯度的最新MAML算法相比,该算法具有更高的自适应性能。此外,研究人员在真正的四足机器人上验证了该方法,经过模拟训练的运动策略可以成功地适应两个真实世界的机器人环境,它们之间的动力学有着非常大的不同

  这项新研究提出了一个大规模的详细3D人脸数据集FaceScape,并提出了一种新颖的算法,能够从单张图片预测出精准绑定3D人脸模型。

  FaceScape数据集提供了18,760个纹理化3D面部,这些3D面部模型从938个主题中捕获,每个面部都有20种特定的表情,包含经过拓扑统一化处理的毛孔级别的面部几何图形。这些精美的3D面部模型可以表示为适用于粗糙的形状表示的3D可变形模型,还可以表示为用于详细的几何形状的位移图。

  利用大规模和高精度数据集,研究人员进一步提出了一种新的算法,该算法通过深度神经网络能轻松实现学习特定表达式的动态细节。自单个输入的图像起,所学习的关系就是我们3D人脸预测系统的基础。与以前的方法不同,预测的3D模型可以在不同的表达式下,与高度详细的几何图形进行绑定。这些前所未有的数据集和代码将向公众发布以供研究。

  2020年3月16日,艾伦AI研究所(AI2)与白宫科学技术政策办公室(OSTP)、国家医学图书馆(NLM)、陈和扎克伯格基金会(CZI)、微软研究院和Kaggle在乔治敦大学安全与新兴技术中心(CSET)的合作下,一起发布了CORD-19的第一版开源研究数据库,简称CORD-19。

  CORD-19旨在通过其丰富的元数据和结构化全文文件,来促进文本挖掘和信息检索系统的开发。自发布以来,CORD-19数据库中的资料已被下载超过75,000次,并已成为许多Covid-19文本挖掘和发现系统的基础。在本文中,研究人员描述了数据集构建的机制、重点介绍了挑战和关键设计方面的决策、概述了怎么样去使用CORD-19、并预览了围绕数据集构建的工具和即将进行的共享任务。

  他们希望该资源将继续使计算界、生物医学专家和决策者聚集在一起,来共同寻求针对Covid-19的有效治疗和管理政策。

  端到端的视觉机器人操纵的高效适应:曾经学习的行为能适应全新的现实世界吗?

  Christopher Dossman是Wonder Technologies的首席数据科学家,在北京生活5年。他是深度学习系统部署方面的专家,在开发新的AI产品方面拥有丰富的经验。除了卓越的工程经验,他还教授了1000名学生了解深度学习基础。