业界手机电脑测评视频 AI 苹果 iPhone 鸿蒙软件

智车数码学院游戏直播 5G 微软 Win10 Win11 专题

首页 > 智能时代>人工智能

打入 AI 底层！NUS 尤洋团队用扩散模型构建神经网络参数，LeCun 点赞

量子位 2024/2/25 20:16:37 责编：清源

评论：

扩散模型，迎来了一项重大新应用 —— 像 Sora 生成视频一样，给神经网络生成参数，直接打入了 AI 的底层！

这就是新加坡国立大学尤洋教授团队联合 UCB、Meta AI 实验室等机构最新开源的研究成果。

打入 AI 底层！NUS 尤洋团队用扩散模型构建神经网络参数，LeCun 点赞

具体来说，研究团队提出了一种用于生成神经网络参数的扩散模型 p (arameter)-diff。用它来生成网络参数，速度比直接训练最多提高 44 倍，而且表现毫不逊色。

这一模型一经发布，就迅速在 AI 社区引发强烈讨论，圈内人士对此的惊叹，毫不亚于普通人看到 Sora 时的反应。

甚至有人直接惊呼，这基本上相当于 AI 在创造新的 AI 了。

打入 AI 底层！NUS 尤洋团队用扩散模型构建神经网络参数，LeCun 点赞

就连 AI 巨头 LeCun 看了之后，也点赞了这一成果，表示这真的是个 cute idea。

打入 AI 底层！NUS 尤洋团队用扩散模型构建神经网络参数，LeCun 点赞

而实质上，p-diff 也确实具有和 Sora 一样重大的意义，对此同实验室的 Fuzhao Xue（薛复昭）博士进行了详细解释：

Sora 生成高维数据，即视频，这使得 Sora 成为世界模拟器（从一个维度接近 AGI）。
而这项工作，神经网络扩散，可以生成模型中的参数，具有成为元世界级学习器 / 优化器的潜力，从另一个新的重要维度向 AGI 迈进。

打入 AI 底层！NUS 尤洋团队用扩散模型构建神经网络参数，LeCun 点赞

言归正传，p-diff 到底是如何生成神经网络参数的呢？

将自编码器与扩散模型结合

要弄清这个问题，首先要了解一下扩散模型和神经网络各自的工作特点。

扩散生成过程，是从随机分布到高度特定分布的转变，通过复合噪声添加，将视觉信息降级为简单噪声分布。

而神经网络训练，同样遵循这样的转变过程，也同样可以通过添加噪声的方式来降级，研究人员正是在这一特点的启发之下提出 p-diff 方法的。

打入 AI 底层！NUS 尤洋团队用扩散模型构建神经网络参数，LeCun 点赞

从结构上看，p-diff 是研究团队在标准潜扩散模型的基础之上，结合自编码器设计的。研究者首先从训练完成、表现较好的网络参数中选取一部分，并展开为一维向量形式。

然后用自编码器从一维向量中提取潜在表示，作为扩散模型的训练数据，这样做可以捕捉到原有参数的关键特征。

训练过程中，研究人员让 p-diff 通过正向和反向过程来学习参数的分布，完成后，扩散模型像生成视觉信息的过程一样，从随机噪声中合成这些潜在表示。

最后，新生成的潜在表示再被与编码器对应的解码器还原成网络参数，并用于构建新模型。

打入 AI 底层！NUS 尤洋团队用扩散模型构建神经网络参数，LeCun 点赞

下图是通过 p-diff、使用 3 个随机种子从头开始训练的 ResNet-18 模型的参数分布，展示了不同层之间以及同一层不同参数之间的分布模式。

打入 AI 底层！NUS 尤洋团队用扩散模型构建神经网络参数，LeCun 点赞

为了评估 p-diff 所生成参数的质量，研究人员利用 3 种类型、每种两个规模的神经网络，在 8 个数据集上对其进行了测试。

下表中，每组的三个数字依次表示原始模型、集成模型和用 p-diff 生成的模型的测评成绩。

结果可以看到，用 p-diff 生成的模型表现基本都接近甚至超过了人工训练的原始模型。

打入 AI 底层！NUS 尤洋团队用扩散模型构建神经网络参数，LeCun 点赞

效率上，在不损失准确度的情况下，p-diff 生成 ResNet-18 网络的速度是传统训练的 15 倍，生成 Vit-Base 的速度更是达到了 44 倍。

打入 AI 底层！NUS 尤洋团队用扩散模型构建神经网络参数，LeCun 点赞

额外的测试结果证明，p-diff 生成的模型与训练数据有显著差异。

从下图（a）可以看到，p-diff 生成的模型之间的相似度低于各原始模型之间的相似度，以及 p-diff 与原始模型的相似度。

而从（b）和（c）中可知，与微调、噪声添加方式相比，p-diff 的相似度同样更低。

这些结果说明，p-diff 是真正生成了新的模型，而非仅仅记忆训练样本，同时也表明其具有良好的泛化能力，能够生成与训练数据不同的新模型。

打入 AI 底层！NUS 尤洋团队用扩散模型构建神经网络参数，LeCun 点赞

目前，p-diff 的代码已经开源，感兴趣的话可以到 GitHub 中查看。

论文地址：

https://arxiv.org/abs/2402.13144
GitHub：
https://github.com/NUS-HPC-AI-Lab/Neural-Network-Diffusion

本文来自微信公众号：量子位（ID：QbitAI），作者：克雷西

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。

下载IT之家APP，签到赚金币兑豪礼

打入 AI 底层！NUS 尤洋团队用扩散模型构建神经网络参数，LeCun 点赞

将自编码器与扩散模型结合

相关文章