大模型之家讯 新加坡国立大学尤洋教授团队与加州大学伯克利分校、Meta AI Research等机构合作开源了一种扩散模型p-diff,可生成高性能的神经网络参数,速度比直接训练最多能快44倍。在不同的架构和数据集中,其扩散过程始终如一地生成与经训练的网络相当或性能更高的模型,而额外成本最小。论文2月20日发表于arXiv预印本平台。Meta首席AI科学家杨立昆在社交平台上评论这项研究是“cute idea”。
大模型之家讯 新加坡国立大学尤洋教授团队与加州大学伯克利分校、Meta AI Research等机构合作开源了一种扩散模型p-diff,可生成高性能的神经网络参数,速度比直接训练最多能快44倍。在不同的架构和数据集中,其扩散过程始终如一地生成与经训练的网络相当或性能更高的模型,而额外成本最小。论文2月20日发表于arXiv预印本平台。Meta首席AI科学家杨立昆在社交平台上评论这项研究是“cute idea”。