昆仑万维2050研究院与北大联合发布MoE++，性能与推理速度全面提升

志斌 • 2024年10月22日上午10:11 • 人工智能

大模型之家讯近日，昆仑万维2050研究院颜水成团队与北京大学袁粒团队联合推出了新一代的混合专家模型框架MoE++，该框架相较于传统的MoE（混合专家模型）在推理速度和性能上都有显著提升。MoE++引入了“零计算量专家”的创新设计，能够有效降低计算成本，同时提升复杂任务处理的能力，使其更易于在大规模语言模型（LLMs）中部署。

昆仑万维2050研究院与北大联合发布MoE++，性能与推理速度全面提升

MoE++作为一个通用框架，能无缝集成至任何现有的MoE模型中，尤其在三个关键方面表现突出：(1) 通过允许每个Token选择可变数量的专家，甚至完全跳过当前MoE层，MoE++实现了显著的计算成本降低；(2) 减少简单Token使用的专家数量，使复杂Token得到更多专家资源，从而释放更大的性能潜力；(3) “零计算量专家”占用极小的参数量，使得在每个GPU上可以同时部署所有的零计算量专家，避免了专家负载不均的问题。

实验数据表明，MoE++在0.6B到7B参数规模的模型上实现了1.1到2.1倍的专家吞吐速度，同时在性能上全面超越传统的MoE模型。这一模型现已开源，论文和相关代码可在Arxiv和GitHub上获取。

MoE++框架的发布为大规模语言模型的发展提供了新的技术路径，将进一步推动自然语言处理和AI模型的创新发展。

原创文章，作者：志斌，如若转载，请注明出处：http://damoai.com.cn/archives/7661

赞 (0)

0 0

智源研究院发布原生多模态世界模型Emu3

上一篇 2024年10月21日下午1:51

商汤科技发布全员信，确定“大装置-大模型-应用”的三位一体新战略

下一篇 2024年10月22日下午1:32

商汤科技AIS 4.0智能服务器发布，智慧园区迎来效能革命

大模型之家讯近日，商汤科技正式发布了其新一代面向智慧园区场景的智能服务器——AIS 4.0。这款服务器集成了领先的多模态大模型能力，实现了软硬件的全面国产化，为各类园区的综合管理…

志斌
人工智能 2024年11月15日
人工智能

广州立法、专家呼吁，无人驾驶急需再加速

2024进入盛夏之后，无人驾驶的讨论也随之升温。萝卜快跑让无人驾驶出租车正式跑进大众视野，民声在沸沸扬扬的争议中割裂成两派：支持者认为无人车干净整洁，既不会遇上超雄司机绕路、宰客…

志斌
2024年8月7日
人工智能

特斯拉亮相2025电博会：帮助人类加速迈向可持续的富足时代

大模型之家讯 9月19日至21日，2025中国国际消费电子博览会在青岛国际会展中心（红岛馆）盛大举行，本届电博会以“智联万物 AI赋未来”为主题，瞄准当今全球消费电子产业前沿与未来…

志斌
2025年9月19日
人工智能

四大重大升级，一系列优化|OpenAI开发者大会全程回顾

“这座城市对我们和整个科技行业都很重要，我们期待在这里继续发展，因此我们今天有一些很棒的事情要宣布……” —— 萨姆·奥尔特曼（Sam Altman）北京时间11月7日凌晨2点，…

欧玉娇
2023年11月9日
人工智能

OpenAI凌晨更新GPT-5.1，修复“没感情的AI”

大模型之家讯北京时间11月13日凌晨，OpenAI正式推出GPT-5.1系列模型，包括GPT-5.1 Instant与GPT-5.1 Thinking两款主要版本，并计划后续发布…

志斌
2025年11月13日
人工智能

Meta低调收购Play AI 加码语音AI赛道布局

大模型之家讯 7月11日，Meta通过官方渠道宣布已完成对AI语音技术公司Play AI的全资收购，交易细节尚未公开。此次收购被视为Meta在多模态AI竞赛中的关键落子，其语音交互…

王殿漪
2025年7月15日
人工智能

中科曙光亮相世界智能产业博览会：液冷技术成亮点，推进高效算力应用

大模型之家讯 6月20日，中科曙光在2024世界智能产业博览会上登场，带来了其基于“立体计算”体系能力的创新成果。公司展示了先进的计算、存储、液冷多线产品及AI、智慧工业等前沿解决…

志斌
2024年6月21日
人工智能

商汤大模型赋能智能亚运，AI+AR黑科技燃动杭州

大模型之家讯 9月23日，杭州第19届亚运会即将隆重开幕。届时，广大观众不仅将迎来一届“中国特色、亚洲风采、精彩纷呈”的体育盛会，也将享受一次极具未来感的科技盛宴。“智能”是本届杭…

志斌
2023年9月21日
人工智能

新石器完成逾6亿美元D轮融资创中国自动驾驶领域融资记录

大模型之家讯全球最大的L4级无人城配（RoboVan）解决方案提供商——新石器公司(Neolix)今日宣布完成逾6亿美元D轮融资，本轮融资由阿联酋磊石资本（Stone Ventu…

志斌
2025年10月23日
人工智能

小鹏汽车迎新血，前阿里达摩院自动驾驶业务负责人袁婷婷加盟任高级总监

大模型之家讯小鹏汽车近日宣布，前阿里巴巴达摩院自动驾驶业务负责人袁婷婷正式加盟，出任自动驾驶产品高级总监一职。小鹏汽车创始人何小鹏在微博上热烈欢迎新成员的加入，并表示期待袁婷婷的…

志斌
2024年6月20日

发表回复

志斌

数码科技领域深耕多年的专业管理者与技术服务专家，现任大模型之家主编、速途网资深编辑、元宇宙研究院分析师。专注于人工智能、消费电子与IDC行业的深度报道，凭借广泛科技圈人脉，包括媒体、公关、分析师及企业高层，持续引领行业洞察与分析。商务合作咨询： Qiaodao007

1.1K posts

0 comments