大模型之家讯 近日,浪潮信息发布了“源”Yuan-EB(Yuan-embedding-1.0)嵌入模型,该模型在C-MTEB榜单的检索任务中以78.41的平均精度夺得第一名,刷新了大模型RAG检索的最高成绩。Yuan-EB专为增强中文文本检索能力而设计,基于“源2.0”大模型的工作进行了创新,采用“源2.0-M32”大模型进行数据重写与合成,并通过索引技术、样本排序等方法构建了高质量微调数据集,有效提升RAG系统的检索精度。
C-MTEB是业内最权威的嵌入模型测试榜单,其中检索任务是RAG场景下最为重要、应用最广泛的任务能力。“源”Yuan-EB在医疗、新闻、电商、娱乐等8个中文文本数据集上实现了业界领先的海量文本检索精度。该模型通过数据准备与模型微调两方面的技术创新,实现了模型精度的大幅提升,为RAG流程的信息检索准确性、处理大规模数据的效率等方面带来了显著提升。
目前,“源”Yuan-EB已经在开源社区和企业大模型开发平台元脑企智EPAI中全面开放下载。用户可以在该平台中快速使用“源”Yuan-EB,并结合EPAI自研的多阶段RAG技术,零代码、低成本地基于企业数据构建大模型知识库应用。元脑企智EPAI是浪潮信息为企业AI大模型落地应用打造的高效、易用、安全的端到端开发平台,支持调度多元算力和多模算法,帮助企业高效开发部署生成式AI应用。
原创文章,作者:志斌,如若转载,请注明出处:http://damoai.com.cn/archives/7971