大模型之家讯 被视作Transformer有力竞争者的Mamba架构论文被AI学术顶会ICLR 2024拒收。根据审稿意见,这篇论文存在重大问题:1、缺少长序列建模基准LRA的结果;2、将困惑度作为主要评估指标。审稿人建议Mamba研究团队增加额外的实验来对论文进行补充。
大模型之家讯 被视作Transformer有力竞争者的Mamba架构论文被AI学术顶会ICLR 2024拒收。根据审稿意见,这篇论文存在重大问题:1、缺少长序列建模基准LRA的结果;2、将困惑度作为主要评估指标。审稿人建议Mamba研究团队增加额外的实验来对论文进行补充。