欢迎光临
共 1 篇文章

标签:mha

魔改ICML2024,小模型逆袭大模型!

  彩云科技团队 投稿   量子位 | 公众号 QbitAI   改进Transformer核心机制注意力,让小模型能打两倍大的模型!   ICML 2024高分论文,彩云科技团队构建DCFormer框架,替换Transformer核心组件...