阿南达文事网
  • 首页
  • 文科汇编
  • 编程日记
首页 >  标签 >  大模型推理上限再突破「自适应难易度蒸馏」超越R1蒸馏,长CoT语
大模型推理上限再突破:「自适应难易度蒸馏」超越R1蒸馏,长CoT语料质量飞升

大模型推理上限再突破:「自适应难易度蒸馏」超越R1蒸馏,长CoT语料质量飞升

本文作者均来自中兴通讯无线研究院「大模型深潜」团队。团队重点攻关方向包括「推理模型构建:蒸馏与强化学习方法」、「无线通信故障定位与根因分析推理模型」、「多模态推理模型」和「推理加速技术」。核心成员毕业于中国科学技术大学、中国科学院软件研究所

11小时前10
CopyRight © 2022 All Rights Reserved 阿南达文事网沪ICP备2024057019号-16 友情链接:范文网|IT编程|电脑技术