400万token新SOTA!英伟达UIUC联手:兼顾长短上下文顶尖性能
新智元报道编辑:犀牛【新智元导读】来自英伟达和UIUC的华人团队提出一种高效训练方法,将LLM上下文长度从128K扩展至惊人的400万token SOTA纪录!基于Llama3.1-Instruct打造的UltraLong-8B模型,不
10小时前00
新智元报道编辑:犀牛【新智元导读】来自英伟达和UIUC的华人团队提出一种高效训练方法,将LLM上下文长度从128K扩展至惊人的400万token SOTA纪录!基于Llama3.1-Instruct打造的UltraLong-8B模型,不