为什么现在的大模型都用多少B来命名,比如7B、13B之类的?

为什么现在的大模型都用多少B来命名,比如7B、13B之类的?

为什么现在的大模型都用多少B来命名,比如7B、13B之类的?为什么现在的大模型都用多少B来命名,比如7B、13B之类的。首先我得理解这里的B代表什么。B代表Billion,也就是十亿参数。所以模型名称中的数字B表示参数数量,比如7B就是70

5小时前20