通义千问2.5大模型发布

今天，阿里云正式发布了通义千问2.5大模型，相比上一版本，2.5版模型的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%，追平GPT-4 Turbo (OpenCompass榜单）。

同时，阿里云也开源了 Qwen1.5-110B 模型。这样的话，通义千问的开源模型也是包括了 0.5B、1.8B、4B、7B、14B、32B、72B、110B 八种体量的模型，可以适应不同场景用户的需求。目前，通义开源模型下载量已经超过700万。

我们试过国内外的各种开源大模型，确实通义千问效果是很能打的，也渐渐从之前用的chatglm 6b, baichuan2-13b 慢慢迁移到了 qwen1.5-14b 或 32b上来了。

也许chatglm4 或者 baichuan 的更大规模的模型效果也可以，但都是商业版了。官网的API虽然是效果更好的更大规模的模型，ToC用着可能也不算贵，但是用于ToB的解决方案的话就不合适了，大多数ToB场景都是需要私有化部署的。一旦要使用商业版必然又要引入不菲的费用。

Meta 的 llama，阿里的通义千问，算是全面致力开源生态的典范了，大大方便了没有足够能力训练和迭代大模型的中小企业。给它们点个赞 👍👍

Qwen 2.5

标签: 技术 AI