今天,阿里云正式发布了通义千问2.5大模型,相比上一版本,2.5版模型的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%,追平GPT-4 Turbo (OpenCompass榜单)。
同时,阿里云也开源了 Qwen1.5-110B 模型。这样的话,通义千问的开源模型也是包括了 0.5B、1.8B、4B、7B、14B、32B、72B、110B 八种体量的模型,可以适应不同场景用户的需求。目前,通义开源模型下载量已经超过700万。
我们试过国内外的各种开源大模型,确实通义千问效果是很能打的,也渐渐从之前用的chatglm 6b, baichuan2-13b 慢慢迁移到了 qwen1.5-14b 或 32b上来了。
也许chatglm4 或者 baichuan 的更大规模的模型效果也可以,但都是商业版了。官网的API虽然是效果更好的更大规模的模型,ToC用着可能也不算贵,但是用于ToB的解决方案的话就不合适了,大多数ToB场景都是需要私有化部署的。一旦要使用商业版必然又要引入不菲的费用。
Meta 的 llama,阿里的通义千问,算是全面致力开源生态的典范了,大大方便了没有足够能力训练和迭代大模型的中小企业。给它们点个赞 👍👍
