阿里云发布开源模子Qwen2,称超百度文心4.0等繁多中国厂商闭源大模子
(原标题:阿里云发布开源模子Qwen2,称超百度文心4.0等繁多中国厂商闭源大模子)
图片起头:视觉中国
开源大模子在AI竞赛中再扳回一城。
6月7日,阿里云发布开源模子Qwen2-72B。凭据官方声称,Qwen2不仅跳跃此前Meta推出的开源模子Llama3-70B,也跳跃了百度文心4.0、字节豆包pro、腾讯混元pro等繁多中国厂商的闭源大模子。
据阿里云先容,本次开源的Qwen2-72B大模子在当然言语领略、常识、代码、数学及多言语等多项智商上均显耀超过现时早先的开源模子,包括阿里云在4月底开源的Qwen1.5最大的模子Qwen1.5-110B。
图片起头:阿里云
阿里云通义千问团队闪现称,Qwen2已矣了举座性能的代际飞跃。该系列包含5个尺寸的预检会和辅导微调模子,包括Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B和Qwen2-72B。扫数尺寸模子齐使用了GQA(分组查询珍办法)机制,以便让用户体验到其带来的推理加速和显存占用裁减的上风。此外,模子的多言语智商和高下文长度复旧均得到了擢升。
当今扫数效户齐不错在阿里旗下的AI模子社区魔搭社区和开源平台Hugging Face上免费下载开源模子Qwen2-72B。
在Qwen2发布后,Hugging Face蚁合独创东谈主兼首席奉行官Clement Delangue也很快在酬酢平台X上发帖暗示,其开源大模子榜单迎来了新的第一。
许多海外的成就者也纷纷暗示海涵,“这个开源大模子就如同今天SpaceX到手辐照的星舰相似伏击!”一位网友辩驳称。
通义千问Qwen系列开源模子正在成为Meta的Llama系列大模子除外的另一选项,在海外成就者社区中也得到了较高的沟通度。据官方信息,通义千问Qwen系列模子在近一个月内的总下载量翻了一倍,已冲破1600万次,全球开源社区出现了跳跃1500款基于Qwen二次成就的模子。
若是Meta是海外开源阵营的执旗者,那么国内则站着阿里云、腾讯等国内大厂以及百川智能、智谱AI等初创企业。
他们以为开源梗概裁减使用门槛,带动大模子生态的高贵,大多接纳的是开源和闭源模子并行的战略。阿里云此前除了开源1100亿参数的Qwen1.5-110B模子,还同期发布了闭源大模子通义千问2.5。
而大模子闭源的拥趸则以为,为了保捏早先,选用闭源的企业会参增加半的本钱在模子的质料和安全上,并祭出了一个强大的例子——接纳十足闭源的OpenAI。
百度CEO李彦宏曾屡次暗示,大模子开源道理不大,闭源模子在智商上会捏续地早先,而不是一时地早先,“开源模子会越来越过期”。
在这番发言后不久,期权平台Meta就推出了那时智商最强的开源模子Llama 3,具备8B和70B两个版块。
阿里云CTO周靖东谈主在恢复开闭源之争时曾指出,“Llama 3把竞争的水位拉得很高。坦诚地说,不是扫数闭源公司的模子齐能比得上开源模子,至少闭源模子要能跳跃开源模子水准,才有契机参与这么的沟通。”
在发布本次开源模子时,周靖东谈主再次强调,坚捏开源通达是阿里云的伏击战略,阿里云但愿让算力更普惠、让AI更普及。
除了这些上价值的标语除外,把先进的大模子开源对阿里云来说也有好多试验道理。
一方面,手脚头部云厂商,阿里云具备充足的算力、通讯网罗等AI基础形式,梗概复旧开源大模子的研发和检会。另一方面,在“AI运行、环球云优先”的战略下,阿里云但愿通过开源模子蛊卦更多的企业和成就者,使用其供应的基础形式,带动其云估计业务的增长。
阿里巴巴集团董事长蔡崇信5月31日在上海举办的摩根大通中国峰会中谈及,“在业界,阿里巴巴可能是少许数同期领有强大东谈主工智能业务和早先云估计业务的公司之一。”他指出,东谈主工智能与云估计的缜密吞并至关伏击。当用户在社区内使用开源东谈主工智能器具时,他们当然需要估计资源,这亦然阿里云估计收入得以增长的伏击推能源。
因此,阿里云有充足的能源积极鼓吹其开源模子为成就者所接受,以便加速其云估计业务的销售。
据阿里2024财年Q4及全年岁迹,阿里云季度收入增长3%至255.95亿元,中枢环球云居品收入已矣两位数增长,AI有关云居品已矣三位数增长。在事迹会上,贬责层瞻望云业务下半年将规复至两位数增长,主要受AI新址品的运行。