国金证券:计算机行业周报:Qwen赶超Llama成为全球第一开源模型,DeepSeek发布数学推理模型

  • 21
  • 约 1.32MB
  • 约 0页
  • 2025-05-05 发布
  • 0金币
  • 预览图可能不清晰,实际为下载为清晰文档
本周观点4月29日,阿里Qwen3系列模型开源发布,包含两款MoE模型(235B/20B)以及六款密集模型(0.6B/1.7B/4B/8B/14B/32B),其中旗舰模型Qwen3-235B-A22B与DeepSeek-R1、o1、o3-mini、Grok-3和Gemini-2.5-Pro等顶级模型表现相当。Qwen3的部署成本还大幅下降,仅需4张H20即可部署满血版,显存占用仅为性能相近模型的三分之一。阿里通义已开源了200余个模型,全球下载量超3亿次,Qwen衍生模型数超10万个,已超越Llama,成为全球最大的开源模型族群。本周,DeepSeek-Prover-V2发布,是一款专为「数学AI编程语言」Lean4打造的开源大语言模型,专注于形式化定理证明,参数规模微7B/671B,它能够将非形式化和形式化的数学推理融合到一个统一的模型中。从商业模式的角度来看,互联网大厂能够凭借基座模型和算力优势,通过MaaS嵌入既有应用或云平台,更容易实现规模化变现;垂类企业(如医疗、金融、企业服务等)拥有更丰富的客户资源和行业know-how,有望深耕场景化Agent。短期来看,特朗普关税政策对...

国金证券:计算机行业周报:Qwen赶超Llama成为全球第一开源模型,DeepSeek发布数学推理模型.pdf

  1. 1、本文档共0页,其中可免费阅读0页,需付费后方可阅读剩余内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。

相关文档

相关热门