国泰君安:计算机国产大模型性能领先 场景应用加速落地
- 17
- 2024-12-31 发布
国泰君安发布研报称,DeepSeek-V3的发布标志着国产AI在规模、效率和成本方面实现重大突破。DeepSeek-V3在多项评测中超越多款顶尖模型,且成本极具竞争力,其强大性能与开源策略显著提升了其市场竞争力,具备高投资价值。因此AI大模型在各行业落地的技术路径有望逐步明确,MoE架构的低成本、高性能的大模型在垂类领域中的运用潜力巨大。
国泰君安主要观点如下:
DeepSeek-V3的强大性能与开源策略显著提升了其市场竞争力,具备高投资价值。
DeepSeek正式发布了其全新系列模型DeepSeek-V3,并同步开源。该模型为自主研发的MoE架构,拥有6710亿参数和37亿激活参数,在14.8万亿token上进行了预训练。DeepSeek-V3在多个评测中超越了Qwen2.5-72B和Llama-3.1-405B等开源模型,其性能与顶尖闭源模型GPT-4o和Claude-3.5-Sonnet相媲美。尤其在知识类任务、长文本处理、代码编写和数学竞赛等方面表现出色。
DeepSeek-V3的生成速度提升和灵活的API定价策略为用户带来更高的使用价值。
通过算法和工程上的创新,DeepSeek-V3的生成吐字速度从每秒20次提升至60次,实现了3倍的性能提升,用户体验更加流畅。DeepSeek调整了API服务的价格,新的定价为每百万输入tokens0.5元(缓存命中)/2元(缓存未命中),每百万输出tokens8元。高性价比有望为DeepSeek带来了更大市场份额和收入增长。
DeepSeek-V3的开源权重和本地部署能力增强其社区支持和应用扩展性,推动了技术生态发展。
DeepSeek-V3采用FP8训练,并开源原生FP8权重,得到开源社区的广泛支持。DeepSeek提供从FP8到BF16的转换脚本,方便社区进行适配和拓展应用场景。模型权重可通过HuggingFace平台下载,进一步促进了本地部署和多样化应用。这种开放的生态系统为其在AGI普惠化方面奠定了坚实基础。
风险提示:较低定价压缩盈利空间,技术竞争加剧的风险。
相关文档
相关热门
- 艾瑞咨询:2025年中国数字化赋能实体商业实践白皮书
- 东莞证券:新“国九条”点评:驱动市场风险偏好回升,市场有望震荡向上修复 2025-04-15
- 艾瑞咨询:2025年中国制造业数字化转型行业发展研究报告
- 艾瑞咨询:2024年中国人力资源数字化行业研究报告
- 东方金诚:2024年3月宏观数据点评:一季度GDP增速超预期,3月宏观数据波动加大
- 基于文本分析的首席经济学家信心指数的构建与宏观预测
- 中国银河:北交所周报:920号段4月22日上线启用,北交所市场准入包容度将提高 2025-04-21
- 营商环境对创业者主观幸福感的影响研究——来自69个国家的经验证据
- 东吴证券:碳化硅SiC行业深度:打开AR眼镜新应用场景,半绝缘型碳化硅衬底片放量在即
- 头豹研究院:花瓣沐浴露:以“花型=功效”为底层逻辑,个性化高端化需求增长 头豹词条报告系列
- 公众环保压力与企业创新
- 上海证券:策略(权益&转债)周报:关注“安全”资产和“内循环”经济 2025-04-22
- 国金证券:流动性“新知”系列:债市的核心矛盾?
- 意外之财对新产品购买意愿的影响——感知风险的中介作用
- 科技人员流动、源企业联结与逆向知识溢入
- 东吴证券:货币失序与滞胀困局:黄金的终极信用密码
- 江苏汉邦科技股份有限公司上交所科创板IPO上市招股说明书
- 平安证券:非银行金融行业点评:资负双驱、利润高增,人保25Q1业绩亮眼
- 艾瑞咨询:2024-2025年中国共享电单车行业研究报告
- 民生证券:策略专题研究:民生研究:2024年5月金股推荐 2025-04-30