• 研究观点
    • 软件

中国软件行业 DeepSeek-R1助力AI变现提速

  • 文章

汇丰前海证券研究部A股IT软件行业研究主管刘逸然认为,DeepSeek-R1拥有低成本优势和强大的推理能力,有望助力AI变现提速。

刘逸然-证券分析师
张恒-证券分析师

DeepSeek-R1是国内AI初创公司深度求索(DeepSeek)开发的推理模型,于2025年1月发布。作为推理模型(不同于通用模型),其首先生成思维链以提高回答的准确性,进而给出最终答案。该公司资料显示,这一开源模型表现出强大的性能(可媲美OpenAI o1),而在模型训练和API方面的成本大幅降低(输出成本比o1低96%),主要得益于DeepSeek的工程创新。DeepSeek-R1显著降低了应用程序开发人员的门槛,并支持具有高度推理要求的复杂应用。

DeepSeek-R1的工程创新:DeepSeek-R1的基本性能已超越多款现有的主流AI模型。根据DeepSeek的技术报告,我们认为有两个关键的工程创新:(1)采用基于GRPO(群体相对策略优化,一种强化学习算法)的纯强化学习方法;(2)引入少量冷启动数据和多阶段训练流程。

DeepSeek-R1与其他主流AI模型性能比较

DeepSeek-R1与其他主流AI模型性能比较

极低的成本:得益于DeepSeek在负载均衡策略和连接优化等方面的工程创新,该模型的算力利用效率显著提升。因此,其训练成本仅为600万美元,远低于OpenAI o1。尽管如此,DeepSeek-R1的性能仍接近OpenAI o1。此外,DeepSeek-R1的使用成本更低,其公有云API成本仅约为OpenAI o1的4%(资料来源:DeepSeek)。

AI应用变现的影响:相比字节跳动的大语言模型豆包(擅长内容生成和多模态),DeepSeek-R1在逻辑推理方面表现更突出。在R1发布之前,国内大语言模型的逻辑能力不足以支持AI生产力工具,AI应用变现的进展不及市场预期。我们认为,R1的高性能和极低的token成本有望显著降低AI的训练/推理成本,助力AI技术扩展并带来多元化的AI应用。

我们认为DeepSeek-R1的发布解决了三个关键的行业痛点:(1)降低成本门槛;(2)推理能力大幅提升;(3)开源模型更加便捷。

我们认为,AI智能体仍是短期内的变现焦点。美国企业AI智能体的商业化已经启动,除OpenAI Operator(类似智能私人秘书)之外,多家软件公司推出了面向不同子领域的AI智能体,如Salesforce的Agentforce和ServiceNow的Now Assist。国内软件厂商亦纷纷推出国产AI智能体。随着软件龙头企业不断探索AI智能体的商业模式,更多成熟的大语言模型和应用纷纷涌现,我们看好付费用户数和客单价(ARPU值)提升前景。

需要帮助?

我们提供多种业务及产品,致力为您开创新机。