Note

百度电话会:文心大模型日调用量已超5000万次

· Views 39

2月28日港股盘后美股盘前,百度公布2023年第四季度及全年财报,当季除爱奇艺外的百度核心收入为274.9亿元,超出市场预期的273.1亿元,同比增长7%。集团全年营收达1345.98亿元,较上年增长9%;归属百度的净利润(non-GAAP)287亿元,同比增速达39%。

在随后进行的电话会上,百度创始人、董事长兼首席执行官李彦宏透露,百度智能云四季度总营收84亿元,其中大模型为云业务带来约6.6亿元增量收入。文心大模型的日调用量已超过5000万次,季度环比增长190%;12月,约有2.6万家企业调用文心大模型,季度环比增长150%。目前,三星、荣耀、汽车之家等知名企业均与百度达成合作。

并且,近期上线的千帆AppBuilder和千帆ModelBuilder两款MaaS产品都已取得亮眼的成绩,截至目前,千帆ModelBuilder累计精调了10000个模型。

以下为电话会分析师Q&A环节纪要:

Q1: 展望未来,管理层如何看待2024年中国的宏观经济形势?对于整个百度2024年的增长前景,管理层有什么看法?在2024年,百度总收入中AI相关收入的比例是多少?

去年我们的宏观经济环境非常具有挑战性,但我们的业务表现非常稳健。我们非常积极地投资生成式AI,但我们的非美国GAAP营业利润率同比增长,收入经验和资金增长。更重要的是,我们开始从AI和基础模型中产生增量收入。

今年,我们注意到中央和地方政府都在努力发展经济,农历新年假期我们看到了消费增长,特别是在旅游领域,但我们仍然在一个充满不确定性的宏观环境中运营。

我们的核心业务保持稳健,生成式AI和基础模型的增量收入将在2024年增加到数十亿,为我们总收入的增长做出贡献。我认为百度能够维持长期增长,速度将比中国的GDP增长更快。

Q2: 还有多少降本增效的空间?如何看待与AI相关的投资?

百度将继续专注于我们的核心业务,大幅减少对非战略业务的资源分配。此外,我们通过层级扁平化,优化了企业组织架构,不断提高我们的整体组织效率。今年我们会持续优化运营效率,确保每个人都更有生产力。

虽然AI领域的投资有所增加,但这些投资预计不会对利润率产生重大影响,我们的长期GAAP营业利润率仍然比去年同期增长了两个百分点。

Q3: AI相关的收入贡献有没有侵蚀搜索业务的份额?

我们是中国最大的搜索引擎。我们拥有近7亿月活跃用户,并在中国互联网和移动用户中建立了非常强大的品牌形象。他们依赖我们提供全面可靠的信息,因此我们拥有强大而稳定的收入和利润。

但我们也对宏观非常敏感,因为我们的广告业务覆盖了不同的垂直领域。而且,我之前提到宏观经济仍然存在不确定性,但生成式AI和LLM正在货币化和用户参与方面释放新的机会。

得益于文心一言,我们如今能够提高定位能力。生成和呈现更具相关性的广告。第四季度由此揽下数亿美元的收入,今年的增量收入将增长到数十亿美元。

生成式AI是改善用户体验的东西。我们将继续推出新功能,激发AI业务更大的潜力,所以我认为AI是纯粹的增量收入。

Q4:AI与云的产品组合是什么?如何预期今年AI业务的整体增长?

第四季度AI大模型为云业务带来的增量收入已经达到6.56亿人民币,2024全年应该增长至数十亿元人民币。我们已经看到企业越来越有兴趣使用GenAI和大语言模型开发新的应用程序和功能,因此我们正在积极构建模型,为他们的产品和解决方案赋能。

同时,我们看到来自外部客户的模型推理相关收入显著增加,虽然目前模型推理这部分收入仍然较小,但我们相信长期下来,这将成为收入增长的重要推动力。我们认为内部客户产生的收入也非常重要,因为这种收入的很大一部分是来自于模型推理。

百度在中国拥有最强大的模型训练和推理AI基础设施。因此,这种基础设施可以帮助我们的客户经济高效地构建和运行模型。我们还开发了自己的人工智能原生解决方案,例如GenAI。因此,这些应用程序正在帮助企业提高生产力和效率,除了与AI相关的增量机会,GenAI和基础模型也为我们的传统云业务带来了新的机遇。因此,我们正继续赢得CPU端的云客户和项目。

总体而言,我们会看到云业务收入在2024年比去年加速增长,我们对保持云业务的盈利能力非常有信心,企业云业务的毛利率也能够不断提高。而对于GenAI和LLM业务,市场发展仍处于非常早期的阶段。因此我们应该采取非常动态的定价策略,以快速教育市场并扩大客户渗透。我们相信,从长期来看,新业务应该比传统云业务有更高的利润率。

Q5: AI产品开发计划是怎样的?新的生成式搜索的利润增长关键指标如何?

我们正在重建包括生成式AI的所有产品,我认为GenAI和基础模型正在使我们的所有产品更加强大,过去几个月里这方面取得重大进展,初期客户对搜索的反馈不错。GenAI能让百度回答更广泛的问题,包括更复杂的、开放的和比较性的问题。只有这样,我们才能以更互动的方式提供直接和清晰的答案。

在过去的几个月里,百度搜索结果的生成不再仅仅是简单地混合一些内容和提供一些链接,越来越多的搜索结果是由文心生成的。因此,用户更频繁地与我的产品互动,并提出新问题。例如,在春节假期期间,越来越多的用户来到百度进行内容创作,无论是文本还是图片,百度帮助用户创建新年祝福信息并为他们的亲人生成个性化电子贺卡。这不是搜索引擎的典型用例,但我们看到大量用户依赖百度来完成这类任务。

未来,我们将越来越多地使用文心平台来为搜索查询生成答案。然后,我们使用多轮对话来搞清用户意图,以便通过自然语言解决复杂的用户问题。这一举措已经让搜索体验提升。

我们仍处于使用文心重构百度搜索的早期阶段。我们将继续测试并加速变革,会根据用户反馈启用功能,寻找新体验,直到准备好推出下次大规模升级。总的来说,我们相信通用智能将补充传统搜索,最终增加用户留存、参与度和在平台上的时间。

除了搜索引擎外,文心还充当了Copilot,它已经从一个帮助用户查找专利和文档的应用转变为一个一站式平台,让用户能够以多种格式创建内容。迄今为止,我认为一些新的付费用户是被这些真正的新功能所吸引。我想强调的是,我们处于使用文心重构我们的应用并构建新体验的早期阶段。同时,我们也在吸引和帮助企业建设。我们相信文心的成功依赖于广泛和积极的应用,无论是对内部开发还是对第三方广告。

Q6: 可否谈一下有关多模态功能、Sora、开设AI商店或启动AI代理的话题?这些发展是否有关键指标?AI的运行成本如何?如何进行优化提高效能?

我们手头有的芯片应该能够帮助我们将文心4.0提升到更高一个水平。我们将采取应用驱动的方式自我加强,让我们的用户和客户告诉我们在哪里应该进行改进和调整。对于我们的模型来说,可能是构建多模态代理,提高可靠性等。

价格是一个非常重要的问题。制作高性能的基础模型,经济实惠对大规模运营至关重要。我们一直在持续减少模型推理成本。现在文心3.5的推理成本大约是2020年3月版本的1%。通过这样做,越来越多的企业愿意测试、开发和迭代他们的应用程序。我们理解对许多客户来说,他们倾向于平衡效率、成本和速度,因此我们还提供了较小的语言模型,并帮助我们的客户利用Moe(专家混合模型)来获得最佳性能。通过我们端到端的方法,我们相信还有充足的空间来降低我们最强大模型的成本,并使我们的客户越来越可负担。

我们正在密切监控由文心平台上开发的应用程序数量,目前文心大模型日调用量超过5000万次。目前,来自内部应用程序的学习API成本仍然高于外部广告成本。因为来自外部应用程序的学习,不同大小的应用程序需求正在迅速增加。现在只是个开始,随着越来越多的终端用户使用它,文心将变得更加强大、更智能、更有用。

无论是通过我们自己的应用程序还是通过第三方,这将使我们能够培养一个以我们为中心的生态系统。当这些应用程序和模型被终端用户积极使用时,它们还将为我们带来可观的大模型推理收入。

Q7: 文心的企业采用率和其他产品相比如何?目前有多少企业正在使用文心构建模型和应用程序?上个季度相比增长情况如何?增长推动力有哪些?是否能够假设使用文心API集成的企业不太可能转向其他大语言模型?

不同规模与不同行业的企业在12月通过我们的云服务调用文心API的次数,环比增长了150%。文心API的成本已经超过了每天1500万美元,我们相信在中国没有其他公司能够吸引这么多客户,并接收到这么高数量的API调用请求。

企业选择我们主要是出于以下几个原因。首先,我们在建模和推理方面拥有中国最具成本效益的AI基础设施,这主要因为我们具有强大的端到端优化能力,包括GenAI和大语言模型,重塑中国公共云入口的竞争格局并增强我们的竞争优势。因此,我们在管理以GPU为中心的云方面具有强大的能力,帮助企业在云端构建和运行他们的模型。

其次,文心系列模型已经在过去几个月里吸引了许多客户,我们一直在提升文心的性能,收到了客户的正面反馈。我们还提供不同大小的文心模型,以更好地满足客户关于成本结构的需求。当然,我们是中国第一家推出模型即服务(MaaS)的公司,这是一个一站式的大型语言模型(LLM)和AI应用开发平台,使企业易于使用。我们还提供了工具包,帮助企业轻松训练或微调他们的模型,在我们的云端开发应用程序。

有了这两大原因,客户可以通过整合他们自己的专有数据,有目的地进行训练,从而降低成本,也可以直接使用文心API来支持他们自己的应用程序。因此,企业可以专注于识别用户,这些举措帮助让GenAI和LLM上取得了先发优势。

随着越来越多的客户使用我们的MaaS平台来开发旨在吸引用户的AI原生应用,将在我们这里生成并积累大量的用户和客户想法,这些想法也将允许我们进一步完善工具包。随着我们的工具变得越来越对客户友好,并帮助企业轻松地应用模型和自由开发应用程序,他们将更倾向于继续使用我们的服务。

此外,值得注意的是,在当前使用大型语言模型的阶段,对客户来说,为他们选择的模型创建合适的平台是至关重要的。因此,由于他们需要投入相当的努力来构建和积累使用大型语言模型的最佳提示(prompts),如果要切换到另一个模型,他们将不得不重新建立他们的提示库,这对他们来说是一个挑战。因此,随着我们平台的不断采用和活跃使用,客户满意度和切换成本将帮助我们提高客户留存率。

Q8: 美国的AI芯片制裁对百度的AI发展有何影响?是否有替代产品的最新消息?百度开发AI产品的方式与海外同行有何不同?可能出现哪些成就和挑战?未来几年如何才能跟上海外同行的发展脚步?

短期内,美国制裁对我们的模型开发或产品重塑、变现的影响微乎其微。正如上个季度提到的,我们已经拥有中国最强大的基础模型,我们的AI芯片储备使我们能够在接下来的几年里继续增强文心一言的性能。对于模型推理,它需要的芯片不那么强大,我们的储备以及市场上可用的芯片足以支持我们为终端用户开发许多AI原生应用。

从长远来看,我们可能无法获得最尖端的GPU,但是有了最高效的原创软件栈,用户体验将不会受到影响。在应用层、模型层和框架层都有大量的优化空间。我们的端到端早期AI架构,加上我们强大的研发团队,将允许我们使用较不先进的芯片进行高效的模型训练和基础设施建设。这为百度提供了与国内同行相比的独特竞争优势,对于企业和开发者来说,构建文心应用将是采用AI的最佳和最高效的方式。

Q9:近来文本生成视频的AI技术发展迅速,如何看待这项技术对中国AI产业发展以及对文心的影响?可否详细说明文心未来的战略路线图?目前文心在文本生成、文本转图片以及转视频方面表现如何?还需要哪些改进?

这是一个宽泛的话题,首先,多模态或者说文本、音频和视频等多模态的整合是未来基础模型发展的一个重要方向。这对于通用人工智能(AGI)来说是必不可少的,而百度已经在这一领域进行了投资,并将在未来继续这样做。

其次,如果我们观察基础模型的发展,特别是大型语言模型的市场,会发现这个市场巨大且仍处于非常早期的阶段。即使是世界上最强大的语言模型对于许多应用来说仍然不够好。对于创新的需求很大,小型模型、专家混合模型(MoE)和代理都在非常快速地演进。我们努力使这一产品更加易于所有类型的企业接入,并解决各种领域的问题。

第三,在视觉基础模型领域,值得注意的是一个具有巨大市场潜力的重要应用是自动驾驶。在这一领域,百度是先驱者和全球业务领导者。我们一直在使用扩散和变换器来训练我们的视频生成模型,以服务于自动驾驶的目的。我们还在对象分类、检测和分割方面不断取得进展,从而更好地理解物理世界和物理世界的规则。这使我们能够将道路上捕获的图像和视频转换为特定的标签,从而使自动驾驶技术更加智能、适应性强和安全。总的来说,我们的策略是开发最强大的基础模型来解决现实世界的问题,我们将继续在这一领域投资,以确保我们的领导地位。

风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

Disclaimer: The content above represents only the views of the author or guest. It does not represent any views or positions of FOLLOWME and does not mean that FOLLOWME agrees with its statement or description, nor does it constitute any investment advice. For all actions taken by visitors based on information provided by the FOLLOWME community, the community does not assume any form of liability unless otherwise expressly promised in writing.

FOLLOWME Trading Community Website: https://www.followme.com

If you like, reward to support.
avatar

Hot

No comment on record. Start new comment.