分析师/竹心

校对/Tina

策划/Eason

当OpenAI还在用GPT-5刷新参数记录，谷歌用Gemini 3展示多模态炫技时，字节、阿里、腾讯用三条不同的工业化路线，回答了AI时代最根本的问题：如何把实验室里的探索阶段成果，变成生产线上的标准化产品？

2025年，中国AI核心产业规模突破9000亿元，企业数量达5300家。在922亿元融资热潮后，赛道从“百模大战”进入“淘汰赛”。阿里、腾讯、字节几大巨头合计的市场份额，形成明显第一梯队。

这三家公司走出了三条不同的路径。字节选择“应用驱动”，让业务倒逼技术；阿里押注“基础设施赋能”，要做AI时代的基础设施提供商；腾讯深耕“生态滋养”，用社交土壤培育AI果实。

三条路线看似方向各异，目标却是一致的：通过标准化、自动化、模块化的生产流程，把AI开发的边际成本降到最低，把迭代速度提到最高。

从“手工作坊”到“生产流水线”

2012年，谷歌训练“猫脸识别”模型，动用了1.6万个CPU核心，耗时三天。那时，AI还处于探索阶段——依赖研究人员的手工调参，每次训练都像一次实验。

到了2025年，抖音推荐算法团队每天训练上百个模型变体，每个模型从数据采集到线上A/B测试，几小时内就能跑完一个完整的闭环。AI已经进入了工程化阶段——原料输入标准化，反应过程可控，产品输出可预测。

这个转变背后，是三股力量在推动。

第一股力量来自模型复杂度的指数级增长。2023年，主流大模型千亿参数；2025年，万亿参数成为标配。参数量每增加一个数量级，训练成本增加几十倍。没有工业化流程，单次训练就可能拖垮一家创业公司。

第二股力量来自应用场景的极度碎片化。阿里云智能总裁张建锋指出，“通用大模型解决了60%的问题，但剩下的40%是各行各业的‘长尾需求’。金融风控需要精准性，医疗诊断需要可解释性，工业质检需要实时性。每个场景都需要定制化。”

这意味着AI生产不能搞“一刀切”，必须是“柔性制造”——在标准化的基础流程上，快速适配不同需求。

第三股力量来自成本的刚性约束。2025年全球企业在AI上投入超5000亿美元，但只有30%看到明确回报。剩下的70%面临持续投入但产出模糊的挑战。腾讯云副总裁张正友分析，当单次模型训练要花费千万级别时，企业必须思考：如何用一次训练的资源，产出多个模型的价值？

这就是AI工厂要解决的问题。

行业拐点已经出现。2025年第三季度，中国AI市场规模突破2000亿元，同比增长45%。其中，AI平台和工具层增速达78%，远超算法层和应用层。

Gartner高级研究总监吕俊的判断很直接：“平台层的高速增长，就是AI工业化的直接体现。企业已经不满足于买现成的模型了，它们想要的是自己的‘模型生产线’。”

在这场生产线建设中，三家巨头选择了三个不同的起点。

字节AI的“双核处理器”：Seed与Flow

2023年底，字节在AI重组期间设立了两个引擎：Seed和Flow。

Seed负责向下扎根，研发底层技术，掌舵人是前Google DeepMind研究副总裁吴永辉。Flow负责向上生长，推动产品落地，由产品副总裁朱文佳主导。两个人直接向CEO梁汝波汇报，形成了字节AI的“双核处理器”。

这套架构背后的逻辑，字节自己总结为四个字：业务倒逼技术。

抖音、今日头条、剪映——这些超级应用每天产生的海量实时需求，反过来推动字节搭建了一套高效的AI生产体系。从用户行为发生到算法模型更新，最快只需要15分钟。

15分钟是怎么跑出来的？依据来自于字节的AI流水线五个标准化模块的串联。

数据采集层每天处理超过100PB的用户行为数据。光是抖音，单日视频播放就超过100亿次，每次播放产生几十个特征维度。

特征工程层的自动化平台叫“FeatureStore”，管理着超过10万个特征，还能自动发现哪些新特征对模型效果有提升。

模型训练层用的是分布式框架“BytePS”，支持万卡级训练。千亿参数模型的全量训练从一周压缩到了12小时，增量训练只需要2-3小时。

A/B测试层的实验平台“Libra”，日均支持上万次测试。每个算法工程师都可以像做科学实验一样，提出假设、分析结果。

在线服务层的推理平台“ByteServe”支撑着百万QPS的实时推理。峰值时期，抖音推荐系统每秒要为数亿用户做出数十亿次决策。

五个模块，环环相扣。数据驱动模型，模型产生效果，效果反馈数据。闭环越短，迭代越快。

剪映是这套体系的一个缩影。2025年3月，剪映上线了“AI智能剪辑”功能，从立项到上线只用了45天。放在传统公司，这样一个复杂的AI功能至少需要半年。

数据团队用了7天，从1000万条用户剪辑行为中提取出训练数据集；算法团队用了14天，在视觉大模型的基础上完成微调；A/B测试结果显示，使用AI剪辑的用户视频发布率提升了3倍，平均剪辑时间从30分钟缩短到3分钟；最后10天全量上线，支撑起日均千万级的调用。如果没有标准化的数据管道、自动化的训练平台、统一的服务框架，每个环节都得从头搭建，时间至少翻三倍。

字节AI工厂的核心竞争力，可以归结为三个词：短闭环、快迭代、强反馈。AI生产周期平均2-4周，行业平均是3-6个月；抖音推荐算法每天进行上百次模型更新，能实时捕捉用户兴趣的变化；超级应用提供的反馈数据，让每次算法调整在几小时内就能看到实际影响。

豆包是这套体系面向C端的一次重要输出。2024年5月，豆包正式发布，定价0.0008元/千Tokens，比当时行业均价便宜了99.3%。这个价格让豆包迅速占领了市场。

到2025年底，豆包App的月活达到了2.27亿，稳居行业第一。日均Token调用量从2024年5月的1200亿，增长到2025年12月的超50万亿，7个月增长了33倍以上。背后是字节50多个业务的规模化使用，包括抖音、头条这些数亿DAU的超级产品。除夕当天，豆包的总互动达到了19亿次。它正在重构“搜索-决策-交易”的用户行为链路，成为连接字节生态各业务板块的枢纽。

在投资策略上，字节跟阿里、腾讯走了不同的路——专注自研，没有在大模型创业公司中布局。

但字节的AI之路并非一帆风顺。

CEO梁汝波在2024年提到过一个让人警醒的例子：一个内部系统的简单需求，初始评估需要1000人天，深入分析后发现，只需要1个人15天就能完成。这种组织效率的下降，在大公司里并不罕见，但发生在以效率著称的字节身上，格外值得注意。

更让人警惕的是对机会的敏感度变化。公司层面的半年度技术回顾，直到2023年才开始系统讨论GPT。而那些做得比较好的大模型创业公司，大多在2018年到2021年之间就创立了。有员工离职加入创业公司后反馈，在创业公司1个月的工作量，相当于在字节6个月。

另一个局限在于体系的定制化程度。字节的AI工厂是为抖音、今日头条这些超级应用深度优化的，这种“为十亿用户服务”的设计哲学，在对外输出时反而成了障碍。2025年，字节将火山引擎升级为独立云服务品牌，试图对外输出AI能力。但很多企业客户的反馈很直接：火山引擎的工具解决的是C端超级应用的问题，而他们需要的是“为一万员工服务”的方案。

高效率成就了字节的速度，但如何把这套为C端超级应用设计的AI流水线，改造成适合B端客户的通用工厂，仍然是字节必须解决的课题。

阿里：不做产品，做产品背后的“水电煤”

当字节跳动以“产品工厂”的逻辑快速迭代AI应用时，阿里巴巴选择了另一条路：成为AI时代的基础设施提供商。

它不直接生产具体的AI产品，而是提供建造AI产品所需的一切——算力、开发平台、模型服务。如果你是一家中小企业，想建AI工厂但资源有限，阿里云会给你一套完整的解决方案。这一战略在新任CEO吴泳铭上任后得到强化。他将“用户为先、AI驱动”确立为两大战略重心，在投资层面形成了“不放过任何一个大模型投资机会”的策略。

阿里系已投资智谱AI、百川智能、零一万物，蚂蚁集团也投资了智谱AI和生数科技，近期阿里与蚂蚁又共同投资了月之暗面（投前估值预计15亿美元）。从战略上看，支持大模型公司对于阿里应对市场竞争、保持云计算领先地位具有关键意义。

这套基础设施体系的核心是一个三层架构：底层的算力设施、中层的开发平台、顶层的模型服务。

第一级是ModelScope开源社区，2022年推出后，它已经发展成了AI界的“基础资源库”，到2025年底汇聚了超过5000个开源模型。它的价值是解决AI开发的“冷启动”问题——企业不用再从零训练模型，直接找到预训练模型微调一下就能用。

第二级是PAI机器学习平台，提供从数据标注、特征工程到训练部署的全流程工具，大幅降低使用门槛。永辉超市是一个典型案例。传统方法构建智能补货系统需要6个月、200万投入；用PAI只用了1个月、30万投入，准确率还提升了15%。

第三级是灵积模型服务（MaaS），提供包括通义千问在内的数十个预训练大模型，按需付费，中小企业无需自建工厂即可直接调用。到2025年第四季度，灵积平台的API日调用量已经突破50亿次，服务了超过10万家企业客户。

这三层架构对应着清晰的商业模式。最底层是算力（IaaS）：2025年阿里云在中国公有云IaaS市场的份额达到34%，稳居第一。中间是平台（PaaS）：PAI平台2025年收入同比增长120%，在企业AI平台市场的份额达到28%。最顶层是服务（MaaS）：灵积采用token计费，随着大模型渗透率的提升，这一层的收入增速最快，2025年同比增长超过300%。客户可以从任何一层进入，都能获得相应的价值。

2026年3月19日发布的阿里2026财年第三季度（自然年2025年第四季度）业绩报告，为这一战略提供了数据支撑。报告期内，阿里云收入达432.84亿元，同比增长36%，外部商业化收入同比增长35%。截至2026年2月底，阿里云累计外部商业化收入已突破1000亿元。

增长的核心动能来自AI业务的全面爆发：AI相关产品收入已连续第十个季度实现三位数同比增长。

底层算力层面，平头哥自研GPU芯片已规模化量产，截至2026年2月累计交付47万片，覆盖互联网、金融、自动驾驶等核心行业；模型与平台层面，新一代大模型Qwen 3.5 Plus在推理、编程、Agent智能体等维度表现优异，百炼MaaS平台过去三个月Token消耗规模提升6倍，财报明确预计商业化MaaS收入将成为阿里云最大的收入产品；应用层面，C端千问应用月活已突破3亿，B端发布了全球首个企业级AI原生工作平台悟空，全面接入阿里生态的商业能力。

基于当前进展，阿里明确了长期目标：未来五年，包含MaaS在内的云和AI商业化年收入目标突破1000亿美元。

尽管架构清晰、增长强劲，阿里云的AI工厂面临一个根本性挑战：标准化产品与定制化需求之间的平衡。

PAI平台虽然功能强大，但它是一个通用型平台。有金融行业CIO反馈，风控模型有严格的合规要求、独特的数据结构和特殊的评估指标，用通用平台就像用“标准模具”生产“特殊零件”，需要大量额外适配。

阿里云的应对策略是“平台+生态”——在标准化的PAI平台基础上，与行业ISV（独立软件开发商）合作开发垂直解决方案。

但这种模式也有局限：ISV方案质量参差不齐，阿里云难以统一把控。更重要的是，大型企业（如银行、保险、央企）往往希望“自建工厂”而非“租用车间”，数据安全是第一位，他们宁愿投入更多资源自建AI平台，也不愿将核心数据放到公有云上。

这导致阿里云的AI工厂在高端市场面临独特的挑战。

腾讯：生态驱动，先内后外

如果说字节的AI工厂是“产品驱动”，阿里是“技术驱动”，那么腾讯就是“生态驱动”。

腾讯的优势在于生态场景——微信、QQ、游戏、内容，提供了无数的“应用试验田”。其AI战略分为三步：内部孵化、生态赋能、产业共创。

2024年9月，腾讯发布混元大模型，采用了一条独特的验证路径：先在内部产品中全面应用，用真实的业务场景打磨模型。微信搜索、QQ音乐推荐、腾讯文档智能写作、腾讯会议实时字幕……所有能用到AI的场景，都先用混元跑一遍。这种策略带来两个核心优势。

第一是高质量的训练数据。微信月活超13亿，每天产生数百亿条消息；腾讯游戏日活数亿，产生复杂的交互数据；腾讯内容生态每日消费时长超100亿分钟。这些数据通过腾讯账号体系相互关联，一个用户在聊天、玩游戏、看视频的行为可以构建完整的画像，为个性化AI提供坚实基础。

第二是快速迭代能力：混元在微信搜索中上线后，能根据点击率、停留时长、满意度评分实时调整参数，这种基于真实用户反馈的迭代比实验室评估更准确。经过一年内部验证，混元各项指标提升了40%，更重要的是，团队摸清了模型在不同场景下的表现边界——知道它在什么情况下效果有限，比知道它表现优秀更有价值。

腾讯AI工厂的最大资产，正是覆盖社交、内容、游戏、工具的完整场景矩阵。

社交场景中，微信的语音转文字每日处理超10亿分钟语音，翻译支持20种语言实时互译，“小助手”能自动总结群聊重点、生成会议纪要。内容场景里，腾讯视频基于混元的推荐算法实现“千人千面”，2025年用户日均观看时长提升25%。游戏场景是腾讯的特色领域——《王者荣耀》的智能对手系统能动态调整难度，《和平精英》的语音识别可实时翻译不同语言玩家的交流。工具场景方面，腾讯文档的“智能写作助手”能根据大纲自动生成完整文档，腾讯会议的“AI纪要”可自动识别重点并生成结构化记录。

这些场景并非孤岛。用户在游戏中的行为可以优化社交推荐，社交中的兴趣数据可以优化内容分发。腾讯的AI工厂，本质上是一个“数据循环生态”。

2026年3月18日，腾讯发布的最新财报显示，2025年成为其AI全面加速的一年。全年营收7517.7亿元，同比增长14%；经营利润（Non-IFRS）2806.6亿元，同比增长18%。

最引人注目的是投入规模：全年资本开支792亿元，研发投入857.5亿元，均创历史新高。

模型层面，混元即将迎来重大升级——3.0版本计划于2026年4月陆续对外开放，目前已在内测阶段。

过去一年，腾讯密集调整AI组织架构，新设AI Infra部、AI Data部和数据计算平台部，强化研发体系。产品层面，腾讯元宝累计更新超百次，在春节活动与社交玩法带动下月活突破1亿，跻身国内AI原生应用前列；AI工作台ima月活超1300万，知识库文件超4.2亿。

投资布局上，腾讯与阿里不相上下，投资了智谱AI、Minimax、百川智能、深言科技等公司。云业务方面，腾讯云在2025年实现规模化盈利，四季度企业服务收入同比增长22%，海外布局也在加速推进。

腾讯AI工厂的商业模式体现了典型的“腾讯风格”：先服务内部生态，再赋能外部伙伴。

第一阶段是内生增长——AI能力首先应用于内部产品，提升用户体验和商业效率，例如微信搜索引入混元后广告点击率提升30%。

第二阶段是生态赋能——通过腾讯云将AI能力开放给合作伙伴，目前超过100万个微信小程序接入了混元的NLP能力，实现智能客服、内容生成等功能。

第三阶段是产业共创——与行业龙头合作开发定制化解决方案，如与上海汽车合作“智能座舱AI系统”，与招商银行合作“智能投顾系统”。

这三个阶段让腾讯的AI工厂同时拥有稳定的基础业务和外部生态带来的增长空间。

但场景再丰富，腾讯的AI工厂也有一个根本性的限制：它的消费互联网基因太重了。它的AI能力大多围绕用户体验优化，这在消费互联网时代是优势，但在产业互联网时代就可能变成短板。

有几个限制是绕不开的。

一是对数据规模依赖度高。腾讯的模型训练依赖于海量用户行为数据，但企业服务场景中的数据往往是稀缺、孤立、质量不一的——一个制造企业的设备数据可能只有几TB，但价值密度极高，腾讯的“大数据模式”在此需要调整。

二是对实时性要求高。微信的AI服务需要毫秒级响应，因为用户无法忍受延迟，但企业AI应用（如风险控制、生产优化）往往可以接受分钟级甚至小时级的响应，为追求不必要的实时性而过度复杂化系统并不划算。

三是产业经验积累需要时间。腾讯擅长理解“用户想要什么”，但不一定理解“企业需要什么”——一个钢铁企业需要的AI模型，要懂冶金工艺、设备原理、供应链管理，这些知识需要长期沉淀。

腾讯正在通过“行业大模型”战略弥补这一短板，与金融、医疗、工业等领域的头部企业合作开发垂直领域的大模型，但这条路需要时间。

行业知识的积累无法一蹴而就，而腾讯的AI团队大多来自互联网背景，产业经验的补充仍是长期课题。

三条路，一个方向

字节、阿里、腾讯，三家公司的AI工厂，走出了三条截然不同的路。

一条向内生长，一条向外输出，一条在生态中蔓延。表面上是技术路线的差异，实际上反映了商业基因的不同。

要评价AI工厂的可持续性，可以从三个维度来看：数据规模、工程能力、商业闭环。

数据规模上，腾讯凭借社交生态提供最丰富、最连续的用户数据领先；字节的超级应用提供最实时、最密集的行为数据紧随其后；阿里的数据相对分散，主要来自企业客户和开源社区。

工程能力上，阿里在云计算基础设施上的积累最深，工程体系最完善；字节的工程能力聚焦于特定场景，但深度足够；腾讯的工程能力相对均衡，但缺乏突出的技术标签。

商业闭环上，字节的AI工厂直接服务于广告、电商等核心业务，投入产出比最清晰；腾讯的AI服务于生态繁荣，间接带来商业价值；阿里的AI还处于投入期，商业回报还需要时间验证。

华创证券计算机行业首席分析师王文龙的总结很到位：“短期看字节，中期看腾讯，长期看阿里。字节的模式变现最快，腾讯的生态最有潜力，阿里的布局最全面。”

三种路径，殊途同归。字节的“应用驱动”、阿里的“基础设施”、腾讯的“生态滋养”，看似方向各异，实则指向同一个本质：AI工厂的核心竞争力，不是模型参数的大小，而是将技术转化为商业价值的效率。

15分钟的闭环、百万QPS的推理能力、万亿token的调用规模——这些数字背后，比拼的是谁能让AI更快、更便宜、更稳定地跑进真实场景。

这场竞赛的最终结果，可能不是某一家公司的胜利，而是一种范式的转移。当AI从实验室里的稀缺资源，变成像水电一样按需取用的公共服务时，技术本身就不再是护城河。真正的壁垒，是那些在无数次闭环迭代中沉淀下来的工程能力、数据飞轮和场景理解——这些东西，论文给不了，开源代码也复制不了。

AI工厂的终极意义，不在于建了多少座工厂，而在于让智能变得普及。当一家街边小店能像抖音一样调用推荐算法，当一个大学生能像腾讯一样方便地使用大模型能力，当一家制造企业能像阿里云一样轻松获得算力支持——到那个时候，AI才真正完成了从技术到基础设施的蜕变。

这或许就是三家巨头同台竞技的最大价值：他们不是要分出胜负，而是一起把门槛踩平。

行业深度稿

字节、阿里、腾讯的AI工业化暗战：谁在建造AI时代的“工厂”？

分析师/竹心

关注我们

189-1071-7116

服务热线（9:00-18:00）