算力超越英伟达,成本仅1/10:一只国产机器狗如何绕道突围?

作者:竹心      时间: 2026-05-17      浏览数:5387

封面.png

分析师/竹心

校对/贾玥

策划/Eason


2026517日,蔚蓝科技发布BabyAlpha A3,以感知超人类和算力架构突破为锚点,用技术代差冲击了行业认知。

但在七年前,几乎没人相信这条路能走通。彼时行业普遍押注B端赛道,蔚蓝科技却做了一个不切实际的决定:做家庭机器人。不是展厅Demo,不是实验室平台,而是放在有老人、有小孩、有宠物的真实家庭里。

七年过去。做四足机器人的探索者不少,后空翻、越野跑、负载行走——能秀的参数都秀了,出货量涨到了数万台。但一个尴尬的事实始终没变:绝大多数家庭的客厅里,仍然没有一只机器狗。

不是消费者不需要。中国60岁以上人口超3亿,双职工家庭超2亿户,陪伴、看护的需求真实存在。可行业过去六年交出的答卷是:HDR不到90db——连人眼都不如;单芯片算力不够边缘端70亿大模型根本跑不动;续航平均1.5小时——一局游戏的时间。

当多数产品还在为进家庭苦苦探索时,A3已经用较上一代BabyAlpha算力提升千倍、超越英伟达旗舰芯片Jetson Thor T5000、且成本仅是英伟达的1/10的成绩,给出了一个惊喜的答案。

这一次,不太一样。

01
三个困局,一台缺席的机器狗



过去几年,消费级四足机器人经历过舆论的热捧,也遭遇过真实体验的冷遇。热闹的是媒体好奇,沉寂的是用户口碑。不是市场缺乏想象空间,而是产品被行业的结构性困局卡住了。

感知能力的短板,使机器人长期处于半盲状态。

行业主流配置为200万像素摄像头,搭配单线~16线激光雷达,点云密度仅数万点/。这一配置在五年前尚属先进,但在当前的真实家庭场景中,问题日益凸显:强光环境下过曝,暗光环境中无法分辨台阶边缘,逆光时画面几乎全黑。HDR动态范围不足90db,而人眼理论极限为100120db

一个连台阶边缘都无法清晰辨识的机器人,用户很难放心让它在家中自主行动。感知能力的缺失,意味着机器人无法建立对环境的准确理解——而这恰恰是自主决策的前提。

用行业内的通俗说法:目前的四足机器人,本质上是在盲走

算力被卡脖子,导致行业陷入有具身、无智能的尴尬境地。

消费级四足机器人五年来基本被困在单芯片方案中:要么采用英伟达,要么采用瑞芯微等国产方案,70亿参数的大模型完全无法在端侧运行,推理速度仅为个位数TPS

厂商被迫陷入两难境地:采用英伟达方案,单颗芯片成本高达2999美元,整机售价无法下沉至消费级市场;采用国产低成本芯片,70亿参数的大模型完全无法在端侧运行

这个数字意味着什么?

用户完成一句话输入,机器人需要数秒才能响应。在实际体验中,这种延迟足以打断交互的自然流畅感,用户很容易失去耐心。行业也曾流传这样一句调侃:现在的机器狗,智商大概相当于一只刚出生的小狗——能动,但听不懂你在说什么。

算力基础设施的缺位,成为制约具身智能落地的最大瓶颈。

而更根本的问题是:四足机器人能走,但不等于能进家门。

过去多数四足机器人的避障方案仍停留在超声波加碰撞检测的阶段,本质上是一种先碰撞、后调整的反应式策略。在结构化的实验室环境中完成直线行走并不困难,但在真实家庭场景中,挑战完全不同。

真实的场景往往存在复杂性:一个学步期的幼儿突然从拐角冲出来,一只猫从沙发上跳下,地面上一根充电线横在路中间,厨房门口的地板刚拖完还是湿的。这些场景在家庭中每天都在发生,但对于传统四足机器人来说,每一个都是可能导致事故的风险点。

安全不是功能列表中的一项可选项,而是产品进入家庭市场的入场券。没有这张券,再炫酷的功能都无法兑现为真实的用户价值。

不管如何追根源,这三个困局的根源都指向同一个方向:感知与算力两个底层基础设施未能夯实,上层应用无论怎样搭建都难以稳固。 

02
看得清、听得准、跑得稳、护得住



当整个行业在困局中打转时,一个现实的分化已经悄然发生:不少玩家转向了B端或双足机器人,那些场景对感知精度的容忍度更高,对交互智能的要求更低,商业闭环也似乎更近。

这没有错。

但蔚蓝科技七年前就做出了一个不一样的选择:专注家庭机器人赛道。这意味着没有捷径可走——家庭场景对安全、交互、环境理解的要求是最高量级的,感知、算力、安全三个困局一个都不能绕开,只能正面解决。

A3正是为这个选择交出的答卷。它从视觉、空间感知、听觉到运动能力,完成了一次四足机器人身体层面的代际跃迁。


1.jpg

A3技术highlights

视觉是第一道关卡。因为看得清,是一切的前提。

A3的视觉配置堪称行业天花板:一颗8K主摄、一颗4K广角,以及一颗背部360°环视4K摄像头,三颗合计6600万像素。HDR动态范围达到140db的视网膜级别,最高支持480fps帧率。对比200万像素、HDR低于90db30fps帧率的行业主流配置,A3的像素数为行业平均的33倍,动态范围超出50db,帧率为行业的16倍。

这些参数背后的实际价值,是A3第一次让四足机器人在视觉上超过了人类。

140dbHDR意味着,在阳光从窗户斜射进客厅时等的逆光环境下,A3仍能清晰分辨台阶边缘与地面物体的轮廓;在暗光条件下,它不会将阴影误判为障碍物。而480fps的超高帧率则使其能够捕捉超慢动作级别的画面变化,这种时间分辨率足以让机器人在物体出现的第一时间做出反应,而非依赖先碰撞、后调整的工作模式。


2.png

视网膜级HDR

这不是渐进式升级,是视觉系统从”功能手机摄像头”到“旗舰微单”的跨越。当机器人的视觉感知能力超过人类时,它才有可能比人类更安全地自主行动,具身智能产品才拥有了进入家庭市场的前提条件。

视觉之外,空间感知能力同样发生了质变。 A3采用的360°环视面阵,由53D ToF3D结构光协同工作,点云密度达到每秒223.2万点。行业主流的感知方案,每秒仅能产生4.8万个点云,两者相差近50倍。

这个差距意味着什么?

A3在用4K超清3D地图导航时,行业主流产品仍然在使用马赛克级别的2G地图进行路径判断。50倍的点云密度优势,使A3能够准确区分可以从旁边绕过需要跨越通过两种不同的障碍物类型——这是机器人实现自主决策的物理基础,也是从遥控行走迈向自主导航的关键分水岭。

用一种更形象的说法是A3不仅知道前面有东西,还知道那是什么东西、该怎么应对


3.png

360环视视野&融合空间

看得清,不等于听得见。过去行业对听觉的忽视,让机器人始终处于半感知状态。

人类对环境的理解,从来不是纯粹视觉的——你在厨房喊一声,家人不需要转头看你,就知道你在哪个方向。

这就是听觉在感知拼图中不可替代的价值:它补上了视觉盲区之外的另一维信息。

A3搭载了一套仿生立体听觉系统,由12个麦克风组成3D Mesh阵列。这是当前行业最高的麦克风配置数量,模仿猫头鹰等生物的听觉结构,结合自主开发的算法,能够实现水平角度与垂直高度两个维度的精准声源定位。行业现有方案多为单麦克风或4麦克风平面阵列,只能判断声音的大致方向,无法完成垂直定位。

A3能做到什么?

用户在厨房呼唤它,它不会原地旋转搜索,而是直接判断出声音的方向与距离,径直走向用户。听觉在感知能力中长期被低估,但实际上,人类在很多时候并不依赖视觉,仅通过听觉配合大脑判断即可形成完整的场景认知。A3将听觉提升到与视觉同等重要的战略高度,使感知系统从单眼模式升级为全感知模式


4.jpg

12仿生麦

5.png

定向降噪

感知系统升级了,身体也得跟得上。A3的运动能力和续航,同样完成了一次代际跃迁。

A3的最高运行速度为3.5/秒(约13公里/小时),超过成年人快走速度;最大爬坡角度45度,可轻松应对楼梯;最大越障高度28厘米,约等于一只成年拉布拉多犬的肩高,为当前行业最高越障数据。综合续航时间为35小时,行业平均水平仅为12小时。

但运动能力的真正突破不在于参数本身。过去四足机器人的运动能力再出色,也需要依赖人工遥控操作。

参数再漂亮,也只是被动的工具。

A3的不同之处在于,凭借算力调度与感知精度,它能够在家庭环境中自主判断如何通过楼梯、门槛、斜坡等复杂地形。在用户看来,A3的运动能力应该是有脑子的运动,而不是预设程序的执行


6.png

世界模型

运动能力决定了机器人能走多远,但,安全决定了用户敢不敢让它走进家

用户体验中安全这件事,蔚蓝也从不含糊。A3的安全不是简单的功能加法,而是一体化设计的系统结果。

物理层面,A3从形态上消除隐患。关节和线束全部隐藏,不存在夹手或缠绕的可能;故障发生时,系统能在毫秒级完成制动。所有核心零部件均来自全球顶级供应链——外观结构由果链制造,电池包由比亚迪制造,关节减速器由双环制造,关节电机由雷利制造。每一处涉及安全的细节都按最高标准设计。

系统层面,A3采用端云双重守护。边缘端部署360安全大脑,抵御恶意攻击和病毒入侵;云端通过等保三级认证,依托阿里云与Azure的安全体系,形成全栈防护。

数据与隐私层面,A3将核心算力放在端侧,数据在本地处理,不外传。从安全启动到运行期访问控制,从存储加密到通信加密,每一个环节都做了架构级设计。不是承诺我们不会泄露,而是从技术架构上让用户不需要信任任何人的承诺。


7.png

A3三重安全

A3的安全设计,不是实验室里推演出来的白皮书。

七年时间、七代产品迭代,每一代的安全升级都来自上一代在真实家庭环境中的用户反馈——地面线缆的绊倒风险、低矮障碍物的识别盲区、突然窜出的宠物、横冲直撞的学步期幼儿。

超过一万个活跃家庭、累计一千万小时的真实使用时长,让蔚蓝能够准确识别这些高频风险场景,并据此进行针对性设计。用户不会骗你,他们家里真正发生什么,数据会告诉你。

03
换一套新的“大脑”——绕过英伟达的算力突破



感知能力的全面提升,为A3提供了前所未有的环境信息输入密度。但一个更深层的问题随之浮现:这些海量数据能否被有效处理?能否实时转化为智能决策?

所有的答案取决于算力基础设施。而算力问题,恰恰是过去五年行业最大的卡点。

行业陷入了一个死循环:算力不足无法运行大模型智能能力缺失用户价值稀薄销量上不去没有数据迭代算法。

过去行业的主流技术路线是采用单芯片方案,将感知算法、运动控制、大模型推理全部压缩在一颗芯片上运行,每个任务都难以做深做透。采用英伟达方案,单颗芯片成本过高,整机售价无法下沉至消费级价位;采用瑞芯微等国产方案,70亿参数的大模型完全无法在端侧运行,推理速度仅为个位数TPS

这不是某一家厂商的选择失误,而是整个行业过去五年缺乏有效替代方案的结果。英伟达凭借其在AI芯片领域的技术积累,实际上形成了对具身智能算力市场的垄断。任何想要绕开这条技术路线的尝试,都意味着巨大的研发投入和技术风险。

蔚蓝科技做了一个不一样的选择:不在英伟达设定的规则内追赶,而是换一条效率高出10倍的道路。 A3搭载了一套独创的具身智能边缘端混合异构计算集群:25nm算力芯片、28nm算力芯片、23D堆叠算力芯片,共计22CPU6颗芯片分工协作,分别负责感知处理、大模型推理、运动控制等不同任务。这一架构,让A3跟上一代产品相比,算力提升了千倍。


8.png

6芯片异构架构

这一架构的核心逻辑避开单点堆料,通过专业化分工实现系统整体效率的最大化。

过去是一颗芯片一个人干五个人的活,现在六颗芯片六个人各司其职、协同作战。这种设计思路在服务器领域并不新鲜,但在消费级机器人领域,这是第一次大规模商业化落地。

性能表现就是最好的证明。 15亿参数模型达到617TPS的推理速度,行业主流为10~30 TPS,性能差距30倍;70亿参数模型达到280 TPS行业主流产品最高仅为个位数,性能差距为40几倍。这是消费级四足机器人首次在端侧实现70亿参数大模型的可用级推理速度。

算力优势在用户的体验上表现得更为真实:过去用户说一句话,机器人要反应好几秒;现在它可以实时响应,甚至能预判用户的下一步需求。思考延迟的消除,使交互从命令响应升级为对话理解的自然模式。

成本层面的优势同样值得关注。 在同等算力量级下,蔚蓝自研异构方案的核心部件成本约为300余美元,而英伟达Jetson Thor方案的成本为2999美元。成本差距约10倍。


9.png

大模型参数(对标英伟达)

这不仅仅是成本上的小幅优化,更是商业模式层面的根本性差异——当核心部件的BOM成本降至竞争对手的十分之一时,产品定义权与市场定价权将发生实质性转移。

算力突破的底层价值在于它让端侧智能从概念变成了可交付的产品能力。 70亿参数的大模型此前只能在云端运行,端侧最多承载15亿参数级别的基本对话能力。A3首次将能够理解复杂指令、执行多步推理、保持上下文记忆的智能集成到一台万元级别的消费级机器人中。

用户体验也跨越式提升:A3在主人不在家时可以按照自身节律自主运行,完成充电管理、环境巡检等任务;当主人出现时,通过多模态融合感知能力理解环境、识别用户、分析情感状态,并主动做出响应。不再需要被动等待指令输入,无需忍受云端推理带来的延迟,也不会因网络中断而失忆

但算力从来不是目的,而是手段。

蔚蓝科技七年全栈自研所追求的,从来不是一张漂亮的参数表,而是一个更根本的命题:如何让机器人真正走进家庭,成为可负担、可信赖的生活伙伴?

这个命题的答案,写在蔚蓝的产业理念和品牌底色里。

04
万元定价的逻辑:从“电子宠物”到“人造劳动力”



过去几年,消费级四足机器人市场经历了一场价格重构。主流产品售价从早期的3-5万元逐步下探至2万元以内,行业第一次触碰到了消费级市场的价格红线。万元级四足机器人,正在从极客玩具走向更广泛的消费群体。

但一个更深层的问题在于价格降下来了,然后呢?

IDC数据显示,2024年全球四足机器人出货量约2万台,其中消费级产品占了72.1%的出货量,但销售收入占比却远低于此。行业研究机构指出,消费级四足机器人受限于售价低、功能单一及家庭场景渗透率有限,销售收入占比较低。波士顿动力Spot2019年上市以来,全球累计销量同样不足万台。

这不是某一家厂商的问题,而是整个行业的共性困境。行业过去几年解决的是能不能卖出去,而不是能不能留下来

这正是蔚蓝科技选择不同路径的原因。

A3定价锁定万元级别。这不是营销策略,而是技术路线选择的必然结果。

但价格只是敲门砖。

真正决定一款产品能否在家庭中留下来的,是它能否回答那个核心问题:用户买来干什么?

过去五年,四足机器人被贴上的标签是昂贵的玩具”——用户购买30天后,使用频次断崖式下跌。根本原因在于:产品始终停留在电子宠物的定位上,能提供新鲜感,却给不了持续的实用价值。

四足机器人的价值,不应止步于电子宠物。它的真正方向应该是朝着人造劳动力不断进步。

这不是一句口号,而是一次产品价值观的重构。人造劳动力指向的不是替代人,而是承担家庭中那些重复、低效、高频的轻量任务——环境巡检、老人提醒、儿童陪护。单个任务不起眼,但叠加起来,构成了可观的日常时间成本。

A3的目标不是让用户觉得好玩,而是让用户觉得离不开


10.gif

选择零件

A3进入数十万、数百万个家庭,产品价值锚点将从新鲜感切换为“ROI”。 用户不再问它好不好玩,而是问它能帮我省多少时间。一旦完成这个切换,产品生命周期将从30天的尝鲜期延伸至数年的持续使用。

这也是蔚蓝七年全栈自研的底层逻辑——不是为了技术自主而自主,而是为了在成本、性能、安全三个维度同时获得主动权,让人造劳动力

2.5万台销量、超9.5亿分钟用户时长,同步验证了蔚蓝对家庭场景的理解,是在真实使用中长出来的,不是在实验室里推演出来的。

五年前,一台能看懂家庭环境、理解自然语言、万元以内、安全可靠到可以放心放在孩子身边的机器人,属于科幻。2026年,这一科幻将走入现实。

对行业而言,A3的出现提供了一个可验证的命题:当感知、算力、安全、价格四个要素同时达标,消费级四足机器人是否会像扫地机器人一样,从尝鲜品变为家庭标配

答案,由市场和用户给出。

而寻找答案的过程,从来不是一蹴而就的。它需要真实用户的日常使用,需要时间的检验,更需要产品在一次次迭代中证明自己。

A3已于517日开启预售,预计Q3正式上市

届时,答案将不再停留在纸面上。

11.jpg

北京第一新声信息咨询有限公司 版权所有(C)2024 京ICP备2024089855号-1

第一新声商务经理 Sherry
Tel:18910717116

第一新声商务经理 Sherry
Tel:18910717116

第一新声研究客服 Kim小严

第一新声编辑客服 Tina

第一新声运营经理 孟小新