大摩: 视觉数据重构AI机器人竞争格局 特斯拉(TSLA.US)为核心关注标的

  • 2025-09-27 02:13:11
  • 329

摩根士丹利的研究报告指出,AI机器人的竞争已从“算法迭代”下沉至“数据争夺”,视觉数据作为VLA模型训练的核心资源,其获取能力将直接决定企业在行业中的地位。无论是特斯拉(TSLA.US)聚焦工业场景的视频采集,Meta(META.US)抢占消费端穿戴设备入口,还是布鲁克菲尔德激活不动产场景资源,本质都是通过“场景覆盖+数据积累”构建技术壁垒。

随着具身人工智能技术的成熟,“光子之争”将愈发激烈,而那些能平衡数据收集效率、用户隐私与商业化落地的企业,有望在这场竞争中脱颖而出,重塑全球AI机器人产业的格局。

报告主要观点如下:

在人工智能、机器人技术加速迭代的当下,一场围绕“视觉数据”的争夺战已悄然打响。摩根士丹利9月22日发布研究报告,称视觉-语言-动作(VLA)模型是AI机器人实现自主交互的核心,而训练这类模型的关键——“现实捕捉数据”,正成为全球科技与制造巨头争夺的焦点。

从特斯拉Optimus机器人转向纯视觉训练,到Meta在可穿戴设备中嵌入超高清摄像头,再到布鲁克菲尔德联合AI企业布局场景数据收集,“谁能大规模获取高质量现实场景视频,谁就能在AI机器人时代占据先机”已成为行业共识。

一、“光子之争”的本质:视觉数据是AI机器人的“燃料”

大摩报告用“胖金枪鱼”的比喻生动诠释了视觉数据的价值逻辑:在偏远岛屿上,一条600磅的蓝鳍金枪鱼若无法捕获,其价值为零;唯有配备船、渔具与探测器,金枪鱼才具备百万美元级价值。视觉数据的价值亦如此——若缺乏收集与处理能力,全球视觉数据的潜在价值无法释放;而当企业掌握“尧级次浮点运算(10²⁴次/秒)”的数据处理能力时,现实场景数据将成为AI机器人技术突破的核心“燃料”。

这种认知正驱动企业将摄像头部署到家庭、办公室、汽车乃至人体穿戴设备中。摩根士丹利分析师在与FigureAI(专注端到端生成式AI自动驾驶的初创公司)联合创始人亚历克斯・肯德里克交流时,对方明确表示:“无论谁能大规模获取家庭场景的超高清视频……谁就能赢。”这一观点直指AI机器人发展的核心瓶颈——高质量、多场景的视觉训练数据稀缺。

二、特斯拉押注纯视觉训练,开启机器人数据采集新路径

作为AI机器人领域的关键玩家,特斯拉在视觉数据应用上的动作备受关注。报告披露,2025年5月,特斯拉前Optimus项目负责人通过X平台发布视频,显示Optimus已能通过“人类演示视频”自主执行任务,这些视频以第一视角拍摄,而长期目标是转向“随机部署摄像头捕捉的第三人称视角”,这一转型标志着特斯拉从“人工操控辅助”向“数据驱动自主学习”的关键跨越。

更具突破性的是,《商业内幕》2025年8月报道显示,Optimus的预训练将彻底“去人工化”——不再依赖穿戴动作捕捉服与虚拟现实(VR)的远程操控人员,转而通过“录制工厂工人执行任务的视频”获取训练数据。这种模式不仅降低了训练成本,更能让机器人学习真实工业场景中的复杂操作逻辑,提升实用价值。

无独有偶,报告还提及未上市企业SkildAI的布局:该公司正构建“机器人基础模型”,核心训练数据正是来源于“互联网上的人类动作视频”,进一步印证了“现实场景数据”在机器人训练中的通用性价值。

三、巨头竞逐:Meta抢占穿戴设备入口

在消费端与场景端,科技与资产巨头也在加速布局视觉数据采集,形成多元化竞争格局。

1.Meta:可穿戴设备成“数据战场”,用户脸部承载关键价值

Meta在下一代可穿戴设备上的布局直指视觉数据收集。报告指出,Meta计划在眼镜产品中嵌入2个超高清摄像头,重点捕捉用户“手部动作的现实数据”——无论是弹钢琴、织毛衣,还是倒咖啡、倒垃圾,这些日常动作都将成为训练AI机器人的珍贵素材。摩根士丹利预测,未来2年内这类设备的保有量或达2000万台,接近当前全球特斯拉汽车数量的2倍。

每一位Meta眼镜用户,都可能在“数字宇宙的数十亿个场景中”训练一个“人形虚拟形象”。报告形象地称:“这些眼镜或许设计时尚,但你的脸,早已成为数据争夺的‘战场’。”尽管Meta可穿戴设备目前仍处于“概念验证阶段”,短期内难对财务产生实质影响,但摩根士丹利互联网团队强调,其“全栈式布局”(自主研发硬件+AI操作系统+内容生态)已为抢占下一代计算平台奠定基础,而视觉数据收集正是这一布局的核心环节。

2.布鲁克菲尔德:激活不动产资源,打造“最大规模预训练数据集”

不同于科技公司的设备端布局,全球领先的基础设施解决方案提供商布鲁克菲尔德选择“以资产换数据”。报告披露,布鲁克菲尔德近期与FigureAI达成合作,计划开放其庞大的不动产版图——超过100万套住宅单元、5亿平方英尺商业办公空间、1.6亿平方英尺物流仓储空间,用于AI机器人训练数据的收集。

这一合作的核心价值在于“场景多样性”:住宅、办公、物流等不同场景的环境特征、物体布局与人类活动模式,能为AI机器人提供多维度的训练素材,帮助机器人学习在“以人类为中心的各类场景”中移动、感知与行动。目前,布鲁克菲尔德旗下资产已启动数据收集工作,未来数月将扩大规模;双方还计划探索“在不动产中部署人形机器人”的长期商业化机会,形成“数据收集-模型训练-场景落地”的闭环。

四、投资视角:特斯拉为核心标的,关注数据生态链机会

摩根士丹利在报告中明确将特斯拉列为核心关注标的,给予“增持”评级,目标股价410美元。其中AI机器人相关的技术突破与数据积累,是支撑长期估值的关键变量。

报告同时提示了行业核心风险:一是传统车企、中国车企及科技巨头在AI机器人领域的竞争加剧;二是特斯拉多工厂投产与技术迭代的执行风险;三是全自动驾驶(FSD)搭载率、用户平均收入(ARPU)不及预期,导致市场对“Dojo超级计算机赋能服务业务”的价值认可度下降。