AI 浪潮下,消费硬件的新变局

新一轮人工智能浪潮正席卷全球,AI 原生企业如雨后春笋般涌现。腾讯研究院将这类企业定义为自创立起,就把人工智能当作核心产品、服务或能力,以此推动价值创造与业务创新的公司,与那些仅将 AI 融入现有业务或当作工具的企业有着本质区别。

研究院聚焦全球 100 多家 AI 原生企业,深入探讨三大关键问题:AI 原生企业催生了哪些新技术、产品形态和商业模式?AI 技术如何深度嵌入千行百业的应用场景与核心流程,助力产业升级?AI 产业生态又沿着怎样的路径加速演进,带来哪些结构性变革?

与以往聚焦单点技术或单一企业创新的产业分析不同,本系列研究从生态切入。当下,生成式人工智能正处于从工具向平台跃升的关键转折期,生态的开放性、可扩展性和协同效应成为决定产业格局的关键因素。通过梳理 AI 原生企业依赖的基础模型,我们发现海外已形成以 OpenAI、Anthropic 和 Google 为核心的三大生态阵营,这是综合考量基础模型能力、开发者吸引力、生态开放度及产业影响力等多方面因素的结果。本文通过揭示全球 AI 企业的聚合趋势与落地情况,为我国 AI 生态建设提供观察视角。

AI 消费硬件的创新路线

自 2023 年起,AI 消费硬件领域创新活跃,AI 手机、智能眼镜、戒指、耳机以及陪伴机器人等新品类不断涌现。依据 AI 原生程度,可将其发展路线大致分为三类。

AI 原生设备的勇敢探索

近年来,多款 AI 原生设备亮相,试图打破智能手机主导的交互模式,探索 “意图即操作” 的新路径。它们通常弱化 App、菜单和窗口,依靠大模型驱动的语义理解与任务执行,堪称 AI 原生设备的雏形。

Rabbit R1 和 Humane AI Pin 是其中的典型代表。Rabbit R1 主打实体屏幕和滚轮交互,Humane AI Pin 则采用无屏投影技术,二者都借助大模型理解指令来完成操作。此外,陪伴式机器人如 Loona、Ema 等产品,围绕语音交互、情绪识别与拟人行为设计,致力于构建陪伴关系与情感连接。

从整体上看,这类产品在交互范式与系统结构上具有开创性意义,类似早期 Palm OS 移动设备的探索。然而,受体验成熟度、稳定性以及用户认知等多种因素制约,其发展面临诸多不确定性。例如,AI Pin 已于 2025 年 2 月 28 日停止所有在线功能;Rabbit R1 虽仍在销售和更新,但面临用户活跃度低、价值体现不足、性能与稳定性欠佳等问题,市场前景尚不明朗。

渐进式的原生设备强化

与从零开始探索 AI 原生设备不同,苹果、Meta 等企业代表了另一条更为稳健的技术发展路径:以现有的终端设备为基础,系统地引入 AI 能力,逐步实现对设备的重构。

苹果通过 Apple Intelligence,将本地大模型(由 M 系列芯片支持)集成到手机、平板和电脑等主要产品中,在保障安全、性能以及生态控制的同时,逐步增强 AI 功能。

不仅是手机,智能眼镜和耳机等可穿戴设备也成为这一发展路径的延伸方向。Meta Ray – Ban 智能眼镜、小米与华为的 AI 眼镜产品,均在传统设备形态的基础上,集成语音助手、图像问答、翻译导航等模型能力,拓展了人机交互的边界。耳机作为使用频率极高的可穿戴设备,也在加速 AI 化进程。Pixel Buds、AirPods、Nothing 等品牌纷纷尝试将大模型能力引入耳机端,实现实时对话、信息检索、语音操作等功能。

总体而言,这类产品以上一代硬件为基础,通过引入 AI 能力提升交互体验,强化设备的 AI 属性。这条路线稳健且具有较高的规模化潜力。

以模型为核心的赋能之路

以 OpenAI 为代表的大模型厂商,则探索出一条以模型为核心、赋能万物的平台化发展路径。对于这些模型厂商来说,相较于自行构建硬件,更重要的是通过 API 和 SDK 等接口形式,将强大的 AI 能力融入第三方设备,成为各类设备 “通用智能” 的底层支撑。

这种路径具有灵活性高、迭代速度快的优势,能够迅速渗透到各种终端设备形态中。例如,GPT – 4o 被嵌入 Ray – Ban 智能眼镜、Be My Eyes 等硬件产品中,为其提供实时对话与视觉感知能力;阿里的 “通义听悟道” 耳机、豆包耳机等产品,依托自有模型探索以语音助手为核心的日常交互场景,打造 “随时可唤醒、持续能响应” 的智能体验。

这一路线的核心并非重构硬件形态或操作系统,而是让模型能力无处不在,使每一个设备、每一个界面都接入智能,最终构建 “模型即平台” 的智能生态。

AI 消费硬件商业模式的初步成型

随着 AI 消费硬件产品形态的多样化发展,与之对应的商业模式也逐渐显现出雏形。通过对当前主流产品的剖析,我们发现上述三条发展路线各自衍生出了与自身技术路径和产品定位相适配的盈利模式,但同时也面临着不同的核心挑战。

AI 原生探索派:高风险的未来赌注

这一模式的核心在于凭借颠覆性的交互范式和独特的硬件设计,向早期尝鲜用户以及有特定情感或场景需求(如儿童教育、独居陪伴、宠物家庭等)的用户群体收取较高的硬件溢价。同时,这些创新企业通过提供持续的订阅服务(包括云服务支持、AI 功能更新、专属情感交互包或内容包等),构建稳定的经常性收入来源,并积极探索生态拓展的可能性,如销售配件、进行 IP 授权,甚至设想未来类似 Agent 应用商店的平台抽成模式。

然而,AI 原生探索派正面临硬件价值难以证明的困境。在功能性场景方面,这类产品的实用性和用户体验目前难以与手机等成熟硬件相媲美,且尚未找到现有硬件无法替代的刚需场景,导致用户购买意愿持续低迷。以 Rabbit R1 为例,该产品以 199 美元的价格和复古设计进入市场,具备瞬时响应和语音交互功能,但由于依赖云端、生态封闭以及存在逻辑漏洞等问题,出现功能不稳定、控制体验差的情况,“大多数功能与智能手机相比并无优势”,始终未能突破 “场景玩具” 的局限。此外,测评媒体还指出其存在隐私隐患,质疑其自研 LAM 模型只是通过自动化脚本操作应用。如今 Rabbit 已转向软件开发生态寻求自救。

在陪伴场景中,情感溢价无法弥补功能性缺陷,同样难以支撑硬件的高溢价。比如日本 GROOVE X 公司推出的 LOVOT 陪伴机器人,采用 3935 美元的硬件售价加上 67 美元月订阅费的商业模式,目标客户为高净值人群,其内置芯片的专属服装单价高达数百至上千元,普通衣服无法触发交互反馈,形成强制消费闭环。但其交互续航时间不足 1 小时,需要频繁充电,互动玩法固定,缺乏个性化交互案例(无语言能力),发售 5 年全球销量仅 1.4 万台,年均出货量不足 3000 台。

探索派 AI 消费硬件的核心困境在于用户教育成本过高,如果产品体验无法实现对现有终端的重大突破,就难以赢得主流用户的认可。当前这类产品普遍缺乏足够的颠覆性,导致在硬件定价与订阅服务之间价值链不清晰,难以促使用户持续付费并保持粘性。从根本上说,这是一场对未来人机交互范式转变的高风险 “豪赌”。

渐进强化派:在熟悉中实现价值变现

该模式基于成熟的硬件形态,通过系统集成 AI 能力,显著提升原有功能体验或开拓全新的应用场景。其商业模式以硬件销售为主要收入来源,依靠品牌影响力或性价比抢占市场份额。更为关键的是,通过提供增值服务订阅(如个性化的深度健康分析报告、专业级翻译引擎、持续迭代的专属 AI 功能等),企业将一次性的硬件销售转化为长期的用户价值和持续的收入流,挖掘更深层次的 “智能” 价值。

渐进强化派的核心优势在于用户认知门槛低,市场接受度高。在产品体验上,更注重本地 AI 算力的优化。苹果的端侧模型采用双区块架构,在降低内存占用和响应时延的同时,引入云端 PT – MoE 模型,确保了效率与智能水平的平衡。根据 2024 年 9 月美国的一项调研,Apple Intelligence 使消费者的支付意愿提高了 11%,成为 54% 潜在换机用户的核心决策因素。订阅制与端侧 AI 能力共同构成了该模式的竞争力双引擎,前者挖掘长期价值,后者保障响应速度和隐私安全。

不过,在订阅制的实际推行过程中仍存在挑战:用户对于 “看似智能却无法提供实际价值” 的伪(浅)AI 功能往往缺乏付费意愿,尤其是在缺乏刚需场景支撑的情况下,续费率难以稳定提升。同时,硬件产品同质化现象日益严重,差异化竞争依赖于更深层次的 AI 能力和生态协同。

以健康监测赛道为例,Oura Ring 曾因 “499 美元硬件 + 5.99 美元月费解锁基础数据” 的模式引发用户抵制,特别是由于缺乏实时健康预警功能,削弱了产品价值。然而,在转向 “基础数据免费 + 深度健康服务订阅” 模式后,用户对于个性化睡眠分析、疾病风险预测等智能报告的付费意愿显著提高,推动订阅转化率增长了 18%。这一案例表明,关键不在于是否收费,而在于能否让用户切实感受到持续、可感知的智能服务价值。

未来,订阅制成功的关键在于两点:一是精准定位用户高频使用场景,提供贴近生活的智能助理体验;二是构建分级订阅体系,降低初始付费门槛,提高续费的心理接受度和服务性价比。

模型赋能派:安卓路径的部分复制

以 OpenAI、谷歌等为代表的大模型厂商,选择不构建自身硬件闭环的路径,而是专注于打造最强大的基础 AI 模型。其商业模式可看作是对安卓路径的 “部分复制”:一方面,通过 API/SDK 接口,将模型能力如同 “水电煤” 一般输出,按照调用量(如 Token 消耗量或请求次数)向开发者、企业客户以及希望为其硬件产品赋予智能的制造商收费;另一方面,通过提供企业级订阅、私有部署、安全定制等服务,实现高附加值的商业变现。

这种模式的核心优势在于不依赖单一硬件形态,具有更强的渗透力和风险分散能力,理论上能够嵌入所有具备计算能力的终端设备。但是,与安卓生态的 “预装 + 统一标准 + 低边际成本” 路径相比,模型赋能派在多个关键环节面临挑战。

首先,模型推理成本较高,难以像安卓系统那样以极低的成本进行大规模授权;其次,模型能力与终端设备的适配存在技术门槛,尤其是在资源有限的本地端,常常出现时延高、功能缩水等体验问题;第三,赋能路径的平台控制权尚未确立。目前缺乏统一的生态标准和分发渠道,模型厂商在用户端的话语权很容易被硬件厂商削弱或替代。

这种困境在头部厂商的合作中已初现端倪:三星为掌握智能主导权,自研 Gauss AI 模型以减少对外部模型的依赖;vivo 通过自研蓝心大模型,强化数据闭环和本地控制能力,在核心领域降低对第三方 API 的依赖。即便是谷歌,也不得不向三星支付高额授权费,并让出部分订阅收益,以换取 Gemini AI 在 Galaxy S25 上的预装。

尽管模型赋能派通过开源来加速开发者生态建设,试图打造实施标准,但如果缺乏统一接口和低成本推理能力,其平台地位将难以真正稳固。与安卓操作系统作为超级入口的平台能力相比,模型赋能派更像是基础服务的提供者,渗透性强,但控制力较弱。

因此,其未来的核心竞争力,不仅在于模型本身的领先能力,还在于能否建立稳定、高效、低成本的适配路径,构建技术与生态的双重护城河,并在软硬融合的趋势中掌握入口主导权。

需要注意的是,以上三种模式并非完全独立,混合模式已开始出现。例如,越来越多的 AI 新型硬件通过蓝牙、APP 与手机等现有设备实现功能联动,构建多终端系统体验;同时,不少模型厂商也开始涉足 AI 原生硬件的制造,打通从模型能力到终端产品的完整链路。

AI 消费硬件的未来走向

上下游深度整合,端云结合成主流

模型厂商积极探索模型与硬件的适配,使得产业链上下游联系愈发紧密。由于模型的运行效率与底层芯片硬件紧密相关,为使模型性能与硬件端匹配,模型厂商正与芯片巨头合作,确保模型在各类设备上发挥最佳性能。Meta 从 Llama 3 发布起就与众多硬件伙伴紧密合作,公告中点名高通、英特尔、英伟达等,后续强化与端侧芯片厂商合作,特别是与高通在骁龙芯片上的适配,推动更小参数的 Llama 3 模型在手机等移动设备高效运行,确保从手机到数据中心的设备都能成为 Llama 3 的理想运行平台;阿里巴巴也积极推动通义千问大模型与硬件厂商适配,构建从模型到芯片的完整生态系统,加速 AI 技术落地应用。

此外,更多模型厂商亲自涉足 AI 原生硬件的设计与制造,OpenAI、字节、阿里等利用自身模型打造硬件,目标是创造完美承载 AI 服务、定义下一代交互范式的用户入口。

对于硬件厂商,端云结合策略仍是主流。端侧模型处理高频、低延迟、隐私敏感任务,如相册整理、实时翻译等;复杂、需海量知识和计算的任务(如长文案创作)则调用云端强大模型,包括厂商自部署模型及与外部顶尖 AI 公司合作的模型。端侧和云端模型各有不可替代性,端云结合仍是 AI 消费硬件主要实现方式。

为在端侧高效部署,模型厂商采用知识蒸馏等压缩技术,推动轻量化模型成为主流。当前,终端设备常用模型参数量多低于 70 亿(7B),30 亿(3B)和 40 亿(4B)规模的模型在终端应用中最为常见,部分厂商将 MoE(混合专家模型)架构在端侧落地,平衡性能与功耗。

“无感化” 交互引领硬件范式变革

短期内,因端侧模型能力提升和用户习惯,手机仍是用户与 AI 交互的主流硬件。2023、2024 年,Rabbit R1 等尝试替代手机的硬件产品,因模型能力、产品功能、消费习惯等限制未获成功。2025 年以来,更多 AI 消费硬件尝试成为 “辅助手机的传感器”(如可穿戴 AI 助手),或开拓手机未覆盖的细分场景(如会议、陪伴场景),凭借 AI 解决用户痛点、提升体验,获得积极市场反馈。在会议场景,Limitless Pendant、AI 会议耳机 iFLYBUDS Pro 3 等硬件专注语音交互记录会议内容,补充智能手机交互方式;在娱乐场景,BubblePal(聚焦儿童陪伴)、ROPET(聚焦青年女性陪伴)等 AI 硬件针对特定受众设计,实现主流产品无法提供的陪伴功能。

长远看,随着语音、视频等交互方式发展,AI 硬件交互范式有望向 “无感化” 演进。

AI 眼镜市场的蓬勃发展体现了这一趋势。自 2024 年起,AI 眼镜成为科技巨头、AR/VR 厂商和新兴品牌竞争焦点。Meta 和 Ray – Ban 合作的 AI 眼镜取得成功后,雷鸟、Rokid、小米等品牌纷纷推出 AI 眼镜;2025 年,端到端多模态模型快速发展,增加交互方式(如语音、视频)、降低交互时延、提高交互精度,在此情况下,众多公司进军 AI 眼镜市场,不仅有小米、三星等硬件厂商,谷歌、阿里、字节等模型厂商也积极布局。

AI 眼镜让用户基于当前场景通过语音与 AI 交互,相比手机触屏和拍摄,操作更简便、解放双手,且能让 AI 更好感知实时环境,基于丰富上下文做出更准确判断。目前,AI 眼镜仍是手机的补充,但长期来看,随着光学和算力成熟,因其能融合语音、视觉交互且无需手持的特性,有望从 “音频拍摄工具” 升级为 “个人生活助理”。

在 “无感化” 趋势下,除 AI 眼镜外,新形态的 AI 原生消费硬件也可能在不久后进入市场。OpenAI 正在探索充分发挥 AI 能力的新型硬件。Sam Altman 认为,AI 要真正发挥作用,需了解用户环境、日程和偏好并实时行动;智能手机的 App 模式束缚 AI 发展,AI 时代需要类似 “iPhone 时刻” 的范式革命,即硬件、操作系统和模型从一开始就为 AI 协同设计。基于此,OpenAI 与前苹果设计师 Jony Ive 合作,开发可能无屏幕、以对话式 AI 为核心交互的全新个人计算设备。

综上所述,AI 眼镜市场的发展和新形态 AI 原生消费硬件的出现,表明 “无感化” 将成主流趋势:在 AI 时代,以语言用户界面(LUI,用户直接通过语言和硬件交互)为代表的新范式可能取代图形用户界面(GUI,用户通过图标与硬件交互),语音将取代触控成为主流交互方式,最终改变主流硬件形态。

AI 从 “功能补充” 迈向 “应用入口”,软件生态成关键

短期来看,AI 的主要任务是提升效率,通过系统级集成,在关键使用场景中巧妙引入 AI,实现低感知、高效率的体验优化。前文提到的 AI 耳机增加 AI 实时总结功能;苹果在 WWDC25 上宣布利用 AI 实现信息内智能分组、电话智能接听等功能,本质上是将 AI 融入手机应用,增强既有体验。

长期而言,AI 在硬件上的终极形态将是 “Agentic”,最终成为所有应用的主要入口。随着模型自主规划和调用工具能力的发展,未来用户只需通过语音或自然语言与 Agent 交互,其余操作由 Agent 在后台完成,如同为手机、眼镜等终端赋予 “自动驾驶” 能力。三星 2025 年发布的 Galaxy S25 系列搭载的 AI Agent Bixby,支持跨越 30 多个本地应用和 10 多个高频第三方应用的一体化操作;苹果的 Apple Intelligence 也在推动 Siri 向跨应用操作与情境感知演进,朝着真正的个性化 AI 助手发展。

在此趋势下,掌握数据入口和应用生态者,将占据用户界面与 AI 调度的制高点。Google 凭借强大的产品矩阵,在 2025 年 3 月实现 Gemini 与 Google Search、YouTube、Google Calandar、Gmail 的数据打通,Gemini 不仅能访问历史搜索和观看记录,还能将生成结果直接写入备忘录、日历等应用,具备作为应用入口的独特优势;Meta 眼镜销量领先,很大程度上得益于

为您推荐