在当今竞争激烈的AI领域,字节跳动旗下的豆包正逐渐浮出水面,展现出其宏大的野心。它不仅仅是一个简单的聊天机器人,而是在字节搭建的越来越明确的AI体系中扮演着承上启下的核心角色,有望成为字节AI to C的核心力量,构建起一个软硬结合、功能丰富的AI生态。

能力升级:从基础到场景化的跨越
豆包的发展历程体现了其能力的不断升级。最初,豆包以社交聊天机器人的形象亮相,主打陪伴功能,用户可以与它像朋友一样聊天、整蛊,通过视频通话获取信息。例如,它曾定位为一个通过「打电话」交互方式为用户提供陪伴的产品,上线初期团队也将其视为类似Characte.AI的AI社交产品,用户可以定制不同角色的聊天机器人,形成了一个聊天机器人生态。
然而,随着大模型能力的提升,豆包开始突破社交的局限。它陆续推出了一系列能力更新,如AI播客、应用创造1.0、视频通话等。其中,超能创意系列的发展尤为显著。在超能创意1.0推出两个月后,豆包开始灰度测试超能创意2.0。超能创意2.0优化了对模糊意图的处理能力,能够解析图片细节,实现图片复刻,还能融合不同参考图的灵感元素创作全新图片,甚至可以根据一组人物图片生成绘本故事。此外,它还具备视频解析能力,支持用户上传视频或视频链接提取逐字稿、拆解分镜、脚本和剪辑手法,尽管目前对剪辑手法的拆解还不够精准,但已展现出强大的潜力。
这些能力的提升得益于豆包大模型1.6版本的支持,该版本支持深度思考、多模态理解和复杂Agent的构建,同时还接入了图片生成模型seedream 3.0、图片编辑模型seededit 3.0和视频生成模型seedance 1.0 Pro。豆包从最初的基础能力拓展到场景化Agent,如AI编程支持可视化编辑,相比基础性能力有了更多产品化的优化,使其变得更加好用。

形态分化:AI助理与AI办公桌面的组合
豆包正从最初主打社交的聊天机器人,演变成一个「AI助理+AI办公桌面」的组合。AI助理以移动端的豆包App为载体,强调随身、人性化的交流沟通,是一个能完成轻量化任务的陪伴者。豆包App在用户首次打开时,会用语音自我介绍,界面底栏设有通话、发现、AI创作三个按钮,聊天界面优先显示生活化、轻量化的能力,给用户一种能聊天沟通且能随手帮忙的伙伴的感觉。例如,即将去世的老人对豆包说出「我要去世了,豆包」,充分体现了其强陪伴的属性。
而AI办公桌面则以PC端的豆包电脑版为载体,更强调复杂需求的实现和效率工具的属性。豆包电脑版以浏览器形态出现,主界面强调任务执行能力,侧边栏推荐的功能都具有很强的效率工具感。与去年相比,它隐藏了聊天机器人的入口,第三方聊天机器人更为精简,基本都是具体任务的执行者。这种「AI助手+AI办公桌面」的组合适应了不同的载体形态,豆包App作为AI助手可以切入抖音、浏览器、智能耳机、智能眼镜等软件,以及Ola Friend等硬件设备中;豆包电脑版和网页版作为AI办公桌面,符合用户在电脑桌面上使用AI完成复杂工作的习惯,为图像创意等复杂任务提供了自由画布。

体系支撑:字节AI体系的坚实后盾
豆包的发展离不开字节搭建的越来越明确的AI体系。这个体系最基础的是火山引擎提供的云设施,为豆包的运行提供了强大的计算和存储支持;在此之上是不断进化的豆包大模型,它是豆包能力的核心驱动力;再上一层是作为「AI助理+AI办公桌面」的豆包应用,将大模型的能力应用化、场景化;最上层是抖音、耳机、眼镜等豆包的载体,实现了AI能力与不同场景的融合。
在这个体系中,豆包应用发挥了承上启下的关键作用。承上,它与豆包大模型紧密融合,能够快速将大模型的能力转化为实用的工具,降低使用门槛;启下,它是字节对外输出to C的AI能力的核心枢纽,串联起字节旗下不同的软硬件应用。例如,豆包在抖音的聊天列表中占据一席之地,甚至灰度测试与抖音视频页面的、评论转发放在一起,实现了与流量入口的打通。
硬件探索:软硬结合的未来愿景
豆包的野心不仅局限于软件领域,还涉及到硬件层面。字节已经在研发没有显示模组的AI眼镜和具备显示模组的MR眼镜,前者更匹配AI助手形态的豆包,后者有望落地AI助手+AI办公桌面的完整版。如果眼镜能成为PC之外的另一个大屏,豆包的助手角色和桌面角色就能够在移动端实现统一,打造出一个软硬结合、可轻可重的完整体豆包。
不过,相较于Google,字节在模型能力、硬件系统、入口能力上都更为欠缺。但字节也在不断提升模型能力,依靠垂直研发的优势,将模型能力与场景化需求更快结合起来,快速更新豆包的能力组合。火山引擎有专门的团队参与模型研发和产品开发,豆包这半年的能力更新验证了这种优势。

市场表现与未来挑战
字节跳动CEO梁汝波表示要做优秀的创新科技公司,豆包无疑是字节这种技术创新能力的核心出口。App Growing的数据显示,2024年Q2至2025年Q1,豆包季度平均投流费用为1.5225亿元,2025年Q1即梦AI投流费用只有270万元,且豆包在5月的活跃用户数达到1.31亿,还在保持增长势头。
然而,豆包也面临着挑战。它需要继续通过聚合入口和能力建立护城河,让自己成为字节想要的系统级能力。但目前从体感来看,豆包还欠缺一种串联一切的感觉。未来,豆包需要在技术创新、硬件融合、用户体验等方面不断努力,以实现其成为AI生态核心的野心,为用户带来更加丰富、便捷的AI体验。在这个过程中,它不仅要应对来自国内其他AI厂商的竞争,还要在全球范围内与科技巨头一较高下,其未来的发展充满了机遇和挑战。