
“未来数年,数以百万计的AI智能体(AI Agent)将构建全新经济生态,推动全球产业格局进入‘智能体密度竞争’时代”,这一预言在2025年正在加速照进现实。
大模型之家注意到,自今年1月24日OpenAI发布全球首个AI智能体Operator,到智谱推出智能体框架GLM-PC 1.1;再到Monica团队推出通用AI智能体Manus,字节跳动正式发布“扣子空间”(Coze Space)。
AI智能体,作为AI技术落地的核心形态,正迅速渗透到各类生活场景中。

图:想让“扣子空间”生成的封面图,结果它没做并丢了两个网站
其中,最让打工人心动的,莫过于交给用户一条口令,AI智能体就能够根据要求完成用户所需要的工作,仿佛AI智能体成为了“打工人福音”。
那么,现阶段AI智能体,真的能成为打工人福音吗?
为此,大模型之家主要是对号称“办公室数字牛马”的字节跳动“扣子空间”进行了全面评测。从内容领域以及产品性能等方面,扣子空间到底表现如何?
办公场景应用:文档撰写与表格生成
作为“办公室数字牛马”,第一件事,必须是文档撰写能力。
大模型之家提出了:撰写一篇关于上海茶饮行业近几年的发展情况以及投资机会分析的研究报告,并指定输出格式,它就能自动分解任务,按步完成。

最终“扣子空间”不仅能生成符合要求的 Markdown 文件,还能生成图文并茂、有数据有论述的网页文件。此外,它还支持生成 Office文档、PDF、飞书文档等多种格式,满足不同办公场景的需求。
在生成飞书文档时,系统会先从文字报告生成网页,然后提示用户将网页内容复制到飞书;而生成 PDF文件或幻灯片 PPT文件时,系统会直接给出文件下载。
而另外一个办公室最常用的“数据处理与表格生成”,大模型之家要求“生成包含上证50指数成分股及其最新收盘价的表格”,默认情况下,表格会显示在网页上,同时系统还会给出一个CSV文件供下载。如果需要完备的电子表格功能,用户可以将 CSV 文件导入电子表格软件进行进一步处理。

生活场景应用测试:未来将不存在专业壁垒
作为一款AI智能体,功能当然不会只能用来AI办公,在一些个性化服务上,大模型之家通过“导入商品信息和用户画像,结合购买记录和自然语言诉求”,扣子空间还可以抓取电商平台信息推送相关产品。
在推送的内容中,还会展示产品的基本信息,电商平台的用户评价,并提炼总结给出购买建议。省去了之前要跨多个平台进行产品比价,以及做攻略的步骤。

由于MCP扩展中大模型之家加入了像“高德地图”、“墨迹天气”、“语音合成”等应用,所以扣子空间还可以获取位置、天气、新闻等信息,生成主播脚本并进行音频合成,为用户打造个性化播客系统。
最让大模型之家意外的是,在学习和娱乐方面,扣子空间不仅可以生成互动式的学习网站,帮助用户学习CSS的oklch 颜色函数;用户通过简单的指令即可让它生成网页游戏,满足娱乐需求。

此前像这种需要UI设计,然后必须懂网页代码才能做出来的网页游戏,如今通过简单的指令,AI智能体3分钟左右就帮你生成了一个可以玩的“贪吃蛇游戏”。
此前大家常说的“专业的事交给专业的人”,可能随着AI智能体的发展,会变成“专业的事情交给专业的Agent”。
产品性能评测:可以实现全链路任务自动化
在产品性能方面,扣子空间基于深度学习和 NLP 技术,可自主完成需求解析、工具选择到结果输出的全流程。用户仅需提出需求,即可获得网页、PPT、飞书文档等完整成果。
其任务拆解能力支持调用浏览器、代码编辑器等工具,避免了手动配置插件或提示词工程的繁琐。例如,在制作采购规划时,用户只需输入“小米电视 85 – 100 寸的产品,有哪些在售的,帮我整理出一份对照网页,重点在尺寸、参数和价格,要好看”,大约五分钟后就能获得符合需求的结果,体验流畅。

大模型之家评测发现,扣子空间还独创了探索模式与规划模式双轨机制。探索模式支持快速迭代的轻量级任务,AI自主动态探索,速度较快,适合时效性强的任务,如文档生成。
规划模式则针对多步骤复杂场景,通过200B参数的MoE架构模型实现深度思考与实时搜索结合,AI 会先进行步骤拆解,在用户确认或修改后,才进入分步执行,适合需要精细控制的高难度任务,如行业报告撰写。例如,在制作精酿啤酒的多维表格时,使用规划模式可以让用户更好地控制任务执行过程,确保结果符合需求。
另外,扣子空间构建了“通用实习生 + 领域专家”双轨服务矩阵。基础层的通用型AI助手可以处理日常事务,而专业层的专家Agent则能提供更深入的专业服务。

目前,内置了“华泰 A 股观察助手”和“用户研究专家”两个专家 Agent。“华泰 A 股观察助手”可生成投研日报,针对股票分析具体问题进行答疑解惑;“用户研究专家”可实现问卷交叉分析与访谈纪要智能整理。不过,专业 Agent 标注“限时免费”,暗示未来可能采用订阅制商业模式。
技术突破与生态扩展:开放式架构使智能体可无限扩展技能
MCP作为AI能力的“标准USB接口”,首批集成了飞书多维表格、高德地图等平台,未来支持开发者通过扣子开发平台发布自定义插件。
大模型之家认为,这种开放式架构使智能体可无限扩展技能,例如调用图像工具生成穿搭推荐图,或通过语音合成输出会议纪要音频。扣子空间通过简化MCP调用流程,如支持飞书表格直接导入、一键接入第三方插件,将原本需代码开发的功能平民化,降低了使用门槛。
平台集成了MCP(模块化能力组件)扩展体系,内测首期已支持飞书多维表格、高德地图、图像工具等高频办公组件接入。
字节跳动官方表示,在未来,扣子将支持“扣子开发平台”发布MCP至“扣子空间”,持续拓展Agent能力边界。用户可以根据自己的需求添加相应的MCP扩展,以实现更多功能。
实测效能与行业对比:各有优略
在简单任务方面,扣子空间表现出色,如5分钟就能完成含预算参考的5天旅行攻略。但在复杂场景下,如用户研究报告生成耗时约40分钟,且存在Python脚本调用失败等问题。对比测试显示,其文档生成速度较DeepSeek慢23%,但内容丰富度提升37%。
与竞品Manus相比,扣子空间具有开放性,支持用户自定义MCP插件,而Manus是封闭式工具集成。

扣子空间采用双模式动态切换,而Manus是单一深度规划;扣子空间复杂任务成功率为 81%,Manus任务成功率为92%。不过,扣子空间在跨平台协作(如飞书文档自动同步)和可视化工作流搭建方面具有显著优势。
产品操作体验:简单易懂 确实好用
扣子空间的界面简单易懂,左侧是任务列表,右侧是一个对话框,用来输入新任务。执行任务要求时,默认是“探索模式”,AI自动完成各个步骤,速度较快;用户也可以改成“规划模式”,显示AI思考的中间步骤,便于随时调整。除此以外,就没有需要设置的地方了,很符合直觉。用户还可以通过上传本地文件或链接,文本描述输入需要扣子空间完成的任务,它会进行自动应用开发。

而且扣子空间打破了传统AI的“黑盒”模式,用户可以通过规划模式实时查看任务拆解、工具调用、中间结果及最终交付物。
例如,在整理“国内AI行业对Agent的共识”任务中,扣子空间不仅列出思维导图框架,还标注了数据来源(如知乎、行业白皮书、学术论文)和分析逻辑,甚至允许用户中途修正关键词权重。在规划模式中,用户可随时暂停任务、调整参数,避免“一步错步步错”,这种设计将 AI 从“自动驾驶”降级为“副驾驶”,赋予用户更强的控制感。
存在的问题与挑战:幻觉仍然存在 依赖用户AI素养
在处理复杂任务时,扣子空间的稳定性有待提高。如调用Python脚本分析股票数据时,常因API权限或数据源问题失败;在生成旅游计划时,也可能出现高德地图显示不成功的情况。

AI普遍存在的“幻觉”问题在扣子空间上也有所体现。例如,在生成的行业报告中,部分技术趋势描述与实际情况存在偏差(如误判 GPT-5 发布时间);在生成的 AI 资讯页面中,提到的一些信息也与实际情况不符。
尽管扣子空间降低了操作门槛,但如何精准定义任务需求(如区分“整理观点”与“提炼共识”)、选择合适的Agent类型(通用vs专家),仍依赖用户的AI素养。用户需要一定的时间来熟悉和掌握扣子空间的功能和使用方法,才能更好地发挥其优势。
写在最后
扣子空间的推出标志着字节跳动在AI协同办公领域迈出了重要一步。它以其独特的功能和创新的设计,为用户提供了高效、便捷的 AI 协作体验,在办公和生活场景中都具有广泛的应用前景。其开放式 MCP 架构和双模式协作机制,正在重塑 AI 协同办公的价值范式。随着 2000 万开发者生态的培育,该平台有望成为企业智能化转型的基础设施级入口。
然而,作为一款内测产品,扣子空间仍存在一些问题和挑战,如技术稳定性不足、幻觉问题以及用户认知门槛等。未来,需要不断优化和改进,提高产品的性能和稳定性,丰富专家 Agent生态,吸引更多高质量的MCP扩展应用,以满足用户日益增长的需求。同时,也需要探索合适的商业化路径,实现可持续发展。
原创文章,作者:志斌,如若转载,请注明出处:http://damoai.com.cn/archives/10180