OpenAI 推出 Operator：AI 智能助手开启主动交互新时代

志斌 • 2025年1月24日上午10:55 • 人工智能

大模型之家讯 1 月 23 日晚，OpenAI 正式发布其最新 AI 工具——Operator。这款创新型 AI Agent 工具集成了内置浏览器，能够在网站上自主执行任务，为用户提供更高效、更便捷的数字化操作体验。Operator 的推出，不仅标志着人工智能从被动工具向主动助手的进化，也为未来生活与商业模式带来了全新的可能性。

Operator 能够自动完成一系列日常任务，如预订旅行住宿、餐厅以及在线购物等，用户只需在其界面选择任务类别，包括购物、送货、餐饮和旅行等，AI 即可自主浏览、点击和滚动网页，完成指定操作。它通过内置浏览器的屏幕截图了解界面状态，掌握何时使用按钮或填写表格。然而，当遇到需要用户输入密码等特定情况时，Operator 会进入“接管模式”，停止截屏并交由用户操作，以保障隐私安全。

目前，Operator 以研究预览形式面向美国地区的 Pro 用户开放，用户提交任务后无需额外干预即可完成操作。

技术创新：从被动工具到主动助手

Operator 的核心技术源于 OpenAI 全新的 Computer-Using Agent（CUA）模型，结合 GPT-4o 的视觉能力与强化学习驱动的推理能力。这种技术赋予 Operator 与图形用户界面（GUI）直接交互的能力，支持包括表单填写、订购物品、在线预订等任务的自动化处理。无需定制 API 的通用交互能力显著扩展了 AI 的应用范围，为用户节省了大量时间，同时为企业提供了创新客户体验的机会。

Operator 可执行的任务多样化，例如用户可以同时在 Instacart 上补充食品库存、在 Hipcamp 预订露营地，或根据个人需求设置操作偏好，以优化重复任务的效率。此外，Operator 已在 WebArena 和 WebVoyager 等浏览器交互测试中取得行业领先的标杆成绩，尽管在创建复杂内容（如幻灯片）或管理日历等任务中仍存在局限，但其能力正在持续增强。