OpenAI 推出 Operator:AI 智能助手开启主动交互新时代

大模型之家讯 1 月 23 日晚,OpenAI 正式发布其最新 AI 工具——Operator。这款创新型 AI Agent 工具集成了内置浏览器,能够在网站上自主执行任务,为用户提供更高效、更便捷的数字化操作体验。Operator 的推出,不仅标志着人工智能从被动工具向主动助手的进化,也为未来生活与商业模式带来了全新的可能性。

OpenAI 推出 Operator:AI 智能助手开启主动交互新时代

Operator 能够自动完成一系列日常任务,如预订旅行住宿、餐厅以及在线购物等,用户只需在其界面选择任务类别,包括购物、送货、餐饮和旅行等,AI 即可自主浏览、点击和滚动网页,完成指定操作。它通过内置浏览器的屏幕截图了解界面状态,掌握何时使用按钮或填写表格。然而,当遇到需要用户输入密码等特定情况时,Operator 会进入“接管模式”,停止截屏并交由用户操作,以保障隐私安全。

目前,Operator 以研究预览形式面向美国地区的 Pro 用户开放,用户提交任务后无需额外干预即可完成操作。

技术创新:从被动工具到主动助手

Operator 的核心技术源于 OpenAI 全新的 Computer-Using Agent(CUA)模型,结合 GPT-4o 的视觉能力与强化学习驱动的推理能力。这种技术赋予 Operator 与图形用户界面(GUI)直接交互的能力,支持包括表单填写、订购物品、在线预订等任务的自动化处理。无需定制 API 的通用交互能力显著扩展了 AI 的应用范围,为用户节省了大量时间,同时为企业提供了创新客户体验的机会。

OpenAI 推出 Operator:AI 智能助手开启主动交互新时代

Operator 可执行的任务多样化,例如用户可以同时在 Instacart 上补充食品库存、在 Hipcamp 预订露营地,或根据个人需求设置操作偏好,以优化重复任务的效率。此外,Operator 已在 WebArena 和 WebVoyager 等浏览器交互测试中取得行业领先的标杆成绩,尽管在创建复杂内容(如幻灯片)或管理日历等任务中仍存在局限,但其能力正在持续增强。

隐私与安全:用户至上

在隐私保护与安全设计上,Operator 提供了三层防护:

  1. 关键点接管模式:在处理敏感信息(如支付或登录凭据)时,Operator 会将操作主动交由用户确认。
  2. 数据透明管理:用户可关闭“为全体用户改进模型”的选项,确保数据不会用于模型训练,同时支持一键清除浏览记录及任务数据。
  3. 恶意行为防护:Operator 可实时监测并规避恶意提示注入等威胁,确保任务执行安全可靠。

尽管如此,OpenAI 也承认任何技术系统都存在错误或滥用的可能性。因此,Operator 在研究预览期间将持续优化,确保功能安全性与合规性。

未来发展:迈向更广泛的应用场景

OpenAI 表示,未来将开放支持 Operator 的 CUA 模型 API,供开发者构建自定义 AI 代理工具,并逐步扩展其任务处理能力。此外,Operator 将陆续推广至 Plus、Team 和 Enterprise 用户,并整合至 ChatGPT,支持实时和异步任务处理。

OpenAI 正与多家知名企业合作,如 DoorDash、Instacart 和 Uber,共同探索 AI 在电商和物流等领域的潜力应用。此外,Operator 也积极与公共部门协作,例如与加州斯托克顿市合作简化市民服务注册流程。

Operator 的推出代表着 AI 主动智能助手的诞生,为个人与企业提供了全新的可能性。随着技术的不断完善,这一工具将在更多场景中发挥作用,为用户带来前所未有的便利与效率。

原创文章,作者:志斌,如若转载,请注明出处:http://damoai.com.cn/archives/8947

(0)
上一篇 2025年1月24日 上午10:09
下一篇 2025年1月24日 下午1:28

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注