扬帆出海APP
微信小程序
{{!completeInfo?'请完善个人信息':''}}
OpenAI正在开发一款名为“Operator”的AI Agent产品,该产品能够自动执行多种复杂操作,如编写代码、预订旅行和自动电商购物等。
摘要
内部员工透露,OpenAI计划在2025年1月发布“Operator”,并且会为开发人员提供API接口,以便他们能够集成和使用这项技术。
OpenAI正在进行几个与智能体相关的研究项目,其中最接近完成的是一个在网络浏览器中执行任务的通用工具。
OpenAI的这一计划是整个行业向智能体推进的一部分,微软、谷歌和Anthropic等公司也相继发布了功能强大的AI Agent产品。
Anthropic发布的“Computer Use”颠覆了传统的AI交互方式,允许开发者通过API让Claude像人类一样使用计算机,执行如搜索网页信息、填写电子表格数据、打开软件进行操作等任务,并且能够自动执行相应的计算机操作。
彭博今天消息,OpenAI 正准备推出一款代号为“Operator”的全新AI Agent产品,可以自动执行各种复杂操作,包括编写代码、预订旅行、自动电商购物等。
根据内部员工爆料,OpenAI领导层预计将在2025年1月发布该产品,同时会为开发人员开放API接口。
彭博表示,OpenAI一直在进行几个与智能体相关的研究项目。其中一位人士表示,最接近完成的将是一个在网络浏览器中执行任务的通用工具。
OpenAI这一计划的发布,是整个行业向智能体推进的一部分。最近微软、谷歌、Anthropic都相继发布了功能强大的AI Agent。
尤其是Anthropic发布的“Computer Use”直接颠覆了人机交互,通过API开发者可以让 Claude 像人类一样使用计算机控制鼠标、键盘,包括查看屏幕、移动光标、点击按钮和输入文本等操作。
例如,用户可以让 Claude 去搜索网页上的信息、在电子表格中填写数据;或者打开软件进行特定的操作;也能协助开发人员执行重复性任务、测试代码等,整个流程Claude 会根据指令自动执行相应的操作。
目前,Computer use主要依靠API来驱动自动化指令,当开发者通过API向Claude 发送指令时,Claude会运用其自然语言处理能力解析指令。其内部语言模型会对指令文本进行词法、句法和语义分析,例如,对于 “使用计算机中的数据填写在线表格” 这样的指令,Claude 会识别出关键动作是填写表格以及数据来源是计算机中的数据。
这一过程类似它在处理文本生成任务时对语义的理解,只是此时语义重点在于计算机操作。会基于预训练过程中学到的语言模式和知识,将指令意图映射到对应的计算机操作概念上,预训练的知识包括常见的计算机操作术语、软件功能描述等,以便准确把握开发者希望它执行的操作。
而OpenAI在明年发布的“Operator”很可能会在Computer use的基础之上进行大幅度创新和应用简化,扩大AI Agent的使用范围和应用场景。
原文链接:点击前往 >
文章作者:AIGC开放社区
版权申明:文章来源于AIGC开放社区。该文观点仅代表作者本人,扬帆出海平台仅提供信息存储空间服务,不代表扬帆出海官方立场。因本文所引起的纠纷和损失扬帆出海均不承担侵权行为的连带责任,如若转载请联系原文作者。 更多资讯关注扬帆出海官网:https://www.yfchuhai.com/
{{likeNum}}
好文章,需要你的鼓励