28万热度
·
·
·
2025/01/24 20:06:13
·
AI 摘要
前往原文
1月24日消息,OpenAI在北京时间凌晨举行直播活动,发布了市场期待已久的AI智能体Operator(意为操作员),它能够代理用户执行基于网页的操作,像人类一样点击、滚动和输入文字,完成诸如购买杂货、预订餐厅以及提交费用报告等任务。 在此之前,包括微软、Salesforce和Workday等商业软件公司纷纷推出了各自的智能体。谷歌和人工智能初创公司Anthropic近期也推出了类似的智能体工具,它们与OpenAI的Operator相似,能够浏览网页并与菜单和按钮进行交互。 但Operator的特点是,与其他各家Agent相比,它会通过CUA的系统进行复杂的思维链反思和步骤规划。这可以大大提高其完成任务的精度和复杂性。在不依靠对具体任务进行精调的情况下,Operator就能泛化的完成多种复杂任务。虽然在直播的实机演示中,OpenAI仅仅展示了网购、订餐等基础操作。但在后续的部分用户测试中,它甚至可以完成在Arxiv上进行论文分类搜索,阅读多篇论文并完成综述整理的复杂工作。而且这个工作肯定是不太可能被纳入传统精调过的“意图理解”框架内的。 另外,CUA本身在网页控制和系统控制方面也达到了......
相关资讯
AI 摘要
1月24日消息,OpenAI在北京时间凌晨举行直播活动,发布了市场期待已久的AI智能体Operator(意为操作员),它能够代理用户执行基于网页的操作,像人类一样点击、滚动和输入文字,完成诸如购买杂货、预订餐厅以及提交费用报告等任务。 在此之前,包括微软、Salesforce和Workday等商业软件公司纷纷推出了各自的智能体。谷歌和人工智能初创公司Anthropic近期也推出了类似的智能体工具,它们与OpenAI的Operator相似......
28万热度
·
·
·
2025年1月24日
·
相关榜单
热点推荐
换一批