OpenAI 最强推理模型 o3 发布，AGI 测试能力暴涨，会对哪些领域带来影响？ - 知乎热榜 - 知乎

知乎

知乎热榜

热度累计中

2024/12/21 12:39:17

AI 摘要

周五，在“OpenAI 12天活动”的第12天，OpenAI首席执行官萨姆·奥特曼宣布了其最新的人工智能“推理”模型o3和o3-mini，这两款模型是在今年早些时候推出的o1模型的基础上开发的。该公司尚未发布这些模型，但今天将使这些模型可用于公共安全测试和研究。这些模型使用OpenAI所称的“私人思维链”，模型会暂停检查其内部对话，并在响应之前提前计划，你可以称之为“模拟推理”（SR），即一种超越基本大型语言模型（llm）的人工智能形式。为了避免与英国电信运营商o2发生潜在的商标冲突，该公司将其命名为“o3”而不是“o2”。在周五的直播中，奥特曼承认了他的公司命名的缺点，他说：“按照OpenAI非常非常不擅长命名的伟大传统，它将被命名为o3。” 根据OpenAI的说法，o3模型在ARC-AGI基准上获得了破纪录的分数，ARC-AGI基准是一种视觉推理基准，自2019年创建以来一直保持不败。在低计算场景中，o3得分为75.7%，而在高计算测试中，它达到了87.5%，与人类在85%阈值下的表现相当。 OpenAI还报告说，o3在2024年美国数学邀请赛中得分为96.7%，只缺了一道题。......

相关资讯

OpenAI 最强推理模型 o3 发布，AGI 测试能力暴涨，会对哪些领域带来影响？

AI 摘要

热度累计中

知乎热榜

知乎

2024年12月21日

前往原文

受DeepSeek影响？OpenAI上线O3 Mini，推理模型首次免费

AI 摘要

随着DeepSeek发布的开源模型震撼全球，OpenAI的这款新品备受关注。o3-mini支持开发者调整“AI推理努力程度”，分为低、中、高三个级别。o3-mini能够以更低的成本、更快的响应速度，为用户提供STEM能力，在科学、数学和编程领域表现尤为出色。在2024年美国数学邀请赛的测试中，在最高努力水平时，o3-mini的准确率提升至87.3%。在博士级科学问题方面，在最高努力水平时，准确率接近80%。

资讯最新

华尔街见闻

2025年2月01日

前往原文

OpenAI 即将发布开源推理模型，对行业会带来怎样的影响？

AI 摘要

2025 年 3 月 31 晚，奥特曼宣布: 几个月后将发布自 GPT-2 以来的第一个开源 openai 模型，这对大模型领域有何影响。

54万热度

知乎热榜

知乎

2025年4月03日

前往原文