周五,在“OpenAI 12天活动”的第12天,OpenAI首席执行官萨姆·奥特曼宣布了其最新的人工智能“推理”模型o3和o3-mini,这两款模型是在今年早些时候推出的o1模型的基础上开发的。该公司尚未发布这些模型,但今天将使这些模型可用于公共安全测试和研究。 这些模型使用OpenAI所称的“私人思维链”,模型会暂停检查其内部对话,并在响应之前提前计划,你可以称之为“模拟推理”(SR),即一种超越基本大型语言模型(llm)的人工智能形式。 为了避免与英国电信运营商o2发生潜在的商标冲突,该公司将其命名为“o3”而不是“o2”。在周五的直播中,奥特曼承认了他的公司命名的缺点,他说:“按照OpenAI非常非常不擅长命名的伟大传统,它将被命名为o3。” 根据OpenAI的说法,o3模型在ARC-AGI基准上获得了破纪录的分数,ARC-AGI基准是一种视觉推理基准,自2019年创建以来一直保持不败。在低计算场景中,o3得分为75.7%,而在高计算测试中,它达到了87.5%,与人类在85%阈值下的表现相当。 OpenAI还报告说,o3在2024年美国数学邀请赛中得分为96.7%,只缺了一道题。......