11万热度
·
·
·
2024/11/18 11:09:40
·
AI 摘要
前往原文
11月16日,月之暗面Kimi Chat宣布推出新一代数学推理模型k0-math。 基准测试显示,Kimi k0-math的数学能力可对标全球领先的OpenAI o1系列可公开使用的两个模型:o1-mini和o1-preview。在中考、高考、考研以及包含入门竞赛题的MATH等4个数学基准测试中,k0-math初代模型成绩超过o1-mini和o1-preview模型。在两个难度更大的竞赛级别的数学题库OMNI-MATH和AIME基准测试中,k0-math初代模型的表现分别达到了o1-mini最高成绩的90%和83%。 同时,Kimi探索版也通过运用强化学习技术创新了搜索体验,在意图增强、信源分析和链式思考三大推理能力上实现突破。Kimi创始人杨植麟介绍,k0-math模型和更强大的Kimi探索版,未来几周将会分批陆续上线Kimi网页版和Kimi智能助手APP,帮助大家解决更有挑战的数学和搜索调研类任务。月之暗面发布k0-math推理模型
相关资讯
AI 摘要
11月16日,月之暗面Kimi Chat宣布推出新一代数学推理模型k0-math。 基准测试显示,Kimi k0-math的数学能力可对标全球领先的OpenAI o1系列可公开使用的两个模型:o1-mini和o1-preview。在中考、高考、考研以及包含入门竞赛题的MATH等4个数学基准测试中,k0-math初代模型成绩超过o1-mini和o1-preview模型。在两个难度更大的竞赛级别的数学题库OMNI-MATH和AIME基准测试......
11万热度
·
·
·
2024年11月18日
·
AI 摘要
https://openai.com/index/learning-to-reason-with-llms/ 上面是官方介绍-下面是一些总结 O1 是一种在给出最终答案之前会思考的模型。 O1-preview 具有很强的推理能力和广阔的世界知识。 O1-mini 速度更快,成本便宜 80%,并且在编码任务方面比 O1-Preview 更具竞争力。 OpenAI首款推理模型o1发布:比GPT-4o更慢、更贵
187万热度
·
·
·
2024年10月24日
·
AI 摘要
OpenAI计划最早于今年秋天推出代号为“草莓”的新AI模型,并已经向美国国家安全官员做了演示。据知情人士透露,这款人工智能模型预计最早将于今年秋季作为聊天机器人的一部分推出,可能集成于ChatGPT平台中。
105W
·
·
·
2024年10月24日
·
AI 摘要
o1就是业界盛传的“草莓”项目,未来某个未知时刻免费用户将能体验o1迷你版。o1模型使用成本至少是GPT-4o的3倍,初始发送信息数有限,采用全新方法训练,对复杂的推理任务是重大进步,甚至具有专家型人才的水平,但仅为“纯文字”版,无法浏览实时网页、无法上传文件和图片、缺乏广泛世界知识、或更易产生幻觉。
AI 摘要
字节跳动对自身的估值约为 3000 亿美元;首个机械量子比特问世;3D 打印机能打印器官了
0W
·
·
·
2024年11月21日
·
相关榜单
热点推荐
换一批