北京时间8月14日晚,马一龙旗下 xAI 的大模型 Grok 2 正式发布。 本次发布的 Grok 2 系列主要包括两个版本:Grok-2 和 Grok-2 miniGrok-2:类似于GPT-4o,处于大模型的中上游水准。Grok-2 mini:类似于GPT-4o-mini,响应速度快,但回复的质量不及 Grok-2。 Grok-2 的早期版本已经以 “sus-column-r” 的名字在 LMSYS 排行榜上进行了测试。在 LMSYS 排行榜上,它的 Elo 总评分超过了 Claude 和 GPT-4。 xAI团队对 Grok-2 系列模型进行了推理、阅读理解、数学、科学和编程等一系列学术基准测试。Grok-2 和 Grok-2 mini 在这些领域的表现均显著优于之前的 Grok-1.5,且在研究生水平的科学知识(GPQA)、一般知识(MMLU, MMLU-Pro)和数学竞赛问题(MATH)等领域表现不俗。此外,Grok-2 在视觉任务中表现卓越,在视觉数学推理(MathVista)和基于文档的问答(DocVQA)方面达到了最先进的水平。 它是否真正有实力和GPT-4o,Clau......