前往原文
全网热点
综合
热点
娱乐
财经
科技
游戏
社区
购物
开发
区块链
华尔街见闻
.
资讯最新
13
Mistral推出Mistral Large 2:对标Llama 3.1 405B
资讯最新
·
华尔街见闻
·
2024/10/24 20:42:35
·
前往原文
AI 摘要
前往原文
Mistral Large 2拥有1230亿参数。在多个基准测试中(特别是在代码生成和数学领域),表现优异,甚至与Llama 3.1 4050亿参数相媲美。像Mistral NeMo一样,它经过大量源代码和多语言数据的训练,提供高级函数调用功能。
前往原文
相关资讯
Mistral推出Mistral Large 2:对标Llama 3.1 405B
AI 摘要
Mistral Large 2拥有1230亿参数。在多个基准测试中(特别是在代码生成和数学领域),表现优异,甚至与Llama 3.1 4050亿参数相媲美。像Mistral NeMo一样,它经过大量源代码和多语言数据的训练,提供高级函数调用功能。
资讯最新
·
华尔街见闻
·
2024年10月24日
·
前往原文
Meta发布LLAMA 3.1 405B开源人工智能模型
精选快讯
·
金色财经
·
2024年10月24日
·
前往原文
Llama 3.1 405B--大力出奇迹
AI 摘要
Joe表示,Llama 3.1 405B 真正关注的是推动规模化(它使用16000个GPU在15万亿个token上进行训练),他对它将实现的零样本工具使用以及它在提炼和生成合成数据以教授较小模型方面的作用感到兴奋。
资讯最新
·
华尔街见闻
·
2024年10月24日
·
前往原文
Meta发布最大开源AI模型Llama 3.1,英伟达新AI代工加持,云伙伴助阵
AI 摘要
本次共发布三款Llama 3.1模型,其中Llama 3.1 405B包含4050亿个参数,这是Meta迄今为止最大的模型。扎克伯格称Llama 3.1为“艺术的起点”,将对标OpenAI和谷歌公司的大模型。同时,Meta和英伟达实现强强联手,英伟达AI Foundry将为全球企业提供Llama 3.1模型的定制服务。
资讯最新
·
华尔街见闻
·
2024年10月24日
·
前往原文
开源大模型的ChatGPT时刻?备受期待的Llama 3 405B即将发布
AI 摘要
分析认为,Llama 3 405B不仅仅是人工智能能力的又一次提升,对于开源 AI 来说,“这是一个潜在的 ChatGPT 时刻”。在基准测试中,Meta Llama 3.1 在GSM8K、Hellaswag等多项测试中均优于 GPT-4o。
资讯最新
·
华尔街见闻
·
2024年10月24日
·
前往原文
Meta的Llama-3.1-405B遭泄漏,可下载,性能超GPT-4o!
AI 摘要
Llama 3.1-405B版本性能极强、参数巨大,普通的GPU无法带动,因此个人开发者可能无法担负。有网友“泼冷水”,认为该模型推理成本提升了3倍,但编码的性能却要差很多。
资讯最新
·
华尔街见闻
·
2024年10月24日
·
前往原文
Meta Llama 3.1-405B AI 模型多项跑分超越 GPT-4o,如何评价该款模型?
AI 摘要
IT之家 7 月 23 日消息,网友在 LocalLLaMA 子 Reddit 板块中发帖,分享了 4050 亿参数的 Meta Llama 3.1 信息,从该 AI 模型在几个关键 AI 基准测试的结果来看,其性能超越目前的领先者(OpenAI 的 GPT-4o)。 这是开源人工智能社区的一个重要里程碑,标志着开源模型可能首次击败目前最先进的闭源 LLM 模型。 如基准测试所示,Meta Llama 3.1 在 GSM8K、Hella......
42万热度
·
知乎热榜
·
知乎
·
2024年10月24日
·
前往原文
如何看待阿里云紧追Meta开源百余款大模型,性能超越Llama 405B,有可能实现弯道超车吗?
AI 摘要
9月19日云栖大会,阿里云CTO周靖人发布通义千问新一代开源模型Qwen2.5,旗舰模型Qwen2.5-72B性能超越Llama 405B,再登全球开源大模型王座。Qwen2.5全系列涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型,每个尺寸都有基础版本、指令跟随版本、量化版本,总计上架100多个模型,刷新业界纪录,通义在卷基模这件事情上是没有停过的,国内大模型会实现弯道超车吗?
26万热度
·
知乎热榜
·
知乎
·
2024年10月24日
·
前往原文
如何评价英伟达新发布的桌面AI超级电脑project digits?
AI 摘要
128GB内存,$3k售价,1P flops(fp4),4T存储 一块能跑200B模型(int4),两块能跑Llama 3 405B 很明显是冲着Mac Pro来的 我是真心动啊
18万热度
·
知乎热榜
·
知乎
·
2025年1月07日
·
前往原文
Mistral AI 宣布将推出新模型,性能将超越 DeepSeek,其可能在哪些方面实现突破?
AI 摘要
据华尔街日报报道,Mistral AI 宣布将发布一款超越 DeepSeek 的新模型。 Mistral AI 公司 CEO Arthur Mensch 在 MWC 2025期间表示,Mistral 近期将发布一款非常强大的模型,且该模型将超越 DeepSeek。Mensch 认为,DeepSeek 是开源领域的贡献者而非竞争对手,并且 Mensch 同意开源模式鼓励企业相互借鉴,形成良性竞争,推动 AI 技术的整体发展。 Mensch......
54万热度
·
知乎热榜
·
知乎
·
2025年3月12日
·
前往原文
华尔街见闻
相关榜单
资讯最新
热点推荐
换一批
1
中方对原产于美国商品加征34%关税
新
2
体育比赛为何会遭到美国网攻
3
不能被遗忘的人
4
中方在世贸组织起诉美“对等关税”
新
5
哈尔滨市公安局回应美网络攻击
6
毛主席外孙王效芝携家人回韶山祭扫
热
7
全红婵追星成功兴奋到搓手
热
8
美军机遭中方战机拦截释放何信号
新
9
清明画中游
10
吃“欺骗餐”不能提高基础代谢
新
11
媒体:美对华平均关税税率或超70%
热
12
尹锡悦被罢免后发表讲话
热
13
跑腿平台推4999元代扫墓服务含茅台
新
14
特朗普称美股暴跌符合预期
15
专家:尹锡悦与妻子或双双入狱
16
男子上香被烟呛后查出肺癌
17
《浪姐6》叶童怼房琪
18
谁可能成为韩国下届总统
热
19
甲亢哥第一次看熊猫惊出夹子音
20
东部战区发布视频《为了这个省》
21
专家谈特朗普加征关税对我国影响
热
22
中企该如何应对特朗普“对等关税”
新
23
4个月前韩国戒严当晚画面曝光
24
甲亢哥保镖来华前后巨大反差
25
评论员谈师生徒步百里祭英烈
新
26
尹锡悦被罢免总统职务
热
27
16亿美元的反华宣传被甲亢哥干翻
28
揭露“摆摊卖卤菜月入10万”骗局
29
尹锡悦已陷司法深渊 刑期或创新高
热
30
甲亢哥让合影小孩哥接爸爸电话
新
31
网传胡塞武装感谢中国?疑点不少
32
春笋冒头 有人一小时能挖130多斤
33
女子花500元请人代祭扫被骗
34
男子骑摩托戴“脏辫”头盔硬控交警
35
韩国大选争夺战开启
36
清明时节为何总下雨
新
37
特朗普政府因对华征收关税被起诉
38
孩子不忍送老人进养老院选择日托
新
39
大V:韩新总统将迎接两大挑战
40
地震预报仍是世界性科学难题
新
41
国际金价高位跳水
42
女子展示自己会发光的电子眼
43
伊朗放弃核武器是给美国台阶下吗
44
美国能迎来“特朗普中兴”吗
新
45
余承东不再任华为车BU董事长
46
印度男子冒充导游强奸德国游客
47
女子开着刚提的小米汽车撞上护栏
48
S妈转发大S生前影片
49
美股暴跌你敢买吗
50
杭州小米汽车门店:试驾的人特别多
新