前往原文
全网热点
综合
热点
娱乐
财经
科技
游戏
社区
购物
开发
区块链
华尔街见闻
.
资讯最新
13
Mistral推出Mistral Large 2:对标Llama 3.1 405B
资讯最新
·
华尔街见闻
·
2024/10/24 20:42:35
·
前往原文
AI 摘要
前往原文
Mistral Large 2拥有1230亿参数。在多个基准测试中(特别是在代码生成和数学领域),表现优异,甚至与Llama 3.1 4050亿参数相媲美。像Mistral NeMo一样,它经过大量源代码和多语言数据的训练,提供高级函数调用功能。
前往原文
相关资讯
Mistral推出Mistral Large 2:对标Llama 3.1 405B
AI 摘要
Mistral Large 2拥有1230亿参数。在多个基准测试中(特别是在代码生成和数学领域),表现优异,甚至与Llama 3.1 4050亿参数相媲美。像Mistral NeMo一样,它经过大量源代码和多语言数据的训练,提供高级函数调用功能。
资讯最新
·
华尔街见闻
·
2024年10月24日
·
前往原文
Meta发布LLAMA 3.1 405B开源人工智能模型
精选快讯
·
金色财经
·
2024年10月24日
·
前往原文
Llama 3.1 405B--大力出奇迹
AI 摘要
Joe表示,Llama 3.1 405B 真正关注的是推动规模化(它使用16000个GPU在15万亿个token上进行训练),他对它将实现的零样本工具使用以及它在提炼和生成合成数据以教授较小模型方面的作用感到兴奋。
资讯最新
·
华尔街见闻
·
2024年10月24日
·
前往原文
Meta发布最大开源AI模型Llama 3.1,英伟达新AI代工加持,云伙伴助阵
AI 摘要
本次共发布三款Llama 3.1模型,其中Llama 3.1 405B包含4050亿个参数,这是Meta迄今为止最大的模型。扎克伯格称Llama 3.1为“艺术的起点”,将对标OpenAI和谷歌公司的大模型。同时,Meta和英伟达实现强强联手,英伟达AI Foundry将为全球企业提供Llama 3.1模型的定制服务。
资讯最新
·
华尔街见闻
·
2024年10月24日
·
前往原文
开源大模型的ChatGPT时刻?备受期待的Llama 3 405B即将发布
AI 摘要
分析认为,Llama 3 405B不仅仅是人工智能能力的又一次提升,对于开源 AI 来说,“这是一个潜在的 ChatGPT 时刻”。在基准测试中,Meta Llama 3.1 在GSM8K、Hellaswag等多项测试中均优于 GPT-4o。
资讯最新
·
华尔街见闻
·
2024年10月24日
·
前往原文
Meta的Llama-3.1-405B遭泄漏,可下载,性能超GPT-4o!
AI 摘要
Llama 3.1-405B版本性能极强、参数巨大,普通的GPU无法带动,因此个人开发者可能无法担负。有网友“泼冷水”,认为该模型推理成本提升了3倍,但编码的性能却要差很多。
资讯最新
·
华尔街见闻
·
2024年10月24日
·
前往原文
Meta Llama 3.1-405B AI 模型多项跑分超越 GPT-4o,如何评价该款模型?
AI 摘要
IT之家 7 月 23 日消息,网友在 LocalLLaMA 子 Reddit 板块中发帖,分享了 4050 亿参数的 Meta Llama 3.1 信息,从该 AI 模型在几个关键 AI 基准测试的结果来看,其性能超越目前的领先者(OpenAI 的 GPT-4o)。 这是开源人工智能社区的一个重要里程碑,标志着开源模型可能首次击败目前最先进的闭源 LLM 模型。 如基准测试所示,Meta Llama 3.1 在 GSM8K、Hella......
42万热度
·
知乎热榜
·
知乎
·
2024年10月24日
·
前往原文
如何看待阿里云紧追Meta开源百余款大模型,性能超越Llama 405B,有可能实现弯道超车吗?
AI 摘要
9月19日云栖大会,阿里云CTO周靖人发布通义千问新一代开源模型Qwen2.5,旗舰模型Qwen2.5-72B性能超越Llama 405B,再登全球开源大模型王座。Qwen2.5全系列涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型,每个尺寸都有基础版本、指令跟随版本、量化版本,总计上架100多个模型,刷新业界纪录,通义在卷基模这件事情上是没有停过的,国内大模型会实现弯道超车吗?
26万热度
·
知乎热榜
·
知乎
·
2024年10月24日
·
前往原文
明星 AI 独角兽 Mistral AI 亮出大模型新王炸,如何评价该大模型?
AI 摘要
智东西7月17日消息,昨日据VentureBeat报道,法国AI创企Mistral AI近日推出了两款新AI模型,一个是面向程序员和开发人员的代码生成模型Codestral Mamba 7B,另一个是专为数学相关推理和科学发现而设计的AI模型Mathstral 7B。 Codestral Mamba 7B具有更快的推理速度和更长的上下文,即使在输入文本较长的情况下也能提供快速响应时间。同时,该模型可处理多达256000个token的输入......
35万热度
·
知乎热榜
·
知乎
·
2024年10月24日
·
前往原文
Stripe推出通过稳定币进行B2B支付的功能
精选快讯
·
金色财经
·
2024年11月20日
·
前往原文
华尔街见闻
相关榜单
资讯最新
热点推荐
换一批
1
乌媒称俄再次发射洲际弹道导弹
2
盘点王宝强名下企业
热
3
乌镇“网事”
4
国际刑事法院对以总理发出逮捕令
热
5
普京证实对乌实战测试新型中程导弹
热
6
王宝强被举报涉嫌诈骗
热
7
苏州马拉松“进货男女”已找到
热
8
媒体人:胖东来老板把自己当员工爹了
热
9
2024年世界职业技术教育发展大会
10
工作室回应王宝强被指欺诈:无愧于心
热
11
乌用西方导弹袭俄 俄军已失去耐心
热
12
数千移民排长队涌向美边境
13
中国妇女报:卫生巾偷工减料非小事
14
巴勒斯坦代表气到捶桌:我们也是人
15
新疆阿克苏地区地震废墟图片不实
16
湖南发现超40条金矿脉
17
以总理称国际刑事法院做有偏见决定
18
云朵方否认为版权大闹刀郎伯父灵堂
19
世卫:比新冠更糟的疫情可能会出现
20
缅北规模化电诈园区全部被铲除
21
媒体:企业请离员工私生活远一点
22
“贾宝玉”悼念郑铮:愿在天堂安好
23
小区景观水池变停车场 业主众筹破坏
24
杨子看到麦琳要上自己的车慌了
25
“移民大篷车”队伍加速向美国进发
26
人社局回应胖东来员工新规
27
顾客试吃弄脏超市人员马甲起纠纷
28
马拉松选手薅“能量胶”?官方回应
29
胖东来神似倪妮女员工离职
30
李行亮公主抱麦琳摔了
31
余华说从狭窄的地方出发会走向宽广
33
乌向俄发射6枚美制导弹均遭拦截
34
李行亮开车崩溃大哭
35
云南现“天花板级别”的瀑布云
新
36
乌空军称俄发射一枚洲际弹道导弹
37
女子买2斤泥鳅疏通下水道
38
87版红楼梦“鸳鸯”扮演者郑铮去世
39
“港独”获刑个别国家咋急了
40
网友喊话雷军生产卫生巾 小米回应
41
马斯克公布大规模“政府裁员计划”
42
员工回应胖东来倡导结婚不要彩礼
43
德媒:北溪管道爆炸事件与CIA有关
44
俩女孩带狗住半个月宾馆留满屋垃圾
45
昆明尊园地产董事长李云波去世
46
美国为何否决加沙停火决议
48
2025考研388万人报名
49
专家:卫生巾别放浴室易被霉菌污染