首页
智能设备
数据安全
绿色科技
栏目分类

数据安全

你的位置:未来探索网 > 数据安全 > 马斯克用20万张卡练出的Grok 3能卓绝DeepSeek吗?

马斯克用20万张卡练出的Grok 3能卓绝DeepSeek吗?

发布日期:2025-03-28 14:33    点击次数:144

马斯克用20万张卡练出的Grok 3能卓绝DeepSeek吗?

出品|虎嗅科技组

作者|孙晓晨

剪辑|苗正卿

头图|直播画面

 

2月18日,马斯克所言“地球上最贤惠的东谈主工智能”终于亮相,其旗下东谈主工智能公司xAI端庄发布其新一代的大谈话模子Grok 3,马斯克本东谈主也在外交平台X上同步开启直播演示。

 

据直播先容,Grok 3已卓绝当今阛阓上统统已发布的东谈主工智能。在官方公布的测试数据中,其在数学推理、科学逻辑推理以及代码写稿等方面泄露均优于ChatGPT-4o、DeepSeek-V3等竞品。

 

 

Grok大模子是马斯克旗下的xAI公司推出的东谈主工智能模子,其定名源自好意思国科幻作者罗伯特·海因莱因的演义《异乡异客》(Stranger in a Strange Land)。该系列第一款大模子Grok 1于2023年11月面世,2024年该模子参数目推广至3140亿,远超GPT-3.5的1750亿。2024年8月,Grok 2大模子发布,在Grok 1基础上全面升级,并在X平台上头向用户免费使用。而这次直播推出的Grok 3,据工程师暗意,其所波及的熟习是Grok 2的10倍,且Grok 3照旧在xAI里面运行了2周。

 

据悉,Grok 3熟习所用GPU总量为20万个,在第一阶段通过10万个GPU进行熟习,耗时144天,而第二阶段的92天中,所用GPU数目拓展到了20万个。此前据报谈,印度已启动一个有逾越1.8万个GPU的行家筹画局势,将对初创公司、相关东谈主员和建立者怒放,以促进其国内东谈主工智能发展以及本国大谈话模子的熟习。相较之下,xAI的Grok 3熟习所用GPU总量已远超印度国度级面孔GPU总量10倍不啻。纷乱的算力界限成为Grok 3加快问世的最大助力,也让xAI在日益浓烈的阛阓竞争底气统统。

 

在直播行为中,xAI的工程师展示了Grok 3的使用,如现场生成一段天际放射的3D动画的代码、制作一款交融“对峙迷阵”和“俄罗斯方块”的游戏,Grok 3均泄露雅致,这也说明了该模子关于复杂常识具有雅致的剖析。马斯克暗意,Grok 3的功能比Grok 2坚定一个数目级。

 

 

濒临Grok 3的极佳泄露,有有名博主Alexandr Wang暗意,Grok 3是宇宙上新的最好模子,其在聊天机器东谈主竞技场中名挨次一,且遥遥最初。Amjad Masad也暗意Grok 3似乎是发轫进的顶端模子,他以为考虑xAI的处境,该模子的发布无疑是巨大建立。有名播客主握东谈主Lex Fridman雷同对该模子印象潜入,抒发了对该模子的奖饰。

 

而Grok 3所带来的扰攘,本色上比该模子的端庄面世要来得早。

 

此前,DeepSeek谢宇宙范围内掀翻高涨。由于DeepSeek-R1模子的优秀泄露,以十分代表的低本钱熟习门路,东谈主们一度运转议论全球AI话语权的包摄问题。尽管东谈主工智能行业尚处于华夏逐鹿的阶段,关联词DeepSeek-R1模子无疑为这个宇宙带来巨大冲击。

 

继DeepSeek爆火之后,2月13日,OpenAI首席施行官奥特曼发布博文,文告准备推出GPT-4.5和GPT-5,并公布门路图。

 

雷同在2月13日,马斯克在迪拜宇宙政府峰会上暗意xAI将推出新一代模子Grok 3,并盛赞其“强到让东谈主感到发怵”。而这也激发了东谈主们对Grok 3的猜度,致使于议论AI话语权可能再度扯向西方。

 

至此,一场关联东谈主工智能模子的“三国杀”已见雏形。

 

当作xAI的要紧阛阓竞争敌手,OpenAI对Grok 3的反映也引起东谈主们的防备。在本日马斯克的直播行为运转之前,奥特曼在外交平台X发布音问,称GPT-4.5已参加测试阶段,并称其体验“接近通用东谈主工智能(AGI)”,而这一溜为被外界视为对Grok 3的要紧“狙击”。

 

 

比较于明星居品DeepSeek-R1,“推理+测试期间筹画”中,在数学推理、科学逻辑推理和编程三个方面,Grok 3 Reasoning Beta版块详尽得分鉴识为93、85、79,均高于DeepSeek-R1的80、71和65。最新AIME 2025性能测试中,Grok 3 Reasoning Beta版块有93分,高于DeepSeek-R1。前特斯拉东谈主工智能总监、OpenAI首创团队成员Andrej Karpathy通过提前体验指出,Grok 3模子照实不错作念到DeepSeek-R1作念不到的事。而单纯从测试数据看,Grok 3照实作念到了比DeepSeek-R1略好。

 

尽管Grok 3在测试中收货优秀,关联词仍有分析泄露,在 “推理+测试期间筹画” 这一测试中,比较于o3-mini(high)或DeepSeek-R1,Grok 3的数学性能并莫得显赫上风。马斯克暗意,Grok 3仍处于早期熟习阶段,改日将握续优化。

 

 

 

据了解,自本日起,X平台Premium Plus订阅用户将率先取得Grok 3造访权限。此外,xAI还推出了名为Super Grok的孤苦订阅办事,但尚未公开订价。马斯克还暗意,当今xAI的工程师团队正在熟习Grok 3的迷你版块,并指出“迷你版的熟习期间更长,偶而泄露略好于Grok 3推理模子。”

 

自Grok 3运转,马斯克“再无AI比Grok更优秀”的预言能否成真?以当今AI的更新速率而言,当真难以定论。但就该模子的泄露来看,在东谈主工智能的牌局上,马斯克照实甩出了有重量的“大牌”。