马斯克用20万张卡练出的Grok 3能超出DeepSeek吗
作者:[db:作者] 发布时间:2025-02-19 08:33
2月18日,马斯克所言“地球上最聪慧的人工智能”终于表态,其旗下人工智能公司xAI正式宣布其新一代的年夜言语模子Grok 3,马斯克自己也在交际平台X上同步开启直播演示。据直播先容,Grok 3已超出现在市场上全部已宣布的人工智能。在官方颁布的测试数据中,其在数学推理、迷信逻辑推理以及代码写作等方面表示均优于ChatGPT-4o、DeepSeek-V3等竞品。Grok年夜模子是马斯克旗下的xAI公司推出的人工智能模子,其定名源自美国科幻作家罗伯特·海因莱因的小说《他乡异客》(Stranger in a Strange Land)。该系列第一款年夜模子Grok 1于2023年11月面世,2024年该模子参数目扩大至3140亿,远超GPT-3.5的1750亿。2024年8月,Grok 2年夜模子宣布,在Grok 1基本上片面进级,并在X平台下面向用户无偿使用。而此次直播推出的Grok 3,据工程师表现,其所波及的练习是Grok 2的10倍,且Grok 3曾经在xAI外部运转了2周。据悉,Grok 3练习所用GPU总量为20万个,在第一阶段经由过程10万个GPU停止练习,耗时144天,而第二阶段的92天中,所用GPU数目拓展到了20万个。此前据报道,印度已启动一个有超越1.8万个GPU的大众盘算设备,将对始创公司、研讨职员跟开辟者开放,以增进其海内人工智能开展以及本国年夜言语模子的练习。相较之下,xAI的Grok 3练习所用GPU总量已远超印度国度级名目GPU总量10倍不止。宏大的算力范围成为Grok 3减速问世的最年夜助力,也让xAI在日益剧烈的市场竞争底气实足。在直播运动中,xAI的工程师展现了Grok 3的应用,如现场天生一段太空发射的3D动画的代码、制造一款融会“宝石迷阵”跟“俄罗斯方块”的游戏,Grok 3均表示精良,这也证实了该模子对庞杂常识存在精良的懂得。马斯克表现,Grok 3的功效比Grok 2强盛一个数目级。面临Grok 3的极佳表示,有著名博主Alexandr Wang表现,Grok 3是天下上新的最佳模子,其在谈天呆板人竞技场中排名第一,且遥遥当先。Amjad Masad也表现Grok 3仿佛是开始进的尖端模子,他以为斟酌xAI的处境,该模子的宣布无疑是宏大成绩。著名播客掌管人Lex Fridman同样对该模子印象深入,表白了对该模子的称颂。而Grok 3所带来的动乱,现实上比该模子的正式面世要来得早。此前,DeepSeek活着界范畴内掀起高潮。因为DeepSeek-R1模子的优良表示,以及其代表的低本钱练习道路,人们一度开端探讨寰球AI话语权的归属成绩。只管人工智能行业尚处于群雄逐鹿的阶段,然而DeepSeek-R1模子无疑为这个天下带来宏大打击。继DeepSeek爆火之后,2月13日,OpenAI首席履行官奥特曼宣布博文,发布筹备推出GPT-4.5跟GPT-5,并颁布道路图。同样在2月13日,马斯克在迪拜天下当局峰会上表现xAI将推出新一代模子Grok 3,并盛赞其“强到让人觉得惧怕”。而这也激发了人们对Grok 3的猜想,甚至于探讨AI话语权可能再度扯向东方。至此,一场有关人工智能模子的“三国杀”已见雏形。作为xAI的主要市场竞争敌手,OpenAI对Grok 3的反映也惹起人们的留神。在本日马斯克的直播运动开端之前,奥特曼在交际平台X宣布新闻,称GPT-4.5已进入测试阶段,并称其休会“濒临通用人工智能(AGI)”,而这一行动被外界视为对Grok 3的紧迫“偷袭”。比拟于明星产物DeepSeek-R1,“推理+测试时光盘算”中,在数学推理、迷信逻辑推理跟编程三个方面,Grok 3 Reasoning Beta版本综合得分分辨为93、85、79,均高于DeepSeek-R1的80、71跟65。最新AIME 2025机能测试中,Grok 3 Reasoning Beta版本有93分,高于DeepSeek-R1。前特斯拉人工智能总监、OpenAI开创团队成员Andrej Karpathy经由过程提前休会指出,Grok 3模子确切能够做到DeepSeek-R1做不到的事。而纯真从测试数据看,Grok 3确切做到了比DeepSeek-R1略好。只管Grok 3在测试中成就优良,然而仍有剖析表示,在 “推理+测试时光盘算” 这一测试中,比拟于o3-mini(high)或DeepSeek-R1,Grok 3的数学机能并不明显上风。马斯克表现,Grok 3仍处于晚期练习阶段,将来将连续优化。据懂得,自本日起,X平台Premium Plus订阅用户将率先取得Grok 3拜访权限。别的,xAI还推出了名为Super Grok的自力订阅效劳,但尚未公然订价。马斯克还表现,现在xAI的工程师团队正在练习Grok 3的迷你版本,并指出“迷你版的练习时光更长,偶然表示略好于Grok 3推理模子。”自Grok 3开端,马斯克“再无AI比Grok更优良”的预言是否成真?以现在AI的更新速率而言,认真难以定论。但就该模子的表示来看,在人工智能的牌局上,马斯克确切甩出了有分量的“年夜牌”。
电话
020-66888888