简体 English
返回
/
/
/
AI领域风云激荡:Grok 3、GPT-4与DeepSeek的激烈角逐

AI领域风云激荡:Grok 3、GPT-4与DeepSeek的激烈角逐

  • 分类:行业新闻
  • 作者:
  • 来源:
  • 发布时间:2025-02-20 16:46
  • 访问量:

【概要描述】

AI领域风云激荡:Grok 3、GPT-4与DeepSeek的激烈角逐

【概要描述】

  • 分类:行业新闻
  • 作者:
  • 来源:
  • 发布时间:2025-02-20 16:46
  • 访问量:
详情
 
当地时间2月17日晚,马斯克的新一代AI模型Grok 3及其精简版Grok 3 mini在一场备受瞩目的发布会中震撼亮相。Grok 3以由20万块GPU组成的超级计算机集群Colossus为强大后盾,在AI竞技场中一路过关斩将,狂破1400分,成功登顶排行榜。早在发布会前几天,马斯克就在其社交平台X上为Grok 3造势,称其为“地球上最聪明的人工智能”。

图片
 
在AI基准测试开放平台lmarena.ai上,经过约8000次投票后,早期版本的Grok 3(代号chocolate)在Arena排行榜上一骑绝尘,且在所有分类中均拔得头筹。在各项能力测试中,Grok 3的表现堪称惊艳。在数学能力测试(AIME'24)里,Grok 3斩获52分,将DeepSeek - V3的39分和GPT-4o的9分远远抛在身后;科学知识评估(GPQA)中,它以75分的成绩遥遥领先,DeepSeek - V3和GPT-4o分别只有65分和50分;编程能力测试(LCB Oct - Feb)中,57分的成绩也远超DeepSeek - V3的36分和GPT-4o的34分。推理模型比较中,Grok 3 Reasoning Beta也战胜了OpenAI的o3 - mini、DeepSeek的R1和Gemini - 2 Flash Thinking等推理模型。

图片
 
 发布会现场,Grok 3的强大实力得到了更直观的展示。当被要求生成一段代码,绘制从地球发射火箭,降落在火星,然后在下一个发射窗口返回地球的三维动画图表时,它迅速完成任务,生成的动画经研究人员检查完全正确,大量复杂数学和物理计算对它来说似乎轻而易举。随后,编写结合俄罗斯方块和宝石迷城的游戏,Grok 3也顺利完成,展现出强大的编程和逻辑思维能力。

图片
 
xAI工程师介绍,虽然Grok起步较晚,但在MMLU得分上以超的速度追上了ChatGPT。Grok-3和Grok-3 mini在多方面性能上都超过或媲美Gemini、DeepSeek和ChatGPT等对手。

OpenAI联合创始人Andrej Karpathy在亲身体验后评价道,Grok 3 + Thinking的表现与ChatGPT的某些高级版本相当,略微优于DeepSeek R1等模型。然而,在某些特定问题上,例如解码任务,Grok 3的表现可能不及DeepSeek R1。

另一边,GPT-4o也悄然更新版本。

OpenAI 放开成人内容?体验新版 GPT-4o 后,我想再次感谢 DeepSeek
 
除了在数学单项中排名第6外,GPT-4o在创意写作、编程和长文本查询等多个单项上都拿下第一。从网友测试反馈来看,新版GPT-4o不仅更“聪明”,而且更具“个性”,回复时的语气更拟人化,还会时不时使用一些表情包。OpenAI CEO奥特曼评价新版GPT-4o相当不错,并表示它不久将变得更好,还将其定义为“全网最佳搜索产品”。

在xAI公司的Grok 3取得重大进展之时,AI行业的其他同行们也在飞速前进。2025年,DeepSeek的V3和R1版本引发了新的行业浪潮,尤其是R1大模型备受业内赞誉。R1大模型采用了MOE架构(混合专家,Mixture-of-Experts),这一架构同样被应用于Grok的初代版本中。在开源的大环境中,各家如何凭借自身的技术实力练就卓越的AI“武功”,成为了行业关注的焦点。

 

图片

 

在DeepSeek-R1模型的冲击下,不少公司都陆续放出大招。

 

2月6日,OpenAI宣布扩大ChatGPT搜索功能的用户范围,任何人无需注册,就可以使用ChatGPT的搜索功能;同日,谷歌正式推出Gemini 2.0系列模型,包括Flash、Pro及Flash-Lite版本,继续提升AI能力,并提供更具性价比的解决方案。

 

2月13日,Sam Altman宣布,将很快发布GPT-5,并且免费无限使用;同日,文心一言官宣将于4月1日0时起全面免费,并且即日起上线深度搜索功能。


AI领域的竞争愈发激烈,在技术、Agent应用竞速的同时,大模型厂商的融资也在竞速。为整个行业的发展注入了新的活力,也让我们对AI的未来充满了更多的期待与想象。
当地时间2月17日晚,马斯克的新一代AI模型Grok 3及其精简版Grok 3 mini在一场备受瞩目的发布会中震撼亮相。Grok 3以由20万块GPU组成的超级计算机集群Colossus为强大后盾,在AI竞技场中一路过关斩将,狂破1400分,成功登顶排行榜。早在发布会前几天,马斯克就在其社交平台X上为Grok 3造势,称其为“地球上最聪明的人工智能”。

图片
 
在AI基准测试开放平台lmarena.ai上,经过约8000次投票后,早期版本的Grok 3(代号chocolate)在Arena排行榜上一骑绝尘,且在所有分类中均拔得头筹。在各项能力测试中,Grok 3的表现堪称惊艳。在数学能力测试(AIME'24)里,Grok 3斩获52分,将DeepSeek - V3的39分和GPT-4o的9分远远抛在身后;科学知识评估(GPQA)中,它以75分的成绩遥遥领先,DeepSeek - V3和GPT-4o分别只有65分和50分;编程能力测试(LCB Oct - Feb)中,57分的成绩也远超DeepSeek - V3的36分和GPT-4o的34分。推理模型比较中,Grok 3 Reasoning Beta也战胜了OpenAI的o3 - mini、DeepSeek的R1和Gemini - 2 Flash Thinking等推理模型。

图片
 
 发布会现场,Grok 3的强大实力得到了更直观的展示。当被要求生成一段代码,绘制从地球发射火箭,降落在火星,然后在下一个发射窗口返回地球的三维动画图表时,它迅速完成任务,生成的动画经研究人员检查完全正确,大量复杂数学和物理计算对它来说似乎轻而易举。随后,编写结合俄罗斯方块和宝石迷城的游戏,Grok 3也顺利完成,展现出强大的编程和逻辑思维能力。

图片
 
xAI工程师介绍,虽然Grok起步较晚,但在MMLU得分上以超的速度追上了ChatGPT。Grok-3和Grok-3 mini在多方面性能上都超过或媲美Gemini、DeepSeek和ChatGPT等对手。

OpenAI联合创始人Andrej Karpathy在亲身体验后评价道,Grok 3 + Thinking的表现与ChatGPT的某些高级版本相当,略微优于DeepSeek R1等模型。然而,在某些特定问题上,例如解码任务,Grok 3的表现可能不及DeepSeek R1。

另一边,GPT-4o也悄然更新版本。

OpenAI 放开成人内容?体验新版 GPT-4o 后,我想再次感谢 DeepSeek
 
除了在数学单项中排名第6外,GPT-4o在创意写作、编程和长文本查询等多个单项上都拿下第一。从网友测试反馈来看,新版GPT-4o不仅更“聪明”,而且更具“个性”,回复时的语气更拟人化,还会时不时使用一些表情包。OpenAI CEO奥特曼评价新版GPT-4o相当不错,并表示它不久将变得更好,还将其定义为“全网最佳搜索产品”。

在xAI公司的Grok 3取得重大进展之时,AI行业的其他同行们也在飞速前进。2025年,DeepSeek的V3和R1版本引发了新的行业浪潮,尤其是R1大模型备受业内赞誉。R1大模型采用了MOE架构(混合专家,Mixture-of-Experts),这一架构同样被应用于Grok的初代版本中。在开源的大环境中,各家如何凭借自身的技术实力练就卓越的AI“武功”,成为了行业关注的焦点。

 

图片

 

在DeepSeek-R1模型的冲击下,不少公司都陆续放出大招。

 

2月6日,OpenAI宣布扩大ChatGPT搜索功能的用户范围,任何人无需注册,就可以使用ChatGPT的搜索功能;同日,谷歌正式推出Gemini 2.0系列模型,包括Flash、Pro及Flash-Lite版本,继续提升AI能力,并提供更具性价比的解决方案。

 

2月13日,Sam Altman宣布,将很快发布GPT-5,并且免费无限使用;同日,文心一言官宣将于4月1日0时起全面免费,并且即日起上线深度搜索功能。


AI领域的竞争愈发激烈,在技术、Agent应用竞速的同时,大模型厂商的融资也在竞速。为整个行业的发展注入了新的活力,也让我们对AI的未来充满了更多的期待与想象。
img

地址:辽宁省大连市金普新区黄海大道156号 
邮箱:
tgjt@tg-group.cn
热线:0411-39278599

在线客服
客服热线
客服热线
134 7869 1991 134 7869 1991
服务时间:
9:00 - 17:00
客服热线
客服组:
天港数据
客服组:
公众号二维码

友情链接

大连云数据科技                    大连大数据产业发展研究院                           大连德泰控股

COPYRIGHT © 2021 大连天港科技集团有限公司 ALL RIGHT SERVER