找回密码
 立即注册
搜索

[科技] 马斯克宣布:即将发布新AI模型,地球上最聪明

[复制链接]
     
发表于 2025-2-18 12:34 | 显示全部楼层
这图表真是做得太强了
回复

使用道具 举报

头像被屏蔽
 楼主| 发表于 2025-2-18 12:34 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

头像被屏蔽
 楼主| 发表于 2025-2-18 12:35 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2025-2-18 12:37 | 显示全部楼层
scale low碰到瓶颈了?英伟达大危机?
回复

使用道具 举报

头像被屏蔽
 楼主| 发表于 2025-2-18 12:40 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

头像被屏蔽
     
发表于 2025-2-18 12:40 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2025-2-18 12:41 | 显示全部楼层
The Chinese in China VS The Chinese in the US
回复

使用道具 举报

头像被屏蔽
 楼主| 发表于 2025-2-18 12:42 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2025-2-18 12:44 | 显示全部楼层
讲真,真的那么牛逼,直接发推发布就行,剩下的自有大儒替你辩经,整这四个人在这做live demo,多少看出马圣的心虚了
回复

使用道具 举报

     
发表于 2025-2-18 12:49 | 显示全部楼层
POE2 build

马圣还挺幽默
回复

使用道具 举报

头像被屏蔽
 楼主| 发表于 2025-2-18 12:49 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2025-2-18 12:51 | 显示全部楼层
草,x会员才能使用

论坛助手,iPhone
回复

使用道具 举报

头像被屏蔽
 楼主| 发表于 2025-2-18 12:52 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2025-2-18 12:56 | 显示全部楼层
话说右数第二这灰衣小哥是干嘛的?

论坛助手,iPhone
回复

使用道具 举报

     
发表于 2025-2-18 12:58 来自手机 | 显示全部楼层
这柱状图配色能不能有点区分度啊
回复

使用道具 举报

头像被屏蔽
     
发表于 2025-2-18 13:02 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

头像被屏蔽
 楼主| 发表于 2025-2-18 13:11 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2025-2-18 13:17 来自手机 | 显示全部楼层
基模GPT4.5水平,推模O3水平。确实能算得上是现阶段最聪明的AI模型,但是也基本上宣布了llm模型的死期,以及这一轮AI泡沫的破灭。在xai铺满算力的前提下依然止步在agi之前,也印证了openai宣布GPT4.5会是最后一代模型的说法,这条路已经走到了尽头。有英伟达股票的可以丢了。
回复

使用道具 举报

     
发表于 2025-2-18 13:17 来自手机 | 显示全部楼层
屌大的讲一下强在哪里
回复

使用道具 举报

     
发表于 2025-2-18 13:18 | 显示全部楼层
马圣这回又要发什么币了?

—— 来自 S1Fun
回复

使用道具 举报

头像被屏蔽
 楼主| 发表于 2025-2-18 13:20 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2025-2-18 13:23 | 显示全部楼层
如果所谓最聪明的LLM,展示出来的依然是已有能力的整合和在排行榜上的刷分能力,那AGI这个泡沫吹不了太大了
回复

使用道具 举报

     
发表于 2025-2-18 13:26 | 显示全部楼层
枯风瘦雪 发表于 2025-2-18 13:23
如果所谓最聪明的LLM,展示出来的依然是已有能力的整合和在排行榜上的刷分能力,那AGI这个泡沫吹不了太大了 ...

因为本来也只是量变,没有质变。真能刷分刷出两倍优势那也确实牛逼
回复

使用道具 举报

     
发表于 2025-2-18 13:28 | 显示全部楼层
本帖最后由 泰坦失足 于 2025-2-18 14:10 编辑

这么一看还是o3 mini牛逼, 花了5个月从o1 mini迭代到o3 mini. 价格比4o还便宜. 硬件要求成本也低
让元宝的DS帮我总结下赛文奥特曼的资料, 它给我找了个买了奇奥天尊版权的超小游戏机厂子从网上乱抄的网页. 告诉我赛文奥特曼的父亲是xx. 还有很长的路要走. 可能o5 mini时代的各个主流模型才能在可行的成本内, 写出 我浏览了这个网页的其他页面, 得出结论是这个网页都是瞎编的-这个资料不可信
很难想象两年前大家还在为GPT4能答出:"树上10只鸟,开枪打死一只还剩几只"而惊讶, 一年前开源模型才在大尺寸上赶上GPT4的这个能力,现在随便拽一个边缘计算用小模型都能答对.

评分

参与人数 3战斗力 -4 收起 理由
camelia_vie -2
萦桦 -1 思路广
daikejay -1 傻逼

查看全部评分

回复

使用道具 举报

     
发表于 2025-2-18 13:30 | 显示全部楼层
qratosones1337 发表于 2025-2-18 13:26
因为本来也只是量变,没有质变。真能刷分刷出两倍优势那也确实牛逼

CV时代的各大科研团体也是沉迷刷榜刷sota,但是那个时代的AI四小龙都半死不活了……消耗了这么多训练时间和算力如果只能在量上进步,那这个技术路线值得稍微多一点审视和批判
回复

使用道具 举报

     
发表于 2025-2-18 13:37 | 显示全部楼层
说起CloseAI,之前被人各种暗示的无敌ChatGPT5被奥特曼官宣不存在了,所谓的5就是现有的4.5之类的打包
回复

使用道具 举报

     
发表于 2025-2-18 13:39 来自手机 | 显示全部楼层
看跑分是领先了

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

     
发表于 2025-2-18 13:44 | 显示全部楼层
这柱状图就是不想让人看清楚吧,颜色一点区分度都没有
回复

使用道具 举报

     
发表于 2025-2-18 13:47 | 显示全部楼层

全程观察他,有一种男大学牲误入高峰论坛的美感

论坛助手,iPhone
回复

使用道具 举报

     
发表于 2025-2-18 13:51 来自手机 | 显示全部楼层
枯风瘦雪 发表于 2025-2-18 13:30
CV时代的各大科研团体也是沉迷刷榜刷sota,但是那个时代的AI四小龙都半死不活了……消耗了这么多训练时间 ...

那时候的刷榜都是比原来的SOTA高几个点,显然没啥用

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

     
发表于 2025-2-18 13:57 来自手机 | 显示全部楼层
hahah 发表于 2025-2-18 13:17
基模GPT4.5水平,推模O3水平。确实能算得上是现阶段最聪明的AI模型,但是也基本上宣布了llm模型的死期,以 ...

好死。
就看什么时候显卡价格回归正常了。感觉还要等5年
回复

使用道具 举报

     
发表于 2025-2-18 14:00 | 显示全部楼层
hahah 发表于 2025-2-18 13:17
基模GPT4.5水平,推模O3水平。确实能算得上是现阶段最聪明的AI模型,但是也基本上宣布了llm模型的死期,以 ...

对了,grok3还使用了大量的合成数据,看起来数据墙的问题通过这一套解决得并不好
回复

使用道具 举报

     
发表于 2025-2-18 14:09 | 显示全部楼层
类脑那边在实测rp和创意写作,https://discord.com/channels/113 ... 1341284200933883996
文笔很差,鉴定为烂炒
回复

使用道具 举报

     
发表于 2025-2-18 14:18 | 显示全部楼层

高手锐评

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

     
发表于 2025-2-18 14:22 来自手机 | 显示全部楼层
hahah 发表于 2025-2-18 13:17
基模GPT4.5水平,推模O3水平。确实能算得上是现阶段最聪明的AI模型,但是也基本上宣布了llm模型的死期,以 ...

想一下从llama3.1 405B到现在才过了半年不到

gdx.b200都没铺货

讲什么撞墙………
回复

使用道具 举报

     
发表于 2025-2-18 14:27 | 显示全部楼层
大模型生成svg有点意思
回复

使用道具 举报

     
发表于 2025-2-18 14:31 | 显示全部楼层
alixsander 发表于 2025-2-18 14:22
想一下从llama3.1 405B到现在才过了半年不到

gdx.b200都没铺货

llama3.1 405b已经被qwen2.5 72b给爆了,尺寸暴涨并没有带来线性提升,边际效应已经很明显了。
回复

使用道具 举报

     
发表于 2025-2-18 14:37 | 显示全部楼层
alixsander 发表于 2025-2-18 14:22
想一下从llama3.1 405B到现在才过了半年不到

gdx.b200都没铺货

然而LLama3.1 405B性能也就只能跟Qwen2.5-72B打个有来有回
回复

使用道具 举报

     
发表于 2025-2-18 14:44 | 显示全部楼层
可以咩鳖了吗

—— 来自 S1Fun
回复

使用道具 举报

     
发表于 2025-2-18 14:49 来自手机 | 显示全部楼层
本帖最后由 alixsander 于 2025-2-18 14:51 编辑
qqks 发表于 2025-2-18 14:31
llama3.1 405b已经被qwen2.5 72b给爆了,尺寸暴涨并没有带来线性提升,边际效应已经很明显了。
...


qwen2.5和llama3.1哪个前哪个后?

这叙事逻辑明明是前SOTA性能快速被小尺寸基模实现。而qwen2.5 max相对qwen 2.5 72B在分上还有提升

GROK3么,还是适合和xAI自己之前路边一条的水平来比…
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2025-3-4 07:05 , Processed in 0.205233 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表