工具
精华
|
战斗力 鹅
|
回帖 0
注册时间 2018-12-6
|
楼主 |
发表于 2025-2-1 09:50
来自手机
|
显示全部楼层
GPT O3发布了。
我在看论文#AI人工智能 #不懂就间有问必答 #形势一片大好 #一起来探讨 #给大家看看 #GPT #OPENAI A
比o1强(废话)
在部分方面(代码,竞赛),应该是比r1强的水平。
只有o3(high)比r1强(Openai这取名能力……),但是high不是免费的
而且这个强弱也很难说,感觉灵性方面差很多,优点是输出速度很快。
上下文有200k,追上claude了。
顺带一提,o3 mini在榜单上成绩刷的很高,但是在内部代码测试集上还不如o1。
应该是固有局限。
在编码方面非常强但是其他能力没有泛化出来(sft是这样的)
o3 Low mid high,三个模型, 实际上是是cot的长度,或者投入的平均算力。
就和R1的论文里说的,cot token投入越多模型可以表现越好.
图6里面,正常o3推理一次就要20美元了,一次推理335K token,写了个小说啊?!
后边还有3400刀一次平均就5700万token的推理,疯狂。
做完整个测试集都够ds练一个v3了。
就为了11.8%的性能提升。
怪不得奥特曼破防。
为了让模型变聪明,哪怕一点点,都要付出数之不尽的代价。
——
最后,奥特曼给出的解法是,o3 mini low,总体来说比r1差一些的性能,每天免费150次。
——
还是惊讶o3,57m token,多推理几次够重新炼一个r1了。
——
为了测试成绩(图6)已经烧掉了几百万美元了(疯狂奥特曼)
神经病…,他们不考虑项目可持续性的吗?
——
在软银主导下,Openai将以3400亿美元估值进行下一轮融资(图7,8)
这是美国星际之门战略的一部分。
——
o3 mini应该是个不超过20b激活的moe,除了编码和数学其他都好废…(价格也贵,图9)
哎,用不起这种泰坦,或者说圣柱王
—— 来自 鹅球 v3.3.96 |
|