找回密码
 立即注册
搜索
查看: 16970|回复: 81

[经济] 谷歌会成为下一个柯达吗

[复制链接]
     
发表于 2024-2-17 11:55 | 显示全部楼层
重巡羊舰 发表于 2024-2-17 11:32
微软都没玩蛋,为啥是谷歌

谷歌能从Transformer开创者混到大模型薅百度数据的地步,微软真不至于
回复

使用道具 举报

     
发表于 2024-2-17 11:57 | 显示全部楼层
omnitoken 发表于 2024-2-17 11:40
什么啊

Gemini 最近测试口碑都是及格的市场份额也上升了, 不然为啥openai 半夜放sora出来

Gemini口碑及格指的是中文自称自己是百度文心大模型,英文说自己的制造者是OpenAI么?数据清洗从源头出错的话两三个月时间肯定是来不及重新搞的
回复

使用道具 举报

     
发表于 2024-2-17 11:58 | 显示全部楼层
本帖最后由 ycjiang1337 于 2024-2-17 22:33 编辑

知乎有大佬评测的12月版大模型,Gemini-Pro只有文心一言3.5水平,注意是文心一言3.5不是GPT-3.5。算下来Gemini-Ultra大概率比不过GLM-4

https://zhuanlan.zhihu.com/p/673886532

评分

参与人数 1战斗力 +1 收起 理由
a4ac7 + 1

查看全部评分

回复

使用道具 举报

     
发表于 2024-2-17 12:00 来自手机 | 显示全部楼层
a4ac7 发表于 2024-2-17 11:59
自我介绍看起来被修复了

一直到最近才修复,我一月份测试的时候还是稳定触发(结果直接被风控屏蔽)


—— 来自 HUAWEI ALN-AL80, Android 12上的 S1Next-鹅版 v2.5.4
回复

使用道具 举报

     
发表于 2024-2-17 12:01 来自手机 | 显示全部楼层
另外你问POE版gemini pro它的数据截止到什么时候,它会告诉你是2021年4月…

—— 来自 HUAWEI ALN-AL80, Android 12上的 S1Next-鹅版 v2.5.4
回复

使用道具 举报

     
发表于 2024-2-17 12:01 来自手机 | 显示全部楼层
四级过了 发表于 2024-2-17 11:40
排队死也是meta先死啊

正好相反,现在LLama是开源大模型旗帜

—— 来自 HUAWEI ALN-AL80, Android 12上的 S1Next-鹅版 v2.5.4
回复

使用道具 举报

     
发表于 2024-2-17 12:08 | 显示全部楼层
实际上以国家为单位的话,美国大厂才是创新乏力的那批,OpenAI只是个特异点——理论上除了微软以外的硅谷大厂不缺算力,不缺数据,不缺钱,然后近水楼台先得月,也不缺少跟OpenAI人员私下交流的渠道(可能同一对夫妻就分别在Google和OpenAI工作)。然而一年过去了,他们的模型呢?同一个咖位的厂商把命脉交给微软?

Google从年初丢人现眼到年尾,亚马逊包养了Anthropic,但显然也没整出什么大活,苹果出了个莫名其妙的机器学习框架之后就没动静了,也就Meta比较给力,但LLama2发布到现在也差不多三个季度没动静了……所以他们那么多卡,那么多钱,都拿来干啥了?
回复

使用道具 举报

     
发表于 2024-2-17 12:10 | 显示全部楼层
本帖最后由 ycjiang1337 于 2024-2-17 12:12 编辑
双刀少女 发表于 2024-2-17 12:08
那你说说国内百度腾讯阿里又是什么水平

楼上贴了评测 https://zhuanlan.zhihu.com/p/673886532,现在Gemini-Pro的水平只能对标文心一言3.5(再一次强调是文心一言3.5,不是GPT-3.5),然后文心一言3.5在国产大模型里现在也属于掉队的水平(百度自家有更好的文心一言4)。目前国内闭源最好的是GLM-4(按评测结果看全维度超过GPT-3.5,能摸到GPT-4的屁股),开源最好的是通义千问72B,也有不少亮点。
整体上国产第一梯队已经把Google甩在了身后,基本上达到了GPT-3.5的水平,这个结论与我们这边针对业务需求的评测结论一致。

PS:国产任何一家模型都没出现过不进行任何诱导提问就说自己是别家产品的乐子


回复

使用道具 举报

     
发表于 2024-2-17 12:15 | 显示全部楼层
回复

使用道具 举报

     
发表于 2024-2-17 21:51 | 显示全部楼层
novalli 发表于 2024-2-17 19:48
现在搞AI的基本已经没办法避开国内的企业和学校了,而且国外的国人也基本上是绝对的主力,经常是一群国人和 ...

今年开始逐渐不缺卡了,有点神奇
回复

使用道具 举报

     
发表于 2024-2-17 22:27 | 显示全部楼层
本帖最后由 ycjiang1337 于 2024-2-17 22:36 编辑
chronicle 发表于 2024-2-17 21:55
如果谷歌都要完,那国内这批搞大模型的岂不是要死一百次了

别搞错了,谷歌只配给国内主要玩家提鞋。国内所有主要大模型玩家进步速度都断崖领先谷歌和23年下半年的Meta,并且国内所有主要大模型都没有出现过无诱导Prompt的情况下自称别家大模型的bad case。2024年国内第一梯队可能仍然赶不上OpenAI,但是吊打谷歌是大概率事件。
回复

使用道具 举报

     
发表于 2024-2-17 23:16 | 显示全部楼层
新鲜出炉的Gemini乐子,这下不打自招了
https://g.co/gemini/share/18f7ded213ef
回复

使用道具 举报

     
发表于 2024-2-18 00:44 | 显示全部楼层
本帖最后由 ycjiang1337 于 2024-2-18 01:00 编辑
王怡人 发表于 2024-2-17 23:25
就前几天我问bard它跟Gemini是什么关系,它还回答它们都是openai开发的

这破玩意幻觉特别严重,英文比中文好一点,但仍然经常胡说八道,简直堪比一年前的首发版文心一言
回复

使用道具 举报

     
发表于 2024-2-18 00:44 | 显示全部楼层
lukesweet 发表于 2024-2-18 00:00
说要完蛋确实为时过早,但AI这轮风口是实打实地没赶上,起个大早赶个晚集颇有野儿子百度的风范 ...

已经混到不如百度的程度了……
回复

使用道具 举报

     
发表于 2024-2-18 10:23 | 显示全部楼层
蛋饼 发表于 2024-2-18 08:25
https://github.com/lm-sys/FastChat/blob/9cfeb155e7a3ae78738d0569f101d0f5f9fdf1ca/fastchat/data/har ...

然而其他正经问题幻觉一样非常严重,跟主流国内大模型一年前的水平相当,而且一个搜索公司做的模型竟然没有RAG能力,所谓的联网指的是生成答案之后用户手动点一下搜索验证答案真伪……
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2024-5-22 02:42 , Processed in 0.151453 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表