找回密码
 立即注册
搜索
楼主: lukesweet

[科技] 出差路上闲着,介绍下当前国内AI业界的战国志

[复制链接]
头像被屏蔽
     
发表于 2023-11-9 21:40 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
 楼主| 发表于 2023-11-9 21:42 | 显示全部楼层
qratosones1337 发表于 2023-11-9 21:37
补充一些硬件方面(其实主要就是华子)的情报,上周华子的人来我司宣讲的时候提到的。
1、昇腾910A在今年三 ...

华子要是真能把算力给国内补齐了,业界所有人给他跪下来磕一个都不为过
回复

使用道具 举报

     
发表于 2023-11-9 21:47 来自手机 | 显示全部楼层
本帖最后由 wfefe 于 2023-11-9 21:48 编辑
诚司 发表于 2023-11-9 21:40
chatglm的人也说昇腾有a100 80%,也难怪老黄这么急

今天新闻不是说老黄要给中国市场推出h100的特供版。

—— 来自 HONOR REP-AN00, Android 13上的 S1Next-鹅版 v2.5.4
回复

使用道具 举报

     
发表于 2023-11-9 21:48 | 显示全部楼层
lukesweet 发表于 2023-11-9 21:42
华子要是真能把算力给国内补齐了,业界所有人给他跪下来磕一个都不为过 ...

现在大家似乎都比我想象得激进很多,本来我以为910B进来之后优先给NLP用,结果没想到那天去听报告的很多都是CTR方向的……华子的人说现在已经投入的几家头部互联网大厂都在派人帮他们写算子
回复

使用道具 举报

头像被屏蔽
     
发表于 2023-11-9 21:49 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2023-11-9 21:50 | 显示全部楼层
诚司 发表于 2023-11-9 21:40
chatglm的人也说昇腾有a100 80%,也难怪老黄这么急

不光是大模型,腾讯和美团甚至是先从CTR这种最难搞的场景入手的——我都怀疑老黄是不是鲨了麻花藤和王兴的亲马。

按道理说效费比最高的路线应该是先把大模型跑通,然后放出来很多存量N卡用来跑原来CUDA优势的场景(CTR就是典型),结果实际上他们还真敢硬上……
回复

使用道具 举报

头像被屏蔽
     
发表于 2023-11-9 21:52 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2023-11-9 21:54 | 显示全部楼层
商汤之前不是挺牛的吗?孙剑一没就完蛋了?
回复

使用道具 举报

     
发表于 2023-11-9 21:59 | 显示全部楼层
有料,马克一下
回复

使用道具 举报

     
发表于 2023-11-9 22:06 | 显示全部楼层
诚司 发表于 2023-11-9 21:52
现金牛业务被断供了那可就被登子杀了亲妈了,大模型反正没有也就那样 ...

关键是CTR其实没那么消耗算力,很多业务线甚至都是CPU推理
回复

使用道具 举报

头像被屏蔽
     
发表于 2023-11-9 22:19 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2023-11-9 22:21 | 显示全部楼层
lg19850717 发表于 2023-11-9 22:19
Ctr 的模型不该大又浅么,用计算卡干什么

谁知道他们怎么想的……感觉各种意义上都没什么必要
回复

使用道具 举报

头像被屏蔽
     
发表于 2023-11-9 22:31 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

发表于 2023-11-9 22:32 | 显示全部楼层
月之暗面是啥,好中二哈哈哈
回复

使用道具 举报

头像被屏蔽
     
发表于 2023-11-9 22:40 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2023-11-9 22:45 来自手机 | 显示全部楼层
因为利益不相关好久没关注了,谢谢楼主分享,我记忆还停留在GPT爆火后沐神辞职回国创业搞AI,谁知道他目前在哪家?大厂还是初创?
回复

使用道具 举报

     
发表于 2023-11-9 23:25 | 显示全部楼层
google是怎么起了个大早干了个晚集的?
回复

使用道具 举报

     
发表于 2023-11-9 23:26 来自手机 | 显示全部楼层
居尔一拳 发表于 2023-11-9 23:25
google是怎么起了个大早干了个晚集的?

transformer设计者好像是google出来的

—— 来自 HUAWEI NOH-AN00, Android 12上的 S1Next-鹅版 v2.5.4
回复

使用道具 举报

     
发表于 2023-11-9 23:30 | 显示全部楼层
从可能的上限上我更看好Moonshot,但是大模型的产品化几乎在所有公司都是个问题
回复

使用道具 举报

     
发表于 2023-11-9 23:32 | 显示全部楼层
不知楼主以后有空能否聊聊谷歌,很好奇Deepmind在科研领域的爆炸产出为啥带不动本家的AI发展
回复

使用道具 举报

     
发表于 2023-11-9 23:40 | 显示全部楼层
chatgpt网页版到现在月活好像才一个亿

这个市场不知道要怎么吃了
回复

使用道具 举报

     
发表于 2023-11-9 23:42 | 显示全部楼层
前几天玩的《完蛋 大模型解谜》的小游戏就是月之暗面的,体感问答能力还行

论坛助手,iPhone
回复

使用道具 举报

     
发表于 2023-11-9 23:45 | 显示全部楼层
限定国内,网易的可能是C端最火的那一个。毕竟往逆水寒NPC里塞了对话AI了,搭上了短视频的车还有点小火。也算是实用化了
就是质量一言难尽,多少还是有点弱智,真就仅供娱乐
回复

使用道具 举报

     
发表于 2023-11-9 23:45 来自手机 | 显示全部楼层
本帖最后由 lxshhh 于 2023-11-9 23:51 编辑
居尔一拳 发表于 2023-11-9 23:25
google是怎么起了个大早干了个晚集的?

🐶家早不是以前的🐶家了,官僚主义等一系类内耗行为在很多地方都被🐶家员工公开吐槽过,可以参考楼主对字节的吐槽,同时老🐶员工瞧不起新🐶员工这事也是一个很有意思的衍生品。
另外bert我没记错的话就是作者灵光一闪拿了以前的两个老方法缝合了一下,结果跑出来效果非常牛逼,当时是碾压gpt2,然后跟gpt3几乎打平,但是gpt3喂的东西跟bert不是一个量级的,而且喂的东西很脏。不过OA好像有很早就把东西拿出去让人不断玩,结果就是3.5最后暴力飞砖了。
回复

使用道具 举报

头像被屏蔽
     
发表于 2023-11-9 23:56 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2023-11-10 00:02 | 显示全部楼层
旷视呢?
回复

使用道具 举报

头像被屏蔽
     
发表于 2023-11-10 00:04 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2023-11-10 00:04 来自手机 | 显示全部楼层
艳红不是说了吗,卷大模型没啥意义,卷应用才有意义这说的不就是字节么百度这b公司最不擅长的就是卷应用
回复

使用道具 举报

     
发表于 2023-11-10 00:05 | 显示全部楼层

Face++的人各自分家去搞大模型了,本家眼看是救不活了(参看最近刚出来PR的零一万物,Moonshot里面也有很多Face++的人)。
回复

使用道具 举报

     
发表于 2023-11-10 00:09 来自手机 | 显示全部楼层
国内这些AI有哪些实际应用场景吗,能变现赚钱的那种

—— 来自 Xiaomi 22041211AC, Android 13上的 S1Next-鹅版 v2.5.2
回复

使用道具 举报

     
发表于 2023-11-10 00:19 | 显示全部楼层
单说翻译,现在AI的质量和速度已经相当可以了,我自己的机翻网站上就上线了群友基于百川训练的中日轻小说翻译模型。
计划是收费租显卡来跑,但是国内AI相关规定限得太死,最后只能拿群友分享的显卡来跑。
AI需求是存在的,但国内看起来没打算让个人玩家入场。
回复

使用道具 举报

     
发表于 2023-11-10 00:35 | 显示全部楼层
SinoWarrior 发表于 2023-11-9 23:56
BERT算是路线问题,其实继续做Encoder only说不定也会发生奇迹,但是谷歌没投入经历做下去,结果Decoder  ...

谷歌这种事也不是第一次了,三篇论文介绍内部系统,开启大数据时代,亚麻成最后赢家;transform发表,结果OA微软吃了第一口肥肉。只能说能打败巨无霸的只能是另一个巨无霸和巨无霸自己,现在内忧外患下也该好好治治了,虽然我也挺久没关注🐕家花边了
还记得Jeaf Dean去搞超导量子计算这事还被我肥科在潘组的老同学疯狂吐槽来着,这就是🐕家现状啊,牛人要么出去自立门户,要么搞一些莫名其妙的东西...
回复

使用道具 举报

     
发表于 2023-11-10 00:41 | 显示全部楼层
我除了画图、问答、字幕外对AI没任何感知,楼主能聊聊这玩意目前的商业化究竟是干嘛的么,比如网站问答机器人、写PPT、计划助理?
回复

使用道具 举报

     
发表于 2023-11-10 00:52 | 显示全部楼层
ToC端的应用手机上自带的那个其实是真的有落地用途的

楼主怎么评价OVM三家各自的状况呢?
回复

使用道具 举报

     
发表于 2023-11-10 02:00 | 显示全部楼层
frosta 发表于 2023-11-9 18:44
其他公司不好说
说字节基建好真的很难绷要不是天天被傻逼基建折磨吐血我就真的信了 ...

我在字节的时候天天喷arnold,直到我去了腾讯
第一件事就是给Arnold磕一个,对不起哥我错怪你了
回复

使用道具 举报

     
发表于 2023-11-10 02:01 | 显示全部楼层
行业从业者+1,先马克学习了。

—— 来自 S1Fun
回复

使用道具 举报

     
发表于 2023-11-10 02:02 | 显示全部楼层
lukesweet 发表于 2023-11-9 19:06
都是基于Transformer的LLM,或者说“这一代”通用语言模型,架构在此上的图像和语音能力也在讨论范围内。 ...

我感觉图像生成的diffusion和LLM差别还是有点大的
虽然图像生成类模型需要一些语言模型来理解prompt(其实理论上来说没有应该也行)
回复

使用道具 举报

     
发表于 2023-11-10 03:18 | 显示全部楼层
2474089352 发表于 2023-11-9 23:42
前几天玩的《完蛋 大模型解谜》的小游戏就是月之暗面的,体感问答能力还行

论坛助手,iPhone ...

啊?这玩意说自己是通义千问啊?


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

头像被屏蔽
     
发表于 2023-11-10 06:58 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2023-11-10 07:11 来自手机 | 显示全部楼层
第一眼看成av业界了,进来一脸懵逼
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2025-2-7 15:54 , Processed in 0.169652 second(s), 4 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表