找回密码
 立即注册
搜索
楼主: lukesweet

[科技] 出差路上闲着,介绍下当前国内AI业界的战国志

[复制链接]
     
发表于 2023-11-9 19:13 | 显示全部楼层
ciciswan 发表于 2023-11-9 18:56
这个代码能力比wizardcoder 还强么? 毕竟HumanEval 排名第一的开源模型。除了gpt没有比这个强了? ...

亲测比wizardcoder python 34b的强。

其实text-generation-webui团队曾经做了一个phind和wizardcoder和合并模型叫codebooga,但是实测发现性能不如phind。

现在来看phind确实算是代码类最强。zephyr 7b这个模型也不容小觑,代码理解能力和指令跟随能力也不差
回复

使用道具 举报

     
 楼主| 发表于 2023-11-9 19:15 | 显示全部楼层
蛋饼 发表于 2023-11-9 19:12
百川 整体风格也比较踏实,指直接把llm评测的问题和答案输入自己题库,动不动就背个答案选项ABCD出来[f:067 ...

截止前一阵吧,最近确实有点小丑,洗不了
应该是投资人施压之后急了做了很多脏操作,他们弱点就是没有自己的落地业务只能被投资人揉捏。
回复

使用道具 举报

头像被屏蔽
     
发表于 2023-11-9 19:20 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2023-11-9 19:27 | 显示全部楼层
插楼问下代码大模型目前国内哪家最强了
回复

使用道具 举报

     
发表于 2023-11-9 19:38 | 显示全部楼层
本帖最后由 树洞专用 于 2024-1-3 16:56 编辑

风怒
回复

使用道具 举报

     
发表于 2023-11-9 19:48 | 显示全部楼层
DFM_otto 发表于 2023-11-9 18:36
从我自己的体验上来说,文心一言和glm是最靠谱的两个,可以达到3.5上位替代的水平,未来国内市场很有可能是 ...

因为楼主之前就是字节的
回复

使用道具 举报

头像被屏蔽
     
发表于 2023-11-9 19:50 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2023-11-9 19:51 来自手机 | 显示全部楼层
百度也太符合我的刻板印象了
回复

使用道具 举报

     
 楼主| 发表于 2023-11-9 20:13 | 显示全部楼层
砂雪 发表于 2023-11-9 19:48
因为楼主之前就是字节的

您这样我有点洗不清了。其实我和老东家没啥感情的(摆手)
字节的潜在威胁其实是圈内公认的,哪怕纯谈硬实力,字节的卡和现金储备太夸张了,没人敢轻视。
回复

使用道具 举报

     
 楼主| 发表于 2023-11-9 20:21 | 显示全部楼层
校内写生大会 发表于 2023-11-9 19:50
我作为一个纯用户,手机里有文心一言、讯飞星火、ChatGLM

我现在一般还是用ChatGLM水论文和作为搜索引擎上 ...

你体验好就是真的好啊,别被我带歪了,当前谁好用就用谁没毛病
我其实更多聊的是潜力和业界(或者说投资方)的评价,有很多复杂因素的,不止是当前的工具能力
回复

使用道具 举报

     
发表于 2023-11-9 20:22 | 显示全部楼层
鹅厂的混元也是套皮么(
回复

使用道具 举报

     
发表于 2023-11-9 20:27 | 显示全部楼层
weiyang 发表于 2023-11-9 18:44
请教下这股热潮大概能持续多久呢

这个必须干下去,可不是什么元宇宙那些玩意儿可比的
回复

使用道具 举报

头像被屏蔽
     
发表于 2023-11-9 20:33 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

头像被屏蔽
     
发表于 2023-11-9 20:37 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

头像被屏蔽
     
发表于 2023-11-9 20:38 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

头像被屏蔽
     
发表于 2023-11-9 20:38 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
 楼主| 发表于 2023-11-9 20:39 | 显示全部楼层
lg19850717 发表于 2023-11-9 20:33
实际上快一年了,gpt4依然傲视群雄

在tool using上面完全没对手,而且价格战也要把中国之外的所有对手全部 ...

Tool不是AI的唯一战场,按工具决胜论的说法Character.AI根本不可能有现在这个估值

评分

参与人数 1战斗力 +1 收起 理由
2474089352 + 1 好评加鹅

查看全部评分

回复

使用道具 举报

头像被屏蔽
     
发表于 2023-11-9 20:40 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2023-11-9 20:41 | 显示全部楼层
怎么没看到阿里的通义千问,当时BAT就他开源了模型,虽然现在没什么声音了。还有个人觉得GLM算是国内开源的模型比较好的那一批的(虽然有刷分的嫌疑),很多做模型本地部署和LLM外围应用的公司都选择了GLM。要说面向测试集训练模型我觉得前几天那个李开复的零一最严重。经常复读同一个词,纯纯上分模型。
回复

使用道具 举报

头像被屏蔽
     
发表于 2023-11-9 20:42 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

头像被屏蔽
     
发表于 2023-11-9 20:43 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2023-11-9 20:46 | 显示全部楼层
lukesweet 发表于 2023-11-9 19:05
百川这次也被打脸了,但这事之前干的不多,所以也就嘲笑一下。
GLM可是老刷子了,性质不一样的。
Qwen, ...

qwen-14b偶尔能在红迪上看到惊呼不输3.5的帖子,这次打脸最狠的那个智源的模型倒是真的连软文都没怎么见过。
回复

使用道具 举报

     
发表于 2023-11-9 20:46 | 显示全部楼层
鸡毛当令箭 发表于 2023-11-9 19:04
智谱出了codegee,算是个下位替代

codegeex,能力属实不太行,甚至不如现在的zephyr-7B
回复

使用道具 举报

头像被屏蔽
     
发表于 2023-11-9 20:54 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

头像被屏蔽
     
发表于 2023-11-9 20:57 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2023-11-9 20:57 | 显示全部楼层
这一代模型(指以Transformer或者相关变体为核心的构架),基本上还停留在有多少人工就有多少智能的等级,论数据集的构建,开发框架,模型结构优化,国内不会比国外差多少的,所以从模型落地到实际部署差距并没有想象中的大,现在主要是算力限制影响大规模部署,另一方面就是对于创新研发的能力,这个确实搞不过meta、openai、anthropic之流的,这点才是需要担心的,不过好消息是闭门造车不现实,业界还是在交流的,所以目前还能追的动危机是有的,机遇也是有的,走一步看一步吧
回复

使用道具 举报

     
发表于 2023-11-9 20:59 | 显示全部楼层
lukesweet 发表于 2023-11-9 18:09
用的Mmx的API,阿里自己没大模型牌照

阿里居然没牌照嘛,那通义千问是怎么推出的呢?
回复

使用道具 举报

头像被屏蔽
     
发表于 2023-11-9 21:01 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2023-11-9 21:01 | 显示全部楼层
没办法,百度就是所有人都能用啊……现在只会用得到文心一言,想抽一节课教学生用ai

有没有人介绍下便宜甚至不要钱用chatgpt的门路
回复

使用道具 举报

     
 楼主| 发表于 2023-11-9 21:02 | 显示全部楼层
同醉 发表于 2023-11-9 20:59
阿里居然没牌照嘛,那通义千问是怎么推出的呢?

qwen是开源的,放出来你们自己搭服务玩不受牌照限制,但阿里不能基于它对外提供正式的商业服务
回复

使用道具 举报

头像被屏蔽
     
发表于 2023-11-9 21:04 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

头像被屏蔽
     
发表于 2023-11-9 21:05 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2023-11-9 21:06 | 显示全部楼层
lukesweet 发表于 2023-11-9 21:02
qwen是开源的,放出来你们自己搭服务玩不受牌照限制,但阿里不能基于它对外提供正式的商业服务 ...

那应该以后能拿到牌照吧,所以通义千问的实力怎么样呢?好歹是阿里的应该不至于太拉跨吧。
回复

使用道具 举报

     
 楼主| 发表于 2023-11-9 21:13 | 显示全部楼层
本帖最后由 lukesweet 于 2023-11-9 21:15 编辑
SinoWarrior 发表于 2023-11-9 21:05
文心一言4.0性能确实很出色,一看就是数据下了大功夫,我有一个几乎所有国内LLM(或者说除了GPT3.5及GPT4.0 ...

这题没这么难,我随便测了主楼里某家的模型,而且我非常确定这个模型比文心4的尺寸小很多


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

     
 楼主| 发表于 2023-11-9 21:17 | 显示全部楼层
SinoWarrior 发表于 2023-11-9 21:04
字节的TTS也非常强

字节做tts毕竟有些日子了,不过这块不能成为胜负手,tts上限太低
回复

使用道具 举报

     
 楼主| 发表于 2023-11-9 21:19 | 显示全部楼层
同醉 发表于 2023-11-9 21:06
那应该以后能拿到牌照吧,所以通义千问的实力怎么样呢?好歹是阿里的应该不至于太拉跨吧。 ...

能吧其实我们觉得阿里两轮拿不到是不是有什么没法说的场外因素
但未来能走到什么位置不好说,我感觉阿里没这么倾注心力做大模型
回复

使用道具 举报

     
发表于 2023-11-9 21:31 | 显示全部楼层
lukesweet 发表于 2023-11-9 21:19
能吧其实我们觉得阿里两轮拿不到是不是有什么没法说的场外因素
但未来能走到什么位置不好说,我感 ...

现在拿不到估计就是因为老MA的事吧,不过看起来阿里对大模型挺上心的,我还以为通义和百度的文心差不多都是第一梯队的呢。
回复

使用道具 举报

     
发表于 2023-11-9 21:31 来自手机 | 显示全部楼层
学习了

—— 来自 Xiaomi 23013RK75C, Android 13上的 S1Next-鹅版 v2.5.4
回复

使用道具 举报

     
发表于 2023-11-9 21:37 | 显示全部楼层
补充一些硬件方面(其实主要就是华子)的情报,上周华子的人来我司宣讲的时候提到的。
1、昇腾910A在今年三月卖完了最后一批存货,之后新出的全都是910B
2、目前适配昇腾最激进的是百度和讯飞——事实上百度自己用的飞桨框架很早就支持昇腾,到目前(11月初)文心一言手机App的昇腾后端已经上线了。其次是美团和腾讯,目前有一些CTR场景也上线了。
3、910B同时支持鲲鹏和x86基座,互联网客户采购的都是基于Intel SPR处理器的服务器。
4、目前910B对A100/A800的平均单卡性能比,取决于不同规模的模型,最低有0.8,目前最高记录是LLama-70B,能达到1.2
5、1017之前910B的意向订单有10W卡,然后1017之后直接爆单了……直接结果就是原本承诺给我们的两台测试机这个Q只能到一台了……
回复

使用道具 举报

     
 楼主| 发表于 2023-11-9 21:39 | 显示全部楼层
同醉 发表于 2023-11-9 21:31
现在拿不到估计就是因为老MA的事吧,不过看起来阿里对大模型挺上心的,我还以为通义和百度的文心差不多都 ...

大厂基本缺的都不是资源,而是决心和组织力,不久前阿里组织大调整折腾了一波,短期内组织力应该不够,但以它的资源晚点回牌桌也不是没机会
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2025-1-31 10:39 , Processed in 0.185234 second(s), 7 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表