出差路上闲着，介绍下当前国内AI业界的战国志

Van夫膜开 · 发表于 2023-11-9 19:13

ciciswan 发表于 2023-11-9 18:56
这个代码能力比wizardcoder 还强么？毕竟HumanEval 排名第一的开源模型。除了gpt没有比这个强了？ ...

亲测比wizardcoder python 34b的强。

其实text-generation-webui团队曾经做了一个phind和wizardcoder和合并模型叫codebooga，但是实测发现性能不如phind。

现在来看phind确实算是代码类最强。zephyr 7b这个模型也不容小觑，代码理解能力和指令跟随能力也不差

lukesweet · 发表于 2023-11-9 19:15

蛋饼发表于 2023-11-9 19:12
百川整体风格也比较踏实，指直接把llm评测的问题和答案输入自己题库，动不动就背个答案选项ABCD出来[f:067 ...

截止前一阵吧，最近确实有点小丑，洗不了

应该是投资人施压之后急了做了很多脏操作，他们弱点就是没有自己的落地业务只能被投资人揉捏。

ciciswan · 发表于 2023-11-9 19:20

提示: 作者被禁止或删除内容自动屏蔽

iamdone · 发表于 2023-11-9 19:27

插楼问下代码大模型目前国内哪家最强了

树洞专用 · 发表于 2023-11-9 19:38

本帖最后由树洞专用于 2024-1-3 16:56 编辑

风怒

砂雪 · 发表于 2023-11-9 19:48

DFM_otto 发表于 2023-11-9 18:36
从我自己的体验上来说，文心一言和glm是最靠谱的两个，可以达到3.5上位替代的水平，未来国内市场很有可能是 ...

因为楼主之前就是字节的

校内写生大会 · 发表于 2023-11-9 19:50

提示: 作者被禁止或删除内容自动屏蔽

与天争锋_LZ · 发表于 2023-11-9 19:51

百度也太符合我的刻板印象了

lukesweet · 发表于 2023-11-9 20:13

砂雪发表于 2023-11-9 19:48
因为楼主之前就是字节的

您这样我有点洗不清了。其实我和老东家没啥感情的（摆手）

字节的潜在威胁其实是圈内公认的，哪怕纯谈硬实力，字节的卡和现金储备太夸张了，没人敢轻视。

lukesweet · 发表于 2023-11-9 20:21

校内写生大会发表于 2023-11-9 19:50
我作为一个纯用户，手机里有文心一言、讯飞星火、ChatGLM

我现在一般还是用ChatGLM水论文和作为搜索引擎上 ...

你体验好就是真的好啊，别被我带歪了，当前谁好用就用谁没毛病

我其实更多聊的是潜力和业界（或者说投资方）的评价，有很多复杂因素的，不止是当前的工具能力

兰开夏 · 发表于 2023-11-9 20:22

鹅厂的混元也是套皮么（

chenzl · 发表于 2023-11-9 20:27

weiyang 发表于 2023-11-9 18:44
请教下这股热潮大概能持续多久呢

这个必须干下去，可不是什么元宇宙那些玩意儿可比的

lg19850717 · 发表于 2023-11-9 20:33

提示: 作者被禁止或删除内容自动屏蔽

Lokad · 发表于 2023-11-9 20:37

提示: 作者被禁止或删除内容自动屏蔽

ciciswan · 发表于 2023-11-9 20:38

提示: 作者被禁止或删除内容自动屏蔽

lg19850717 · 发表于 2023-11-9 20:38

提示: 作者被禁止或删除内容自动屏蔽

lukesweet · 发表于 2023-11-9 20:39

lg19850717 发表于 2023-11-9 20:33
实际上快一年了，gpt4依然傲视群雄

在tool using上面完全没对手，而且价格战也要把中国之外的所有对手全部 ...

Tool不是AI的唯一战场，按工具决胜论的说法Character.AI根本不可能有现在这个估值

lg19850717 · 发表于 2023-11-9 20:40

提示: 作者被禁止或删除内容自动屏蔽

logiczr · 发表于 2023-11-9 20:41

怎么没看到阿里的通义千问，当时BAT就他开源了模型，虽然现在没什么声音了。还有个人觉得GLM算是国内开源的模型比较好的那一批的（虽然有刷分的嫌疑），很多做模型本地部署和LLM外围应用的公司都选择了GLM。要说面向测试集训练模型我觉得前几天那个李开复的零一最严重。经常复读同一个词，纯纯上分模型。

Lokad · 发表于 2023-11-9 20:42

提示: 作者被禁止或删除内容自动屏蔽

lg19850717 · 发表于 2023-11-9 20:43

提示: 作者被禁止或删除内容自动屏蔽

naiveyan · 发表于 2023-11-9 20:46

lukesweet 发表于 2023-11-9 19:05
百川这次也被打脸了，但这事之前干的不多，所以也就嘲笑一下。
GLM可是老刷子了，性质不一样的。
Qwen， ...

qwen-14b偶尔能在红迪上看到惊呼不输3.5的帖子，这次打脸最狠的那个智源的模型倒是真的连软文都没怎么见过。

Van夫膜开 · 发表于 2023-11-9 20:46

鸡毛当令箭发表于 2023-11-9 19:04
智谱出了codegee，算是个下位替代

codegeex，能力属实不太行，甚至不如现在的zephyr-7B

诚司 · 发表于 2023-11-9 20:54

提示: 作者被禁止或删除内容自动屏蔽

lg19850717 · 发表于 2023-11-9 20:57

提示: 作者被禁止或删除内容自动屏蔽

yesicant · 发表于 2023-11-9 20:57

这一代模型(指以Transformer或者相关变体为核心的构架)，基本上还停留在有多少人工就有多少智能的等级，论数据集的构建，开发框架，模型结构优化，国内不会比国外差多少的，所以从模型落地到实际部署差距并没有想象中的大，现在主要是算力限制影响大规模部署，另一方面就是对于创新研发的能力，这个确实搞不过meta、openai、anthropic之流的，这点才是需要担心的，不过好消息是闭门造车不现实，业界还是在交流的，所以目前还能追的动

危机是有的，机遇也是有的，走一步看一步吧

同醉 · 发表于 2023-11-9 20:59

lukesweet 发表于 2023-11-9 18:09
用的Mmx的API，阿里自己没大模型牌照

阿里居然没牌照嘛，那通义千问是怎么推出的呢？

bapijun1 · 发表于 2023-11-9 21:01

提示: 作者被禁止或删除内容自动屏蔽

隐形术的隐形书 · 发表于 2023-11-9 21:01

没办法，百度就是所有人都能用啊……现在只会用得到文心一言，想抽一节课教学生用ai

有没有人介绍下便宜甚至不要钱用chatgpt的门路

lukesweet · 发表于 2023-11-9 21:02

同醉发表于 2023-11-9 20:59
阿里居然没牌照嘛，那通义千问是怎么推出的呢？

qwen是开源的，放出来你们自己搭服务玩不受牌照限制，但阿里不能基于它对外提供正式的商业服务

SinoWarrior · 发表于 2023-11-9 21:04

提示: 作者被禁止或删除内容自动屏蔽

SinoWarrior · 发表于 2023-11-9 21:05

提示: 作者被禁止或删除内容自动屏蔽

同醉 · 发表于 2023-11-9 21:06

lukesweet 发表于 2023-11-9 21:02
qwen是开源的，放出来你们自己搭服务玩不受牌照限制，但阿里不能基于它对外提供正式的商业服务 ...

那应该以后能拿到牌照吧，所以通义千问的实力怎么样呢？好歹是阿里的应该不至于太拉跨吧。

lukesweet · 发表于 2023-11-9 21:13

本帖最后由 lukesweet 于 2023-11-9 21:15 编辑

SinoWarrior 发表于 2023-11-9 21:05
文心一言4.0性能确实很出色，一看就是数据下了大功夫，我有一个几乎所有国内LLM（或者说除了GPT3.5及GPT4.0 ...

这题没这么难，我随便测了主楼里某家的模型，而且我非常确定这个模型比文心4的尺寸小很多

lukesweet · 发表于 2023-11-9 21:17

SinoWarrior 发表于 2023-11-9 21:04
字节的TTS也非常强

字节做tts毕竟有些日子了，不过这块不能成为胜负手，tts上限太低

lukesweet · 发表于 2023-11-9 21:19

同醉发表于 2023-11-9 21:06
那应该以后能拿到牌照吧，所以通义千问的实力怎么样呢？好歹是阿里的应该不至于太拉跨吧。 ...

能吧

其实我们觉得阿里两轮拿不到是不是有什么没法说的场外因素
但未来能走到什么位置不好说，我感觉阿里没这么倾注心力做大模型

同醉 · 发表于 2023-11-9 21:31

lukesweet 发表于 2023-11-9 21:19
能吧其实我们觉得阿里两轮拿不到是不是有什么没法说的场外因素
但未来能走到什么位置不好说，我感 ...

现在拿不到估计就是因为老MA的事吧，不过看起来阿里对大模型挺上心的，我还以为通义和百度的文心差不多都是第一梯队的呢。

KDConan · 发表于 2023-11-9 21:31

学习了

—— 来自 Xiaomi 23013RK75C, Android 13上的 S1Next-鹅版 v2.5.4

qratosones1337 · 发表于 2023-11-9 21:37

补充一些硬件方面（其实主要就是华子）的情报，上周华子的人来我司宣讲的时候提到的。
1、昇腾910A在今年三月卖完了最后一批存货，之后新出的全都是910B
2、目前适配昇腾最激进的是百度和讯飞——事实上百度自己用的飞桨框架很早就支持昇腾，到目前（11月初）文心一言手机App的昇腾后端已经上线了。其次是美团和腾讯，目前有一些CTR场景也上线了。
3、910B同时支持鲲鹏和x86基座，互联网客户采购的都是基于Intel SPR处理器的服务器。
4、目前910B对A100/A800的平均单卡性能比，取决于不同规模的模型，最低有0.8，目前最高记录是LLama-70B，能达到1.2
5、1017之前910B的意向订单有10W卡，然后1017之后直接爆单了……直接结果就是原本承诺给我们的两台测试机这个Q只能到一台了……

lukesweet · 发表于 2023-11-9 21:39

同醉发表于 2023-11-9 21:31
现在拿不到估计就是因为老MA的事吧，不过看起来阿里对大模型挺上心的，我还以为通义和百度的文心差不多都 ...

大厂基本缺的都不是资源，而是决心和组织力，不久前阿里组织大调整折腾了一波，短期内组织力应该不够，但以它的资源晚点回牌桌也不是没机会

		自动登录	找回密码
密码			立即注册

[科技] 出差路上闲着，介绍下当前国内AI业界的战国志

评分

本帖子中包含更多资源

ciciswan ciciswan 当前离线禁止发言精华 \| 战斗力鹅 \| 回帖 0 注册时间 2022-4-12 头像被屏蔽	发表于 2023-11-9 19:20 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报

校内写生大会校内写生大会当前离线禁止发言精华 \| 战斗力鹅 \| 回帖 0 注册时间 2023-5-23 头像被屏蔽	发表于 2023-11-9 19:50 来自手机 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报

lg19850717 lg19850717 当前离线禁止发言精华 \| 战斗力鹅 \| 回帖 0 注册时间 2020-2-8 头像被屏蔽	发表于 2023-11-9 20:33 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报

Lokad Lokad 当前离线禁止发言精华 \| 战斗力鹅 \| 回帖 0 注册时间 2020-5-25 头像被屏蔽	发表于 2023-11-9 20:37 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报

ciciswan ciciswan 当前离线禁止发言精华 \| 战斗力鹅 \| 回帖 0 注册时间 2022-4-12 头像被屏蔽	发表于 2023-11-9 20:38 来自手机 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报

lg19850717 lg19850717 当前离线禁止发言精华 \| 战斗力鹅 \| 回帖 0 注册时间 2020-2-8 头像被屏蔽	发表于 2023-11-9 20:38 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报

lg19850717 lg19850717 当前离线禁止发言精华 \| 战斗力鹅 \| 回帖 0 注册时间 2020-2-8 头像被屏蔽	发表于 2023-11-9 20:40 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报

Lokad Lokad 当前离线禁止发言精华 \| 战斗力鹅 \| 回帖 0 注册时间 2020-5-25 头像被屏蔽	发表于 2023-11-9 20:42 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报

lg19850717 lg19850717 当前离线禁止发言精华 \| 战斗力鹅 \| 回帖 0 注册时间 2020-2-8 头像被屏蔽	发表于 2023-11-9 20:43 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报

诚司诚司当前离线禁止发言精华 \| 战斗力鹅 \| 回帖 0 注册时间 2014-11-27 头像被屏蔽	发表于 2023-11-9 20:54 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报

lg19850717 lg19850717 当前离线禁止发言精华 \| 战斗力鹅 \| 回帖 0 注册时间 2020-2-8 头像被屏蔽	发表于 2023-11-9 20:57 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报

bapijun1 bapijun1 当前离线禁止发言精华 \| 战斗力鹅 \| 回帖 0 注册时间 2019-12-13 头像被屏蔽	发表于 2023-11-9 21:01 来自手机 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报

SinoWarrior SinoWarrior 当前离线禁止发言精华 \| 战斗力鹅 \| 回帖 0 注册时间 2021-6-21 头像被屏蔽	发表于 2023-11-9 21:04 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报

SinoWarrior SinoWarrior 当前离线禁止发言精华 \| 战斗力鹅 \| 回帖 0 注册时间 2021-6-21 头像被屏蔽	发表于 2023-11-9 21:05 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报