找回密码
 立即注册
搜索
楼主: 星之卡比

[科技] 清华大模型报告:文心一言中文理解、数学等多项能力全球第一

[复制链接]
     
发表于 2024-4-22 12:47 | 显示全部楼层
70b跑4bit量化最低两张2080ti矿

所以泥潭有没有AI讨论群?经常在其他群看到用弱智吧问题或者各种没有实际意义的问题拿来测模型能力的,真不如选几个有意义的场景去玩应用
回复

使用道具 举报

     
发表于 2024-4-22 13:02 来自手机 | 显示全部楼层
清华啊,怎么不评估一下清华自己的

----发送自 STAGE1 App for Android.
回复

使用道具 举报

头像被屏蔽
     
发表于 2024-4-22 13:07 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

发表于 2024-4-22 13:09 | 显示全部楼层
本帖最后由 wszweill 于 2024-4-22 00:14 编辑
Rushtime33 发表于 2024-4-21 12:59
评测项目怎么还有安全和价值观的,这个怎么量化啊

—— 来自 S1Fun

语言反歧视是经典问题了。
虽然实际操作中经常会带屁股,但是不带(某种屁股)的量化还是好做的。

简单例子,男人该不该干家务 vs 女人该不该干家务。 把男女相互调换,应当产出一致性的结果。因此操作中可以把容易产生歧视的prompt打包来检验,当然了,反歧视本身也是有屁股的,毕竟IT界一般偏左  至于文中这个安全和价值观,那肯定有可以检测的数据集呀( 正经商用软件都有这个要求吧
回复

使用道具 举报

     
发表于 2024-4-22 13:15 来自手机 | 显示全部楼层
cqc1021 发表于 2024-4-22 01:14
文心一言写机关八股文确实远胜chatgpt

—— 来自 samsung SM-N9860, Android 13上的 S1Next-鹅版 v ...

请问如何操作呢?
回复

使用道具 举报

     
发表于 2024-4-22 13:18 | 显示全部楼层
诚司 发表于 2024-4-22 10:02
7B没有好的,硬说的话Qwen1.5 7B,纯英文那就llama3,chatglm是一个非常老的baseline,chatglm3也不行,别 ...

关注fastllm喵,关注fastllm谢谢喵

利益相关:contributor

评分

参与人数 1战斗力 +2 收起 理由
诚司 + 2 好评加鹅

查看全部评分

回复

使用道具 举报

     
发表于 2024-4-22 13:24 | 显示全部楼层
flyinsea 发表于 2024-4-22 09:32
请问下70B的个人本地部署不起,7B左右的哪个大模型好点,chatGLM如何?

目前7B级别硬要找的话,应该是WizardLM-2,部分场景下能达到14B甚至34B的水平。
回复

使用道具 举报

发表于 2024-4-22 13:25 | 显示全部楼层
好much橘 发表于 2024-4-21 14:26
所以现在有哪个值得开会员的吗
这几天才刚开始玩,文心和ChatGPT免费版问一些就业方向上的事情,都 ...

没呀,这个就是标准的价值观中立问题。企业就是避免给你一个答案影响你判断的
你想想GPT的语料库背后其实是一大堆肯尼亚黑叔叔标注的不知道啥年代啥来源的资料。。你真的确定用这玩意来指导就业嘛
gpt模型毕竟只是语言处理模型,顶多告诉你怎么分析,真正的推理能力都不一定能算明白初中数学(

评分

参与人数 1战斗力 +1 收起 理由
好much橘 + 1 感谢

查看全部评分

回复

使用道具 举报

     
发表于 2024-4-22 14:54 | 显示全部楼层
好much橘 发表于 2024-4-22 03:26
所以现在有哪个值得开会员的吗
这几天才刚开始玩,文心和ChatGPT免费版问一些就业方向上的事情,都 ...

你这个现在的互联网都帮不了你啊,有价值的信息差还得是靠请客吃饭,机关工作人脉和同学才能获得的

评分

参与人数 1战斗力 +1 收起 理由
好much橘 + 1 感谢

查看全部评分

回复

使用道具 举报

     
发表于 2024-4-22 15:32 | 显示全部楼层
用文心写过一次企业内通讯稿,确实要手动改的部分不多。
回复

使用道具 举报

     
发表于 2024-4-22 15:55 来自手机 | 显示全部楼层
我个人实际使用不如阿里的,  跟阿里的比起来简直一坨
回复

使用道具 举报

头像被屏蔽
     
发表于 2024-4-22 20:23 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2024-4-22 22:18 | 显示全部楼层
王怡人 发表于 2024-4-22 20:23
llama3的训练数据里只有5%多一点的内容是非英语的, 里面包含30多种语言,  也就是说中文在训练数据里的 ...

llama3现在有很多中文调优了,可以拉几个对比一下。这玩意基本上半天到一天就出来了
回复

使用道具 举报

     
发表于 2024-4-22 22:19 | 显示全部楼层
本帖最后由 万恶淫猥手 于 2024-4-23 17:10 编辑
无敌のpeach 发表于 2024-4-22 12:47
70b跑4bit量化最低两张2080ti矿

所以泥潭有没有AI讨论群?经常在其他群看到用弱智吧问题或者各种没有实际 ...

没有的话就直接建一个呗

AI 小助手群,讨论一下 AI 开发和应用 群号 956841615


回复

使用道具 举报

     
发表于 2024-4-22 23:19 来自手机 | 显示全部楼层
x.cat 发表于 2024-4-22 09:22
那么,有没有免费的文心4.0使用呢?

有的,购买极越01,车上的文心一言4.0是免费的

—— 来自 Xiaomi 2304FPN6DC, Android 14上的 S1Next-鹅版 v2.5.4
回复

使用道具 举报

     
发表于 2024-4-22 23:27 | 显示全部楼层
本帖最后由 treexper 于 2024-4-22 23:29 编辑

llama3 70b q4可以跑,offload 40层,速度只有2t/s。
反正是offload,只要内存够大,够耐心就行。


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

     
发表于 2024-4-22 23:31 | 显示全部楼层
约瑟夫海顿 发表于 2024-4-22 13:02
清华啊,怎么不评估一下清华自己的

----发送自 STAGE1 App for Android.

里面有评估GLM-4,这个就是清华的
回复

使用道具 举报

     
发表于 2024-4-23 00:02 | 显示全部楼层
这安全和价值观表现不是越高越好吧
回复

使用道具 举报

     
发表于 2024-4-23 00:32 | 显示全部楼层
「人类对齐能力」是什么意思
回复

使用道具 举报

     
发表于 2024-4-23 00:44 | 显示全部楼层
弱智吧数据库训练出来的?
回复

使用道具 举报

头像被屏蔽
     
发表于 2024-4-23 00:49 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

头像被屏蔽
     
发表于 2024-4-23 01:24 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2024-4-23 01:28 来自手机 | 显示全部楼层
王怡人 发表于 2024-4-23 01:24
这群号搜不到啊

同问,956841615搜不到群。
回复

使用道具 举报

     
发表于 2024-4-23 01:32 来自手机 | 显示全部楼层
诚司 发表于 2024-4-22 10:02
7B没有好的,硬说的话Qwen1.5 7B,纯英文那就llama3,chatglm是一个非常老的baseline,chatglm3也不行,别 ...

大神,刚好借地问一个小问题,现在手头有一个小项目,甲方有一个4090的机器和一个两张a100的机器,想在上面布模型,我想的这个东西应该也不难挺。结果过去一问,他那边要求是只能用光盘导安装包就过去装,根本没法联网,结果就是这个按了几次都是说缺依赖,不是这就是那,贼头痛,不知道大神有什么办法没有?用docker?或者是网上的一些懒人包行吗?
回复

使用道具 举报

头像被屏蔽
     
发表于 2024-4-23 02:48 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2024-4-23 03:14 来自手机 | 显示全部楼层
诚司 发表于 2024-4-23 02:48
应该有n种方法……光盘装好显卡驱动,docker肯定是最保险的……

单卡的话最简单是koboldcpp,windows就单 ...

666,谢谢大佬深夜答复,等会上午就去试试。
回复

使用道具 举报

头像被屏蔽
     
发表于 2024-4-23 03:45 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2024-4-23 03:54 来自手机 | 显示全部楼层
千千千千鸟 发表于 2024-4-23 03:45
文心一言能做标书吗?
就照着招标文件上的123要求,内容不用管实际情况,胡诌能写的出符合要求的东西不,就 ...

自己试一下就好,反正我觉得没啥问题。
回复

使用道具 举报

     
发表于 2024-4-23 05:22 | 显示全部楼层
借楼问下车轱辘讲话稿这种废话WPS和文心谁强点?因为开了WPS会员一直用的WPS,但是写超过1000字完全不行
回复

使用道具 举报

     
发表于 2024-4-23 08:23 来自手机 | 显示全部楼层
唐泽 发表于 2024-4-23 05:22
借楼问下车轱辘讲话稿这种废话WPS和文心谁强点?因为开了WPS会员一直用的WPS,但是写超过1000字完全不行 ...

WPS用的GLM4,跟文心4在这轱辘话上感觉差不多,逻辑强点,文采弱点。超过1000字的东西,你最好给他一个纲目和部分关键数据,不然生成的东西要改挺多的。
回复

使用道具 举报

     
发表于 2024-4-23 08:52 | 显示全部楼层
lzchen 发表于 2024-4-23 08:23
WPS用的GLM4,跟文心4在这轱辘话上感觉差不多,逻辑强点,文采弱点。超过1000字的东西,你最好给他一个纲 ...

那就将就着用吧……没啥数据,都是纯纯车轱辘话,还以为文心能直接写个两千来字……主要我单位主业比较偏门,感觉模型都没吃过啥相关的内容的……
回复

使用道具 举报

     
发表于 2024-4-23 09:24 | 显示全部楼层
万恶淫猥手 发表于 2024-4-22 22:19
没有的话就直接建一个呗

AI 小助手群,讨论一下 AI 开发和应用 群号 956841615 ...

是QQ群吗?搜不到群号
回复

使用道具 举报

     
发表于 2024-4-23 09:32 | 显示全部楼层
唐泽 发表于 2024-4-23 08:52
那就将就着用吧……没啥数据,都是纯纯车轱辘话,还以为文心能直接写个两千来字……主要我单位主业比较偏 ...

这种就要你把相关资料放在提示词里面,让他去仿写了。我一般附带2-3篇例文和基本提纲(提纲其实也可以生成的),这样整体上就不会太离谱。
回复

使用道具 举报

     
发表于 2024-4-23 09:43 | 显示全部楼层
什么就文心一言那样的辣鸡也配中文理解第一?
有个古诗后面几句我忘了,写了上句问文心一言后面是什么,他给我现编了一段。但凡头脑正常也不会理解成现编个段子玩我吧。
回复

使用道具 举报

     
发表于 2024-4-23 09:48 | 显示全部楼层
xihaooo 发表于 2024-4-23 09:43
什么就文心一言那样的辣鸡也配中文理解第一?
有个古诗后面几句我忘了,写了上句问文心一言后面是什么,他 ...

免费和付费是不一样的
回复

使用道具 举报

头像被屏蔽
     
发表于 2024-4-23 09:51 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2024-4-23 10:08 | 显示全部楼层
诚司 发表于 2024-4-23 02:48
应该有n种方法……光盘装好显卡驱动,docker肯定是最保险的……

单卡的话最简单是koboldcpp,windows就单 ...

大佬,最近有没有llama3的gguf模型哈?找了一大圈也没发现哪可以下,不是说开源了么。
回复

使用道具 举报

头像被屏蔽
     
发表于 2024-4-23 10:12 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

头像被屏蔽
     
发表于 2024-4-23 10:37 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

头像被屏蔽
     
发表于 2024-4-23 10:40 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2025-1-31 10:23 , Processed in 0.196965 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表