找回密码
 立即注册
搜索
查看: 17336|回复: 111

[科技] 清华大模型报告:文心一言中文理解、数学等多项能力全球第一

[复制链接]
头像被屏蔽
发表于 2024-4-22 00:08 来自手机 | 显示全部楼层 |阅读模式
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2024-4-22 00:11 来自手机 | 显示全部楼层
chatgpt的数学确实差,加法都算不清楚
回复

使用道具 举报

发表于 2024-4-22 00:16 | 显示全部楼层
数学那么强?难道要开个文心4的会员了
回复

使用道具 举报

     
发表于 2024-4-22 00:16 | 显示全部楼层
若要佛法兴,除非僧赞僧。
回复

使用道具 举报

     
发表于 2024-4-22 00:18 | 显示全部楼层
本帖最后由 canti 于 2024-4-22 00:20 编辑

https://blog.csdn.net/cf2suds8x8f0v/article/details/137942965
这里有比较完整的评测标准和结果









—— 来自 S1Fun

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

     
发表于 2024-4-22 00:27 | 显示全部楼层
中文我信,文心帮我娃写的作文比gpt强多了
回复

使用道具 举报

头像被屏蔽
     
发表于 2024-4-22 00:30 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

头像被屏蔽
     
发表于 2024-4-22 00:50 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2024-4-22 01:01 来自手机 | 显示全部楼层
送了一天试用体验了一下确实比免费的好很多,但是还是不值得充钱
回复

使用道具 举报

头像被屏蔽
     
发表于 2024-4-22 01:06 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2024-4-22 01:10 | 显示全部楼层
但通义千问生成的东西文采好点,文心一言识别可以,但是生成比较保守
回复

使用道具 举报

     
发表于 2024-4-22 01:14 来自手机 | 显示全部楼层
文心一言写机关八股文确实远胜chatgpt

—— 来自 samsung SM-N9860, Android 13上的 S1Next-鹅版 v2.5.4
回复

使用道具 举报

头像被屏蔽
     
发表于 2024-4-22 01:16 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2024-4-22 01:23 来自手机 | 显示全部楼层
作为智能体差那么多?
回复

使用道具 举报

     
发表于 2024-4-22 01:59 | 显示全部楼层
评测项目怎么还有安全和价值观的,这个怎么量化啊

—— 来自 S1Fun
回复

使用道具 举报

     
发表于 2024-4-22 02:03 | 显示全部楼层
智能体能力表现是啥意思

评分

参与人数 2战斗力 0 收起 理由
哌啶 + 1 回血
survivor -1 有毛病

查看全部评分

回复

使用道具 举报

     
发表于 2024-4-22 03:26 来自手机 | 显示全部楼层
所以现在有哪个值得开会员的吗
这几天才刚开始玩,文心和ChatGPT免费版问一些就业方向上的事情,都是给我打马虎眼让我好好查证收集资料注意风险问更有倾向的东西感觉都非常中立,还是说这种部分目前只能这样了。
回复

使用道具 举报

头像被屏蔽
     
发表于 2024-4-22 03:56 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2024-4-22 08:08 来自手机 | 显示全部楼层
那么你买国行苹果吗?
回复

使用道具 举报

     
发表于 2024-4-22 08:16 | 显示全部楼层
国内的大模型写代码实际体验哪个比较强?之前试下来就感觉百川的生成结果还行,文心一言完全不能看
通义千问和讯飞星火之前试下来感觉也不如百川,不知道现在怎么样了
回复

使用道具 举报

     
发表于 2024-4-22 08:22 | 显示全部楼层
本帖最后由 万恶淫猥手 于 2024-4-22 08:28 编辑

这么多人吹Qwen我其实没想明白,我用的70b模型,除了对话效果好一点。
但是推理能力和指令遵循能力很差啊,哪怕我跟了很详细的CoT也会出一些明显不符合要求的结果。看上去只对对话做了很多优化,生产用不大行啊
如果要我选,我当然选Mistral啊,指令遵循效果好,只是中文确实不行。实现不行不是还有WizardLM-2嘛
回复

使用道具 举报

     
发表于 2024-4-22 08:30 | 显示全部楼层
写网文战斗场景哪个好。
回复

使用道具 举报

     
发表于 2024-4-22 08:41 | 显示全部楼层
对中文成语的理解能力都不太行的样子。
生成的内容也是以官方的、书面语言为主,不够口语化、真人化
回复

使用道具 举报

头像被屏蔽
发表于 2024-4-22 08:58 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2024-4-22 09:09 | 显示全部楼层
为什么没有谷歌的
回复

使用道具 举报

     
发表于 2024-4-22 09:22 | 显示全部楼层
那么,有没有免费的文心4.0使用呢?
回复

使用道具 举报

     
发表于 2024-4-22 09:29 | 显示全部楼层
claude的问题就是封号太严重,能力确实顶
回复

使用道具 举报

     
发表于 2024-4-22 09:32 | 显示全部楼层
诚司 发表于 2024-4-22 01:16
关键是Qwen有开源版,不但现在有72B,下周据说还有110B开源(现在有demo了),开源模型能调的东西多了去了 ...

请问下70B的个人本地部署不起,7B左右的哪个大模型好点,chatGLM如何?
回复

使用道具 举报

头像被屏蔽
     
发表于 2024-4-22 10:02 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

头像被屏蔽
     
发表于 2024-4-22 10:16 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2024-4-22 10:22 | 显示全部楼层
诚司 发表于 2024-4-22 10:02
7B没有好的,硬说的话Qwen1.5 7B,纯英文那就llama3,chatglm是一个非常老的baseline,chatglm3也不行,别 ...

了解,谢了~
回复

使用道具 举报

头像被屏蔽
     
发表于 2024-4-22 10:29 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2024-4-22 10:30 来自手机 | 显示全部楼层
文心4.0会员点赞,至少副处级水平

—— 来自 Xiaomi 2210132C, Android 14上的 S1Next-鹅版 v2.5.2
回复

使用道具 举报

     
发表于 2024-4-22 11:31 | 显示全部楼层
诚司 发表于 2024-4-22 10:02
7B没有好的,硬说的话Qwen1.5 7B,纯英文那就llama3,chatglm是一个非常老的baseline,chatglm3也不行,别 ...

4090可以吗?
回复

使用道具 举报

头像被屏蔽
     
发表于 2024-4-22 11:34 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2024-4-22 11:35 来自手机 | 显示全部楼层
文心4.0写代码不如3.5,嘴还比3.5硬。
回复

使用道具 举报

头像被屏蔽
     
发表于 2024-4-22 11:39 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2024-4-22 11:44 | 显示全部楼层
“李彦宏:文心一言用户数破2亿,开源模型会越来越落后”
反正我用开源的Llama3和Qwen,不然每次大批量跑全文分析都要琢磨下这些token要多少钱。上次看百度开会请了项立刚去,然后他回来吹百度怎么好怎么好
回复

使用道具 举报

     
发表于 2024-4-22 11:48 | 显示全部楼层
诚司 发表于 2024-4-22 11:39
笔记本版的4090显存只有16g,不太行,台式机的24g显存,大体可以装下qwen 32b,不过我没试过上下文长度多 ...

https://www.reddit.com/r/LocalLL ... gguf_on_24gig_vram/
量化模型的话,有人说70b都行。我一般都是用4bits的量化版,推理速度更快还能有更长的上下文空间。
回复

使用道具 举报

头像被屏蔽
     
发表于 2024-4-22 11:51 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2025-1-31 07:29 , Processed in 0.127955 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表