找回密码
 立即注册
搜索
查看: 16629|回复: 111

[科技] 清华大模型报告:文心一言中文理解、数学等多项能力全球第一

[复制链接]
     
发表于 2024-4-22 11:44 | 显示全部楼层
“李彦宏:文心一言用户数破2亿,开源模型会越来越落后”
反正我用开源的Llama3和Qwen,不然每次大批量跑全文分析都要琢磨下这些token要多少钱。上次看百度开会请了项立刚去,然后他回来吹百度怎么好怎么好
回复

使用道具 举报

     
发表于 2024-4-22 11:48 | 显示全部楼层
诚司 发表于 2024-4-22 11:39
笔记本版的4090显存只有16g,不太行,台式机的24g显存,大体可以装下qwen 32b,不过我没试过上下文长度多 ...

https://www.reddit.com/r/LocalLL ... gguf_on_24gig_vram/
量化模型的话,有人说70b都行。我一般都是用4bits的量化版,推理速度更快还能有更长的上下文空间。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2024-5-25 11:33 , Processed in 0.018245 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表