找回密码
 立即注册
搜索
查看: 3010|回复: 13

[硬件] 求推荐生成式AI 配置

[复制链接]
     
发表于 2024-4-28 22:50 | 显示全部楼层 |阅读模式
公司开始搭AI工作站搭建ChatGLM,预算10万以内
我正在选配置,但是根本没概念,找了个实习生慢慢配进展好慢,求一步到胃

高端显卡的渠道应该没问题,就是不知道预算上限够不够
回复

使用道具 举报

头像被屏蔽
     
发表于 2024-4-28 23:01 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
 楼主| 发表于 2024-4-28 23:05 | 显示全部楼层
诚司 发表于 2024-4-28 23:01
第一步就错了,以后步步错
chatglm3只有6B,而且都什么时代的玩意了
手机都能跑量化的chatglm 6b, ...

大佬,求推荐下吧

我可能被实习生带偏了

回复

使用道具 举报

头像被屏蔽
     
发表于 2024-4-28 23:10 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
 楼主| 发表于 2024-4-28 23:20 | 显示全部楼层
诚司 发表于 2024-4-28 23:10
你可以看这个人:
【AI大模型本地化部署Q/A硬件篇-哔哩哔哩】 https://b23.tv/qS4RUJy
不知道你们单位什么 ...

主要是发票问题,二手会比较麻烦

3090 的性价比最高?
回复

使用道具 举报

头像被屏蔽
     
发表于 2024-4-28 23:31 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2024-4-28 23:40 | 显示全部楼层
ChatGLM开源已经太监了。投入Qwen怀抱把。
10W的话,买双卡A6000,能把Qwen32B跑起来,能稍微微调一下。72B-4bit也能跑。

为什么不买4卡4090,因为vllm的parallel size 对模型隐层有要求。
回复

使用道具 举报

头像被屏蔽
     
发表于 2024-4-28 23:46 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2024-4-29 10:08 来自手机 | 显示全部楼层
本帖最后由 squarezty 于 2024-4-29 10:14 编辑

预算10万以内想搞正经训练确实太少了,好的计算卡买不到只能买二手,好不容易买了板u跟一大堆二手卡光是it工作都够你喝一壶的,那还不如来点邪门的,买或者租台192G内存的mac studio,m2 ultra芯片那款,保证能运行70b语言模型(比如llama3-70b),但是!不保证速度,推理速度大概个位数的token/s吧,看你老板能不能接受了。搭建也很简单网上一大堆教程,其实可以租台机器试试的,短时间把环境搞好交差,跟你老板说要更好效果得加钱
回复

使用道具 举报

     
 楼主| 发表于 2024-4-29 14:32 来自手机 | 显示全部楼层
mythgogo 发表于 2024-4-28 23:40
ChatGLM开源已经太监了。投入Qwen怀抱把。
10W的话,买双卡A6000,能把Qwen32B跑起来,能稍微微调一下。72B ...

今天看了你们的帖子,我好好合计了下,会买两张A6000,同步正在申请修改预算,节后会换成千问看看
回复

使用道具 举报

     
发表于 2024-4-29 15:32 来自手机 | 显示全部楼层
GLM已经是老皇历了虽然也才几个月
现在QWEN72B是比较现实的选择

—— 来自 vivo V2302A, Android 14上的 S1Next-鹅版 v2.5.4
回复

使用道具 举报

     
发表于 2024-4-29 16:16 | 显示全部楼层
本帖最后由 ycjiang1337 于 2024-4-29 16:18 编辑

可以关注一下L20,便宜大碗的48G新架构卡,搭配VLLM基本上随便跑推理,LoRA微调也可以跑一下。另外ChatGLM-6B已经是时代的眼泪了,目前智谱的重心已经放在闭源GLM4上了,想用开源模型的话基本上要么LLama3要么千问家族
回复

使用道具 举报

     
发表于 2024-4-29 18:02 | 显示全部楼层
英文上llama3,中文上qwen,而且qwen还帮你做好了防止AI乱说话的措施(就是看reddit还是能轻松越狱)
回复

使用道具 举报

头像被屏蔽
     
发表于 2024-4-29 20:35 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2025-1-8 05:30 , Processed in 0.086100 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表