找回密码
 立即注册
搜索
查看: 5296|回复: 22

[硬件] AMD称7900XTX在推理DeepSeek R1蒸馏模型时胜过4090

[复制链接]
     
发表于 2025-1-30 14:56 | 显示全部楼层 |阅读模式
回复

使用道具 举报

     
发表于 2025-1-30 15:01 | 显示全部楼层
32B 就被反超了。。。
回复

使用道具 举报

     
发表于 2025-1-30 15:13 来自手机 | 显示全部楼层
还没看原文,盲猜 4090 没用 TensorRT,AMD 用了优化模型
回复

使用道具 举报

     
发表于 2025-1-30 16:30 来自手机 | 显示全部楼层
单纯就是显存大

—— 来自 鹅球 v3.3.96-alpha
回复

使用道具 举报

     
发表于 2025-1-30 16:45 来自手机 | 显示全部楼层
noahhhh 发表于 2025-1-30 15:13
还没看原文,盲猜 4090 没用 TensorRT,AMD 用了优化模型

TensorRT这个东西真的难用

对于普通用户没有使用的理由


—— 来自 鹅球 v3.3.96
回复

使用道具 举报

     
发表于 2025-1-30 16:52 | 显示全部楼层
有点呃呃了
回复

使用道具 举报

发表于 2025-1-30 17:04 来自手机 | 显示全部楼层
moeblack 发表于 2025-1-30 16:45
TensorRT这个东西真的难用

对于普通用户没有使用的理由

放着671b,100万次16元的api不用,本地部署32b蒸馏模型的是普通用户吗

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

     
发表于 2025-1-30 17:18 | 显示全部楼层
有农卡本地化部署的教程吗
回复

使用道具 举报

     
发表于 2025-1-30 17:21 来自手机 | 显示全部楼层
伊克路西安 发表于 2025-1-30 17:04
放着671b,100万次16元的api不用,本地部署32b蒸馏模型的是普通用户吗

—— 来自 鹅球 v3.3.96 ...

算不清楚这个账的人可太多了,还有就是被短视频骗了
——
价格是output 16元/M 不是次
回复

使用道具 举报

     
发表于 2025-1-30 17:49 | 显示全部楼层
花点钱买API啦,球球你们(
回复

使用道具 举报

     
发表于 2025-1-30 17:51 | 显示全部楼层
还不如买个64G的mac mini
回复

使用道具 举报

发表于 2025-1-30 18:01 | 显示全部楼层

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

     
发表于 2025-1-30 18:40 | 显示全部楼层
本地部署总会有需求的,毕竟总有人有隐私要求
回复

使用道具 举报

发表于 2025-1-30 19:04 来自手机 | 显示全部楼层
嗯,高科技公司一堆活用deepseek的啊
回复

使用道具 举报

     
发表于 2025-1-31 10:36 | 显示全部楼层
Realplayer 发表于 2025-1-30 17:18
有农卡本地化部署的教程吗

6800及以上的显卡直接下载LM studio就能用了
回复

使用道具 举报

发表于 2025-1-31 11:27 | 显示全部楼层
星空天神 发表于 2025-1-31 10:36
6800及以上的显卡直接下载LM studio就能用了

我6650下了lm studio照样用
也没按amd说的更新最新驱动

回复

使用道具 举报

     
发表于 2025-1-31 11:31 来自手机 | 显示全部楼层
璇瑢子R 发表于 2025-1-31 11:27
我6650下了lm studio照样用
也没按amd说的更新最新驱动

你看看跑的时候是跑在cpu还是gpu上

—— 来自 OnePlus LE2120, Android 14上的 S1Next-鹅版 v2.5.4
回复

使用道具 举报

发表于 2025-1-31 11:31 | 显示全部楼层
星空天神 发表于 2025-1-31 11:31
你看看跑的时候是跑在cpu还是gpu上

—— 来自 OnePlus LE2120, Android 14上的 S1Next-鹅版 v2.5.4 ...

gpu 100%,cpu占用率十几二十几
回复

使用道具 举报

     
 楼主| 发表于 2025-1-31 15:41 | 显示全部楼层
我是24.10.1驱动加最新的LM runtime (1.9.2)无法调用显卡和显存
换了24.12.1驱动就好了
6800XT
回复

使用道具 举报

     
发表于 2025-2-1 00:44 | 显示全部楼层
win,7800xt
lla0.5.7,14b,下半天下完了
问下这个能不能备份出来?换电脑活重装不是还得下一遍
回复

使用道具 举报

发表于 2025-2-1 00:51 | 显示全部楼层
Realplayer 发表于 2025-2-1 00:44
win,7800xt
lla0.5.7,14b,下半天下完了
问下这个能不能备份出来?换电脑活重装不是还得下一遍 ...

你把存模型的文件夹复制出来就行。

评分

参与人数 1战斗力 +1 收起 理由
Realplayer + 1

查看全部评分

回复

使用道具 举报

     
发表于 2025-2-1 00:56 | 显示全部楼层
璇瑢子R 发表于 2025-2-1 00:51
你把存模型的文件夹复制出来就行。

哦哦找到一个带点的文件夹
回复

使用道具 举报

发表于 2025-2-1 02:59 | 显示全部楼层
前几天用去年9月的预览版驱动+ollama跑r1 32b,结果全都占的RAM而不是VRAM,明明24GB够用的,运算倒全是GPU在跑

回头有空了用25.1.1驱动+LM Studio试试

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2025-3-12 19:33 , Processed in 0.081403 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表