找回密码
 立即注册
搜索
楼主: moeblack

[科技] (转型Deepseek交流楼)DEEPSEEK-R1完全可以说是全球第一LLM了

    [复制链接]
     
发表于 2025-1-28 02:30 | 显示全部楼层
本帖最后由 仓岛千百合 于 2025-1-28 02:38 编辑
OrianaThomson 发表于 2025-1-28 01:56
这楼也发个本地部署

已经本地部署了,试用了一下,为啥比在线版慢很多啊,在线一下就出来一堆字,这个两个字两个字的往外蹦。

32b 电脑配置12400F+3060TI


话说本地部署了怎么让写小黄文,试了一下还是显示政策原因写不了
回复

使用道具 举报

     
发表于 2025-1-28 02:32 | 显示全部楼层
说是有 600Gbps?

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

发表于 2025-1-28 02:38 | 显示全部楼层
网页API似乎修好了,但是chatbox本地api开始无法调用reasoner了
回复

使用道具 举报

     
 楼主| 发表于 2025-1-28 02:39 来自手机 | 显示全部楼层
仓岛千百合 发表于 2025-1-28 02:30
已经本地部署了,试用了一下,为啥比在线版慢很多啊,在线一下就出来一堆字,这个两个字两个字的往外蹦。
...

你用个1.5或者4b试一试就可以了,你32b太为难你的显卡
回复

使用道具 举报

     
发表于 2025-1-28 02:40 | 显示全部楼层
仓岛千百合 发表于 2025-1-28 02:30
已经本地部署了,试用了一下,为啥比在线版慢很多啊,在线一下就出来一堆字,这个两个字两个字的往外蹦。
...

本地部署就看你催眠术的水平了
回复

使用道具 举报

     
发表于 2025-1-28 02:41 | 显示全部楼层
gammatau 发表于 2025-1-28 02:40
本地部署就看你催眠术的水平了

能举个例子吗?
回复

使用道具 举报

     
发表于 2025-1-28 02:41 | 显示全部楼层
仓岛千百合 发表于 2025-1-28 02:30
已经本地部署了,试用了一下,为啥比在线版慢很多啊,在线一下就出来一堆字,这个两个字两个字的往外蹦。
...

32B还是得配置高点
回复

使用道具 举报

     
发表于 2025-1-28 02:43 | 显示全部楼层
本帖最后由 仓岛千百合 于 2025-1-28 02:45 编辑
moeblack 发表于 2025-1-28 02:39
你用个1.5或者4b试一试就可以了,你32b太为难你的显卡

请问怎么删掉这个32B的内容在重新下。
回复

使用道具 举报

     
发表于 2025-1-28 02:47 | 显示全部楼层
仓岛千百合 发表于 2025-1-28 02:30
已经本地部署了,试用了一下,为啥比在线版慢很多啊,在线一下就出来一堆字,这个两个字两个字的往外蹦。
...

应该是显存不够吧.你的GPU没法把整个网络都放到显存里,所以推理的过程中就会不断的有数据在内存和显存之间交换,这个过程挺慢的.
回复

使用道具 举报

     
 楼主| 发表于 2025-1-28 02:49 来自手机 | 显示全部楼层
仓岛千百合 发表于 2025-1-28 02:43
请问怎么删掉这个32B的内容在重新下。

问R1哈哈哈哈,我今天也忘记了,然后问的r1
回复

使用道具 举报

     
发表于 2025-1-28 02:59 来自手机 | 显示全部楼层
OrianaThomson 发表于 2025-1-28 01:56
这楼也发个本地部署

老黄知道自己的40系能跑671b吗
回复

使用道具 举报

     
发表于 2025-1-28 03:02 | 显示全部楼层
moeblack 发表于 2025-1-28 02:49
问R1哈哈哈哈,我今天也忘记了,然后问的r1

看了一下,听说32B以下模型效果都不太理想...慢就慢吧,请问下,这玩意如果不使用对电脑性能没啥影响吧
回复

使用道具 举报

     
 楼主| 发表于 2025-1-28 03:03 来自手机 | 显示全部楼层
仓岛千百合 发表于 2025-1-28 03:02
看了一下,听说32B以下模型效果都不太理想...慢就慢吧,请问下,这玩意如果不使用对电脑性能没啥影响吧 ...

我的建议是直接用官方的api,官方api可以SESE的
回复

使用道具 举报

     
发表于 2025-1-28 03:20 | 显示全部楼层
moeblack 发表于 2025-1-28 03:03
我的建议是直接用官方的api,官方api可以SESE的

API现在崩了吗 用chatboxai输入秘钥后跟它说话没反应。
回复

使用道具 举报

发表于 2025-1-28 03:23 | 显示全部楼层


李开复说他早已预料到

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

     
发表于 2025-1-28 03:24 来自手机 | 显示全部楼层
以前觉得这种攻击是上不得台面的手段,只有小企业才这么干,结果世界头部企业也这么玩

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

     
发表于 2025-1-28 03:28 来自手机 | 显示全部楼层
没有接触过酒馆,大家说的酒馆是指这个SillyTavern

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

     
发表于 2025-1-28 03:45 | 显示全部楼层
riin2 发表于 2025-1-28 03:23
李开复说他早已预料到

李开复自己的YI都放弃开源了。它那个YI还是第一个支持中文非常好的开源模型呢。后续的迭代更新模型看评分是不错,问题是他闭源啊。开源不如llama qwen (过去的deepseek虽然也开源,但是它太大了,个人/小企业不如买它的白菜价API),闭源不如各**厂闭源API
回复

使用道具 举报

     
发表于 2025-1-28 03:50 | 显示全部楼层
本帖最后由 泰坦失足 于 2025-1-28 03:57 编辑

https://www.reddit.com/r/LocalLL ... 131gb_dynamic_gguf/
你可以在 2 个 H100 80GB GPU 上载入所有层以 140 个 token/s 的速度。像 RTX 4090 这样的 24GB GPU 应该能够获得至少 1 到 3 个 token/s。
感觉再量化一点就正好能把671b塞进一个project digits, 或者按官方说的,两个project digits连接,达到256G统一内存,怎么都够了.
回复

使用道具 举报

     
发表于 2025-1-28 03:50 来自手机 | 显示全部楼层
仓岛千百合 发表于 2025-1-28 02:30
已经本地部署了,试用了一下,为啥比在线版慢很多啊,在线一下就出来一堆字,这个两个字两个字的往外蹦。
...

32b要20G以上显存
我16G显存用的14b,我用32b也明显比14b慢

—— 来自 鹅球 v3.3.96-alpha
回复

使用道具 举报

     
发表于 2025-1-28 04:04 | 显示全部楼层
api还没恢复么 这网页动不动不能回答 或者撤回也太难受了
回复

使用道具 举报

     
发表于 2025-1-28 04:06 | 显示全部楼层
4060显卡试了一下8b,慢得很,1.5b又太弱智,连1.11和1.9谁大,都能回答没有学过。
回复

使用道具 举报

     
发表于 2025-1-28 04:09 | 显示全部楼层
https://qwen.readthedocs.io/zh-c ... peed_benchmark.html
32B 参考纯GPU运行int4的最低显存要求是18.94显存。Ollama使用的GGUF,超了不会爆显存但是会载入到CPU内存中,进一步的会载入到虚拟内存中。反正我的经验是只要显存不能全部放下,速度就开始慢了。
除此之外,上下文的长度会进一步加大显存占用
6144tokens 约4200个汉字还是10000个?记不得是乘以还是除以0.7了. 显存需求达到21.09G,14336 tokens 24.67G
回复

使用道具 举报

发表于 2025-1-28 04:32 来自手机 | 显示全部楼层
OrianaThomson 发表于 2025-1-28 01:56
这楼也发个本地部署

tmd,我显卡渣渣,但是内存512g
没救了只能api了吧
回复

使用道具 举报

发表于 2025-1-28 04:47 | 显示全部楼层
[img]blob:https://bbs.saraba1st.com/a5cfde17-4913-4333-a240-e64112316bd2[/img]

老马继续暴露无知
回复

使用道具 举报

发表于 2025-1-28 04:49 | 显示全部楼层


老马继续暴露无知

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

发表于 2025-1-28 05:06 来自手机 | 显示全部楼层
本地部署对比了下32b和14b,还是32b给的答案更符合

所以接下来是租个服务器跑吗,是不是还能炼色图(?)

----发送自 STAGE1 App for Android.
回复

使用道具 举报

     
发表于 2025-1-28 05:08 | 显示全部楼层
本帖最后由 黄泉川此方 于 2025-1-28 05:24 编辑

网页版对比32B联网
前端用的网页插件Page Assist


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

     
发表于 2025-1-28 06:06 | 显示全部楼层
现在好是好了破甲没用了啊,他开始跳各种提示了
回复

使用道具 举报

     
发表于 2025-1-28 06:31 | 显示全部楼层
本帖最后由 qqks 于 2025-1-28 06:32 编辑
希望之花 发表于 2025-1-28 05:06
本地部署对比了下32b和14b,还是32b给的答案更符合

所以接下来是租个服务器跑吗,是不是还能炼色图(?)

租到服务器的话跑这个不是更好?

https://huggingface.co/unsloth/D ... eepSeek-R1-UD-IQ1_S


1.58bit DeepSeek R1 - 131GB 动态 GGUF : r/LocalLLaMA --- 1.58bit DeepSeek R1 - 131GB Dynamic GGUF : r/LocalLLaMA (reddit.com)

评分

参与人数 1战斗力 +2 收起 理由
希望之花 + 2 好我去试试

查看全部评分

回复

使用道具 举报

     
发表于 2025-1-28 06:48 来自手机 | 显示全部楼层
怎么黄文都不分享的,泥潭的互联网精神呢!

—— 来自 鹅球 v3.3.96-alpha
回复

使用道具 举报

     
发表于 2025-1-28 07:06 来自手机 | 显示全部楼层
泥潭说有个静香的黄文流传于各大qq群,我至今仍未知道是啥
回复

使用道具 举报

     
发表于 2025-1-28 07:08 来自手机 | 显示全部楼层
吴怀在 发表于 2025-1-28 07:06
泥潭说有个静香的黄文流传于各大qq群,我至今仍未知道是啥

我也在蹲啊
回复

使用道具 举报

     
发表于 2025-1-28 07:13 来自手机 | 显示全部楼层
现在api的r1好像还在崩着,v3倒是能用了
回复

使用道具 举报

     
发表于 2025-1-28 07:14 | 显示全部楼层
阿刚 发表于 2025-1-28 06:06
现在好是好了破甲没用了啊,他开始跳各种提示了

671b的纯血r1已经量化到130多g显存要求了。那些魔改显存显卡可能三块就能跑。moe架构同时激活的神经元少。但是还都得在显存待命,不然生成速度依然受影响。

论坛助手,iPhone
回复

使用道具 举报

     
发表于 2025-1-28 08:04 | 显示全部楼层
啥情况??网页版能用是因为这个?被夺舍了??还是说他在演我?这也太奇怪了吧

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

     
发表于 2025-1-28 08:12 | 显示全部楼层
我彻底迷茫了到底是深度思维在演我还是真的说漏嘴了
这是第一个问题我一开始没当回事,然后追问了下
这是第二个问题然后我发现他居然开始忽悠我
第三个问题他直接被打断了深度思考然后我重新发了一下思考内容就没了直接是答案

然后第四个问题他就直接反过来了
我尼玛什么情况啊

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

     
发表于 2025-1-28 08:13 来自手机 | 显示全部楼层
阿刚 发表于 2025-1-28 08:12
我彻底迷茫了到底是深度思维在演我还是真的说漏嘴了
这是第一个问题我一开始没当回事,然后追问了下
这是第 ...

第一次用吧?多用几个其他家的就习惯了
回复

使用道具 举报

     
发表于 2025-1-28 08:18 | 显示全部楼层
Rafale 发表于 2025-1-28 08:13
第一次用吧?多用几个其他家的就习惯了

所以这个深度思考也是在忽悠人的是吧
回复

使用道具 举报

     
发表于 2025-1-28 08:34 来自手机 | 显示全部楼层
都是基于你问题的向量空间概率

—— 来自 鹅球 v3.3.96-alpha
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2025-3-4 12:38 , Processed in 0.151772 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表