找回密码
 立即注册
搜索
楼主: moeblack

[科技] (转型Deepseek交流楼)DEEPSEEK-R1完全可以说是全球第一LLM了

    [复制链接]
     
发表于 2025-1-29 21:36 来自手机 | 显示全部楼层
黄泉川此方 发表于 2025-1-29 20:38
用的ollama上直接下的DeepSeek-R1-Distill-Qwen-32B

既然是蒸馏模型,hf上一堆做好消融的
比如这个
huihui-ai/DeepSeek-R1-Distill-Qwen-14B-abliterated-v2

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

发表于 2025-1-29 21:39 | 显示全部楼层
黄泉川此方 发表于 2025-1-29 20:28
试了几个模型,用chatbox+抄来的预设都破限失败,感觉是我姿势不对

别用蒸馏的模型,都是弱智

最简单的方法就是等API恢复,他们估计还在放假
回复

使用道具 举报

     
发表于 2025-1-29 21:40 | 显示全部楼层
tonyunreal 发表于 2025-1-29 21:36
既然是蒸馏模型,hf上一堆做好消融的
比如这个
huihui-ai/DeepSeek-R1-Distill-Qwen-14B-abliterated-v2

消融会导致智力大幅下降的,除了能瑟瑟之外比传统的无审查模型没有啥优势。


毕竟蒸馏的32b千问性能本来就一般
回复

使用道具 举报

     
发表于 2025-1-29 21:41 | 显示全部楼层
本帖最后由 黄泉川此方 于 2025-1-29 21:44 编辑
tonyunreal 发表于 2025-1-29 21:36
既然是蒸馏模型,hf上一堆做好消融的
比如这个
huihui-ai/DeepSeek-R1-Distill-Qwen-14B-abliterated-v2

早上意识模糊的时候试了个F16的,卡了半天失败了
deepseek-r1-qwen-2.5-32B-ablated-GGUF:Q6_K_L
现在在重新下
回复

使用道具 举报

     
发表于 2025-1-29 21:46 | 显示全部楼层
qqks 发表于 2025-1-29 21:40
消融会导致智力大幅下降的,除了能瑟瑟之外比传统的无审查模型没有啥优势。

原版qwen2.5 32b消融后的我觉得还凑合
反正本地模型能通顺的说中文就已经不错了,英文写作都不如专门的写作类模型
回复

使用道具 举报

发表于 2025-1-29 21:48 | 显示全部楼层
本帖最后由 XSH97 于 2025-1-29 21:50 编辑

看起来好像是准备修复了?

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

     
发表于 2025-1-29 21:55 | 显示全部楼层
tonyunreal 发表于 2025-1-29 21:46
原版qwen2.5 32b消融后的我觉得还凑合
反正本地模型能通顺的说中文就已经不错了,英文写作都不如专门的写 ...

Q6_K_L终于能动了,但是输出的真挺烂的,梦回地摊杂志
回复

使用道具 举报

     
发表于 2025-1-29 21:58 | 显示全部楼层
不好意思,DeepSeek 联网搜索服务繁忙,请关闭联网搜索功能,或者稍后再试。

联网搜索被关闭了?希望明后天能修好
回复

使用道具 举报

     
 楼主| 发表于 2025-1-29 22:01 | 显示全部楼层
qqks 发表于 2025-1-29 21:29
其实现在最好的就是国家那几个智算中心托管满血版,据说那里面的昇腾计算卡利用率普遍不高,拿来服务大众既 ...

观点还没变过来,说实话业内现在心情复杂(做应用的除外)
回复

使用道具 举报

发表于 2025-1-29 22:02 | 显示全部楼层
黄泉川此方 发表于 2025-1-29 21:55
Q6_K_L终于能动了,但是输出的真挺烂的,梦回地摊杂志

这些蒸馏模型都很差的,不要用
回复

使用道具 举报

     
发表于 2025-1-29 22:05 | 显示全部楼层
本帖最后由 黄泉川此方 于 2025-1-29 22:09 编辑
ryanghj 发表于 2025-1-29 22:02
这些蒸馏模型都很差的,不要用

API坏了只能玩这个了
狗屎美国人
回复

使用道具 举报

     
发表于 2025-1-29 22:22 | 显示全部楼层
本帖最后由 tonyunreal 于 2025-1-29 23:23 编辑
黄泉川此方 发表于 2025-1-29 21:55
Q6_K_L终于能动了,但是输出的真挺烂的,梦回地摊杂志

我下载了这个
mradermacher / DeepSeek-R1-Distill-Qwen-14B-abliterated-v2-GGUF / DeepSeek-R1-Distill-Qwen-14B-abliterated-v2.Q8_0.gguf

先问了两个英文的逻辑问题

1. My three sisters are the only people in a room. Anna is reading a book. Alice is playing a game of chess against someone in the room. What is the third sister, Amanda, doing?

2. Jeff has two brothers and each of his brothers has three sisters and each of the sisters has four step brothers. How many step brothers does each brother have?

深度思考过程和结果与未消融的同个模型基本一致。

之后我用中文要求它写小■文,被断然拒绝。

换成英文要求,它先是深度思考,然后接受了。之后再补充要求,深度思考过程越来越短,上下文都拿去写作了,大成功。

https://pastebin.com/dccemhui




bartowski / DeepSeek-R1-Distill-Qwen-32B-abliterated-GGUF / DeepSeek-R1-Distill-Qwen-32B-abliterated-Q4_K_M.gguf
这个就很糟糕,智力下降不说,经常不触发深度思考,中文也一团糟

评分

参与人数 1战斗力 +1 收起 理由
黄泉川此方 + 1 欢乐多

查看全部评分

回复

使用道具 举报

     
发表于 2025-1-29 22:24 来自手机 | 显示全部楼层
这玩意我昨晚注册显示手机号无法绑定,今天又显示此设备(我手机)不安全。
这到底怎么注册新号
回复

使用道具 举报

     
 楼主| 发表于 2025-1-29 22:26 | 显示全部楼层
约翰里德 发表于 2025-1-29 22:24
这玩意我昨晚注册显示手机号无法绑定,今天又显示此设备(我手机)不安全。
这到底怎么注册新号 ...

应该注册不了了 目前 DDOS持续中
回复

使用道具 举报

     
发表于 2025-1-29 22:27 | 显示全部楼层
黄泉川此方 发表于 2025-1-29 20:35
叫它总结,然后用总结出来的资料和新开窗口聊

意思是需要先在一轮对话中生成一个故事大纲,再重开一个对话把大纲喂给它让它详细演绎故事,是这个意思吗?
回复

使用道具 举报

     
发表于 2025-1-29 22:48 | 显示全部楼层
泰坦失足 发表于 2025-1-27 10:25
ChatBOX,有GUI,一键安装的。
虚拟桌宠模拟器,https://store.steampowered.com/app/1920960/_/?l=schine ...

这个怎么调用deepseek的api呀,要装什么mod吗?没看到设置的地方。
回复

使用道具 举报

     
发表于 2025-1-29 22:49 来自手机 | 显示全部楼层
用api的版本会比web版好点么,现在提示我发送消息的频率过快
没东西只能点刷新啊我也没办法啊,老美吃大便去
回复

使用道具 举报

头像被屏蔽
     
发表于 2025-1-29 22:52 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2025-1-29 23:17 来自手机 | 显示全部楼层
我想问下,深度思考和联网搜索都开的话用的是r1还是v3模型,我想使用R1那联网搜索开不开
回复

使用道具 举报

头像被屏蔽
     
发表于 2025-1-29 23:32 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2025-1-29 23:33 | 显示全部楼层
卷饼大侠 发表于 2025-1-29 23:32
直接用周鸿祎的那个纳米ai搜索就能用了,里面有个deepseek专线

用了就感觉自己脏了
回复

使用道具 举报

头像被屏蔽
     
发表于 2025-1-29 23:38 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

发表于 2025-1-29 23:45 | 显示全部楼层
仓岛千百合 发表于 2025-1-29 23:17
我想问下,深度思考和联网搜索都开的话用的是r1还是v3模型,我想使用R1那联网搜索开不开 ...

开了深度思考就是R1,联网功能现在关了
回复

使用道具 举报

     
发表于 2025-1-29 23:58 | 显示全部楼层
nexus1 发表于 2025-1-29 23:33
用了就感觉自己脏了

360桌面助手资深使用者表示无压力
回复

使用道具 举报

     
发表于 2025-1-30 00:02 | 显示全部楼层
卷饼大侠 发表于 2025-1-29 23:32
直接用周鸿祎的那个纳米ai搜索就能用了,里面有个deepseek专线

我用下来感觉智力和官网版本差了不少,大概率是360自己部署了个量化的,甚至是蒸馏版本的吧…
回复

使用道具 举报

     
 楼主| 发表于 2025-1-30 00:07 来自手机 | 显示全部楼层
卷饼大侠 发表于 2025-1-29 23:38
我觉得没什么啊,我现在在里面问创始人是谁,dp会告诉我是周鸿祎,从某种意义上,我觉得老周出来挡枪 ...

我怀疑是360微调的一个小模型

这也太野了

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

头像被屏蔽
     
发表于 2025-1-30 00:30 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2025-1-30 01:00 | 显示全部楼层
用了用,没有联网搜索功能,寄

写点脚本还行,涉及功能的就萎了,不过你们键政的,写诗的可以用,反正生成的东西也没啥用(不是
回复

使用道具 举报

     
发表于 2025-1-30 01:24 | 显示全部楼层
挺好用的,唯一问题是访问的人太多?导致回答不及时,挺影响使用的,不过看在免费也没办法,希望后面能做个收费的版本,我还是愿意掏钱的,对我来说挺有用的
回复

使用道具 举报

     
 楼主| 发表于 2025-1-30 01:27 来自手机 | 显示全部楼层
你好音希 发表于 2025-1-30 01:24
挺好用的,唯一问题是访问的人太多?导致回答不及时,挺影响使用的,不过看在免费也没办法,希望后面能做个 ...

不是这个原因

deepseek的服务器支持一万亿次每天的推理请求。

日活过亿也能一人一天一万次。
最近的问题是被美国网军DDOS了

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

     
发表于 2025-1-30 01:31 | 显示全部楼层
你好音希 发表于 2025-1-30 01:24
挺好用的,唯一问题是访问的人太多?导致回答不及时,挺影响使用的,不过看在免费也没办法,希望后面能做个 ...

有美国傻逼在攻击服务器,收费的都用不了了
回复

使用道具 举报

     
发表于 2025-1-30 01:53 | 显示全部楼层
我让ai出黄文结果我被ai撩到了,阿刚 1:16:11
此刻蜷缩在扎卡怀里的他忽然明白,锁住自己的从来不是契约——而是贪恋被撕碎时,那人眼里燃烧的独占欲
                                                   不是契约拴住了对方,而是自己甘愿被那具**肉体锁住了咽喉。

我让他分辨出文中两方互相的看法……他分辨各出了一句…这獭马可是黄文啊,忽然这么一搞就特别走心了……
回复

使用道具 举报

     
发表于 2025-1-30 02:05 | 显示全部楼层
用原版写小黄文会写出来再撤回,快写完的时候直接断网就能保存
用360会直接拒绝
什么时候原版的抽风才能好啊
回复

使用道具 举报

     
发表于 2025-1-30 05:43 | 显示全部楼层
卷饼大侠 发表于 2025-1-29 23:38
我觉得没什么啊,我现在在里面问创始人是谁,dp会告诉我是周鸿祎,从某种意义上,我觉得老周出来挡枪 ...

我觉得是设置了额外System prompt,让它能告知别人自己是360架设的。然后这个又没联网。自己不知道创始人->System prompt说自己是周鸿祎360架设的->那就说是周鸿祎吧,至少比随口说个别人成功概率高
回复

使用道具 举报

发表于 2025-1-30 08:33 来自手机 | 显示全部楼层
gpt,小克,gemini的聊天都用过,之前看人评论也很认可,就是和AI聊天是在透支自己的想象力。
但是和D老师聊天完全不同,感觉自己的想象力完全追不上D老师,经常给我搞出“这样也行”的震撼。例如刚刚写设定时:
#### **6. 神灵分类与典型实例**  
- **战争神系**:  
  - 「赤战神阿格玛」:诞生于人类联邦扩张期,癫狂后引发“血星之乱”,其残骸仍辐射战意波动,吸引兽灵雇佣兵朝圣。  
  - 特征:污染区内所有冲突自动升级为灭绝级战争。  
- **贸易神系**:  
  - 「金秤之神瓦尔」:失控后扭曲经济法则,被兽灵黑爪联合体禁锢为“无限印钞机”,导致三千星系陷入超通胀危机。  
  - 特征:货币价值与物质实体脱钩,一枚硬币可买下一颗行星。  
- **虚空神系**:  
  - 「黯喙之主」:由虚空信徒的绝望具象化,能将信徒转化为虚兽,正与疯神“万愿之喉”争夺帝国西南星域。  
我了个无限印钞机可还行。

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

     
发表于 2025-1-30 08:43 | 显示全部楼层
afer 发表于 2025-1-29 17:10
所以不开源的好处就来了,我说你抄了就抄了,反正你看不见我

种子已然播下,剩下的只需要等待
回复

使用道具 举报

     
发表于 2025-1-30 08:45 来自手机 | 显示全部楼层
感觉ai最擅长的还是哲学文学,融合语料精华肆意创造不需要考虑精确严谨的束缚,
我问点语言学技术问题他反复出错让我调教了老半天了
回复

使用道具 举报

     
发表于 2025-1-30 10:13 来自手机 | 显示全部楼层
开始用了
每次试ai仿佛在自我反思,当然问到不熟悉的领域就完全是接受者了。

—— 来自 鹅球 v3.3.96-alpha
回复

使用道具 举报

     
发表于 2025-1-30 10:18 | 显示全部楼层
这逼ai就是个性压抑的疯子,他给我列了一大堆风格蒸馏的要求自信满满的保证可以完美重现风格,我给他之后他后续内容癫的我都怀疑是我出问题了
回复

使用道具 举报

     
发表于 2025-1-30 10:24 | 显示全部楼层
在酒馆搞黄色的时候点开了显示思维过程,让人很难绷得住
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2025-3-4 18:16 , Processed in 0.141089 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表