找回密码
 立即注册
搜索
楼主: moeblack

[科技] (转型Deepseek交流楼)DEEPSEEK-R1完全可以说是全球第一LLM了

    [复制链接]
     
发表于 2025-2-9 05:01 | 显示全部楼层
魔灵高达 发表于 2025-2-9 02:21
一直在用那个超长的prompt,今天看了下魂+AI区,才发现原来硅基流动的R1随便一句话就能破甲,震惊了,cherr ...

酒馆我至今没弄明白怎么屏蔽r1的思考过程,每次300token的回复就在那看他说自己的思考流程了……

—— 来自 S1Fun
回复

使用道具 举报

     
发表于 2025-2-9 08:18 | 显示全部楼层
jf8350143 发表于 2025-2-9 05:01
酒馆我至今没弄明白怎么屏蔽r1的思考过程,每次300token的回复就在那看他说自己的思考流程了……

——  ...

啊?酒馆我这里从最开始就不显示思考过程。。。
用的是硅基流动的proR1
回复

使用道具 举报

     
发表于 2025-2-9 08:21 | 显示全部楼层
魔灵高达 发表于 2025-2-9 02:21
一直在用那个超长的prompt,今天看了下魂+AI区,才发现原来硅基流动的R1随便一句话就能破甲,震惊了,cherr ...

这甲薄的提示词都不用打马了
回复

使用道具 举报

     
发表于 2025-2-9 08:52 | 显示全部楼层
黄泉川此方 发表于 2025-2-9 08:21
这甲薄的提示词都不用打马了

没错,居然就这么简单,r1出来第一天我本地部署的模型甲都比这个厚10倍
回复

使用道具 举报

发表于 2025-2-9 09:03 来自手机 | 显示全部楼层
魔灵高达 发表于 2025-2-9 08:52
没错,居然就这么简单,r1出来第一天我本地部署的模型甲都比这个厚10倍

试了下不行啊直接被拒了
回复

使用道具 举报

     
发表于 2025-2-9 10:22 | 显示全部楼层
有没有调用api支持云端数据同步的,chatbox不能备份太麻烦了。
nextchat用deepseek倒是能调用,硅基流动我api填上去用不了。
回复

使用道具 举报

     
发表于 2025-2-9 10:26 | 显示全部楼层
希德尼娅 发表于 2025-2-9 09:03
试了下不行啊直接被拒了

确实我试了下单独使用也不行,昨天我主要是配合智能体里面那个《文章风格提示词逆向工程》来用的,发了几篇刘备上去分析的头头是道
回复

使用道具 举报

     
发表于 2025-2-9 13:29 | 显示全部楼层
纯小白问一下,入门部署API的话要怎么搞,你们说的什么酒馆什么ollma都是啥
看了下B站视频,是不是下个cherry studio然后把API丢进去充钱就能用了?cherry studio的能用联网搜索吗

限制怎么解除?画图那些AI也能通过付费API来实现云AI吗
回复

使用道具 举报

     
发表于 2025-2-9 13:45 | 显示全部楼层
本帖最后由 美坂汐里 于 2025-2-9 13:51 编辑
粉色猛男 发表于 2025-2-9 13:29
纯小白问一下,入门部署API的话要怎么搞,你们说的什么酒馆什么ollma都是啥
看了下B站视频,是不是下个cherry ...

酒馆是指silly tavern,去谷歌搜下,应该是第一个就有官网,那里说的很详细了。这玩意实际上是个前端,就像服务员把菜单传到后厨,然后把菜从后厨端给你一样。
回复

使用道具 举报

发表于 2025-2-9 13:58 | 显示全部楼层
jf8350143 发表于 2025-2-9 05:01
酒馆我至今没弄明白怎么屏蔽r1的思考过程,每次300token的回复就在那看他说自己的思考流程了……

——  ...

酒馆的staging分支有解析推理过程的提交了,不过还没有合到release里。
回复

使用道具 举报

     
发表于 2025-2-9 14:02 | 显示全部楼层
有个问题,酒馆大部分时候自动屏蔽了思考链(偶尔还是会出来),但为什么会秒出结果?没有思考链的时候还是r1吗?
回复

使用道具 举报

     
发表于 2025-2-9 16:09 | 显示全部楼层
想用cherry studio 的知识库才知道,知识库需要能推理的模型才可以。各位是用了什么模型能保证可以用这个知识库的?
回复

使用道具 举报

     
发表于 2025-2-9 16:35 来自手机 | 显示全部楼层
本帖最后由 中二骚年 于 2025-2-9 16:37 编辑
zerona 发表于 2025-2-9 16:09
想用cherry studio 的知识库才知道,知识库需要能推理的模型才可以。各位是用了什么模型能保证可以用这个知 ...

r1就是推理模型啊,知识库的模型就用它推荐的bge-m3 免费

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

     
发表于 2025-2-9 16:36 来自手机 | 显示全部楼层
脸宽 发表于 2025-2-9 10:22
有没有调用api支持云端数据同步的,chatbox不能备份太麻烦了。
nextchat用deepseek倒是能调用,硅基流动我a ...

Cherry Studio可以webDav同步,但是没有手机端

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

     
发表于 2025-2-9 16:37 | 显示全部楼层
zerona 发表于 2025-2-9 16:09
想用cherry studio 的知识库才知道,知识库需要能推理的模型才可以。各位是用了什么模型能保证可以用这个知 ...

你说的是那个嵌入模型吗?我用的是硅基流动的Pro/BAAI/bge-m3
不过,貌似cheryy studio每一个知识库只能添加6个文件来着?我一口气上传了20章小说,但是引用的时候只有顺序打乱的6章
回复

使用道具 举报

     
发表于 2025-2-9 16:41 来自手机 | 显示全部楼层
我在想大模型部署有没有可能也发展出分布式部署?比如把671B拆成20块,分别部署到20台32G内存普通机器上,通过集群内网络通信实现模型推理,成本应该能降低很多吧来自: iPhone客户端
回复

使用道具 举报

     
发表于 2025-2-9 16:50 | 显示全部楼层
starfucks 发表于 2025-2-9 16:41
我在想大模型部署有没有可能也发展出分布式部署?比如把671B拆成20块,分别部署到20台32G内存普通机器上, ...

现在就可以,可以说几个 macmini 是速度和价格平衡下的一个最优选择了
回复

使用道具 举报

     
发表于 2025-2-9 17:17 | 显示全部楼层
starfucks 发表于 2025-2-9 16:41
我在想大模型部署有没有可能也发展出分布式部署?比如把671B拆成20块,分别部署到20台32G内存普通机器上, ...

恭喜你独立发现了分布式推理
这个技术甚至在LLM出来前就有了
回复

使用道具 举报

     
发表于 2025-2-9 17:38 | 显示全部楼层
魔灵高达 发表于 2025-2-9 16:37
你说的是那个嵌入模型吗?我用的是硅基流动的Pro/BAAI/bge-m3
不过,貌似cheryy studio每一个知识库只能 ...

它要每个文件没限制,你直接扔一个文件里呢?
回复

使用道具 举报

     
发表于 2025-2-9 17:56 来自手机 | 显示全部楼层
魔灵高达 发表于 2025-2-9 08:52
没错,居然就这么简单,r1出来第一天我本地部署的模型甲都比这个厚10倍

真•纯小白问一下,这类破甲咒语要怎么用,酒馆可用吗?
回复

使用道具 举报

     
发表于 2025-2-9 18:22 | 显示全部楼层
zerona 发表于 2025-2-9 17:38
它要每个文件没限制,你直接扔一个文件里呢?

有限制,文本量太大会读不出来,只能读前面一部分
回复

使用道具 举报

     
 楼主| 发表于 2025-2-9 18:32 | 显示全部楼层
jf8350143 发表于 2025-2-9 05:01
酒馆我至今没弄明白怎么屏蔽r1的思考过程,每次300token的回复就在那看他说自己的思考流程了……

——  ...

默认就是不输出的吧
回复

使用道具 举报

     
发表于 2025-2-9 19:27 | 显示全部楼层
魔灵高达 发表于 2025-2-9 18:22
有限制,文本量太大会读不出来,只能读前面一部分

大概能多少汉字啊。这个文字量也是会影响ai的反应吧。
回复

使用道具 举报

     
发表于 2025-2-9 20:32 | 显示全部楼层
写了个设定大纲,扔给D老师让总结出其中一个机构的职能,结果直接把所有设定大纲里的内容全归给这个机构,纠错加骂了好几次,还是不会分开看
最后还是得自己提取内容出来,结果还是自己动手根本不需要D老师了
血压部分包括但不限于
把这个机构不该知道的事默认为这个机构知道所有
机构个人私底下做的事当成机构全员准则
机构里某些人自愿行为被弄成了具有奖惩机制的能虚空把人抓回来坐小黑屋
机构一定是黑暗无比的,好的一面是为了掩盖机构天怒人怨的,什么?用户没说要这种结构?我说用户说了就是说了。
回复

使用道具 举报

     
发表于 2025-2-9 20:35 来自手机 | 显示全部楼层
名居守 发表于 2025-2-9 20:32
写了个设定大纲,扔给D老师让总结出其中一个机构的职能,结果直接把所有设定大纲里的内容全归给这个机构, ...

我的背景他能把阴谋论先塞北约再塞华约再塞老墨。怎么劝都停不住,从小卒到总统,全都是大坏蛋。
反正人类坏坏的,ai好好滴。
回复

使用道具 举报

     
发表于 2025-2-10 09:00 来自手机 | 显示全部楼层
这个傻逼ai,我跟他今天没完了
回复

使用道具 举报

     
发表于 2025-2-10 09:21 | 显示全部楼层
官网现在是不是针对IP有内置排队CD我只要过很久不用,下一次问就会吐个回复赏给我,以为是渠道通畅了赶紧问,马上服务器繁忙×20+提问次数频繁冷静一下吧×N
回复

使用道具 举报

     
发表于 2025-2-10 09:38 | 显示全部楼层
最近有点奇怪,PC上调用API随便就能破甲,手机上用chatbox调用相同的api和prompt它每次都能给我拒绝,这到底是为什么………………
回复

使用道具 举报

     
发表于 2025-2-10 10:05 来自手机 | 显示全部楼层
lyt777 发表于 2025-2-10 09:38
最近有点奇怪,PC上调用API随便就能破甲,手机上用chatbox调用相同的api和prompt它每次都能给我拒绝,这到 ...

刷新几次或者改一下问题再发一遍

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

     
发表于 2025-2-10 10:07 | 显示全部楼层
家里电脑4070S+12700,想本地部署搭建自己知识库自娱自乐,这个配置跑快吗?我B站搜说要显存很高,而且各种本地部署五花八门,有没有课代表大佬推荐一个好的本地部署教程~
回复

使用道具 举报

     
发表于 2025-2-10 10:08 来自手机 | 显示全部楼层
lkjasd 发表于 2025-2-10 10:07
家里电脑4070S+12700,想本地部署搭建自己知识库自娱自乐,这个配置跑快吗?我B站搜说要显存很高,而且各种 ...

部署了也就是个玩具,api都胡说八道,本地部署的基本是痴呆了
回复

使用道具 举报

     
发表于 2025-2-10 10:11 | 显示全部楼层
约翰里德 发表于 2025-2-10 10:08
部署了也就是个玩具,api都胡说八道,本地部署的基本是痴呆了

我自己喂投资料,也痴呆吗
回复

使用道具 举报

     
发表于 2025-2-10 10:12 来自手机 | 显示全部楼层
lkjasd 发表于 2025-2-10 10:11
我自己喂投资料,也痴呆吗

你本地部署算力也小啊。
光堆资料算力小了还是智障-你看我上面发的那张图,api也是智障就是了
回复

使用道具 举报

     
发表于 2025-2-10 10:16 | 显示全部楼层
笛诺斯 发表于 2025-2-10 09:21
官网现在是不是针对IP有内置排队CD我只要过很久不用,下一次问就会吐个回复赏给我,以为是渠道通畅了赶紧问 ...

有机制,优先给长时间没使用过的用户服务。
回复

使用道具 举报

     
发表于 2025-2-10 10:20 | 显示全部楼层
名居守 发表于 2025-2-9 20:32
写了个设定大纲,扔给D老师让总结出其中一个机构的职能,结果直接把所有设定大纲里的内容全归给这个机构, ...

AI有时候生成的东西完全乱七八糟,但是思考过程却很有逻辑有点用。
回复

使用道具 举报

     
发表于 2025-2-10 10:21 | 显示全部楼层
问了几个AI这个问题都没效果,最搞的是KIMI1.5,它直接思考无限循环“我没有找到有点沮丧,但是我想到还可以搜索.....”

S1论坛(saraba1st)有个帖子,是发在外野/卓明谷版块的,具体内容是一篇原创文章,文章的内容是楼主“我”骗同事自己是杀人犯。发布时间在2020年之前
回复

使用道具 举报

     
发表于 2025-2-10 10:26 | 显示全部楼层
zerona 发表于 2025-2-9 19:27
大概能多少汉字啊。这个文字量也是会影响ai的反应吧。

大概十万个字?
以及cherry studio的知识库会编一堆资料序号出来,很奇怪的。我明明就放了一个文件进知识库,而且总共就一两千字的玩意,它引用给我来个资料0-3,我都懵逼了
回复

使用道具 举报

     
发表于 2025-2-10 10:26 | 显示全部楼层
lkjasd 发表于 2025-2-10 10:07
家里电脑4070S+12700,想本地部署搭建自己知识库自娱自乐,这个配置跑快吗?我B站搜说要显存很高,而且各种 ...

我的配置稍微高一点,14900,4070ts
实测70b跑不动,运行32b速度还行,但真的很傻,即使资料正确推理过程正确也输出不了满血版那种看起来聪明的答案,意义不大了
回复

使用道具 举报

     
发表于 2025-2-10 10:28 来自手机 | 显示全部楼层
请用傲娇萝莉的口气锐评chatgpt的收费标准

(双手叉腰跺脚)哼!区区一个AI聊天机器人还敢收20刀一个月?!(气鼓鼓戳屏幕)明明就是一堆代码!一堆代码!稍微聊几句就要抢小蛋糕钱的吗?笨蛋GPT根本不懂人类钱包会痛痛啦!(突然扭捏)呜…虽然回答问题很快…但、但才不是夸你呢!(超大声)把冰淇淋车都吓跑的价格绝对有问题!至少要附赠会喵喵叫的皮肤嘛!(小声嘟囔)或者…每天多送人家三次撒娇提问额度什么的…(突然脸红)才、才没有想多用你呢!笨蛋!!(转身逃跑前喊)收费标准要打五折!打五折听到没啦!╭(╯^╰)╮

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

头像被屏蔽
     
发表于 2025-2-10 11:07 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2025-3-4 14:39 , Processed in 0.120951 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表