（转型Deepseek交流楼）DEEPSEEK-R1完全可以说是全球第一LLM了

jf8350143 · 发表于 2025-2-9 05:01

魔灵高达发表于 2025-2-9 02:21
一直在用那个超长的prompt，今天看了下魂+AI区，才发现原来硅基流动的R1随便一句话就能破甲，震惊了，cherr ...

酒馆我至今没弄明白怎么屏蔽r1的思考过程，每次300token的回复就在那看他说自己的思考流程了……

—— 来自 S1Fun

魔灵高达 · 发表于 2025-2-9 08:18

jf8350143 发表于 2025-2-9 05:01
酒馆我至今没弄明白怎么屏蔽r1的思考过程，每次300token的回复就在那看他说自己的思考流程了……

—— ...

啊？酒馆我这里从最开始就不显示思考过程。。。
用的是硅基流动的proR1

黄泉川此方 · 发表于 2025-2-9 08:21

魔灵高达发表于 2025-2-9 02:21
一直在用那个超长的prompt，今天看了下魂+AI区，才发现原来硅基流动的R1随便一句话就能破甲，震惊了，cherr ...

这甲薄的提示词都不用打马了

魔灵高达 · 发表于 2025-2-9 08:52

黄泉川此方发表于 2025-2-9 08:21
这甲薄的提示词都不用打马了

没错，居然就这么简单，r1出来第一天我本地部署的模型甲都比这个厚10倍

希德尼娅 · 发表于 2025-2-9 09:03

魔灵高达发表于 2025-2-9 08:52
没错，居然就这么简单，r1出来第一天我本地部署的模型甲都比这个厚10倍

试了下不行啊直接被拒了

脸宽 · 发表于 2025-2-9 10:22

有没有调用api支持云端数据同步的，chatbox不能备份太麻烦了。
nextchat用deepseek倒是能调用，硅基流动我api填上去用不了。

魔灵高达 · 发表于 2025-2-9 10:26

希德尼娅发表于 2025-2-9 09:03
试了下不行啊直接被拒了

确实我试了下单独使用也不行，昨天我主要是配合智能体里面那个《文章风格提示词逆向工程》来用的，发了几篇刘备上去分析的头头是道

粉色猛男 · 发表于 2025-2-9 13:29

纯小白问一下，入门部署API的话要怎么搞,你们说的什么酒馆什么ollma都是啥
看了下B站视频,是不是下个cherry studio然后把API丢进去充钱就能用了?cherry studio的能用联网搜索吗

限制怎么解除？画图那些AI也能通过付费API来实现云AI吗

美坂汐里 · 发表于 2025-2-9 13:45

本帖最后由美坂汐里于 2025-2-9 13:51 编辑

粉色猛男发表于 2025-2-9 13:29
纯小白问一下，入门部署API的话要怎么搞,你们说的什么酒馆什么ollma都是啥
看了下B站视频,是不是下个cherry ...

酒馆是指silly tavern，去谷歌搜下，应该是第一个就有官网，那里说的很详细了。这玩意实际上是个前端，就像服务员把菜单传到后厨，然后把菜从后厨端给你一样。

Chromo · 发表于 2025-2-9 13:58

jf8350143 发表于 2025-2-9 05:01
酒馆我至今没弄明白怎么屏蔽r1的思考过程，每次300token的回复就在那看他说自己的思考流程了……

—— ...

酒馆的staging分支有解析推理过程的提交了，不过还没有合到release里。

Fingest · 发表于 2025-2-9 14:02

有个问题，酒馆大部分时候自动屏蔽了思考链（偶尔还是会出来），但为什么会秒出结果？没有思考链的时候还是r1吗？

zerona · 发表于 2025-2-9 16:09

想用cherry studio 的知识库才知道，知识库需要能推理的模型才可以。各位是用了什么模型能保证可以用这个知识库的？

中二骚年 · 发表于 2025-2-9 16:35

本帖最后由中二骚年于 2025-2-9 16:37 编辑

zerona 发表于 2025-2-9 16:09
想用cherry studio 的知识库才知道，知识库需要能推理的模型才可以。各位是用了什么模型能保证可以用这个知 ...

r1就是推理模型啊，知识库的模型就用它推荐的bge-m3 免费

—— 来自鹅球 v3.3.96

中二骚年 · 发表于 2025-2-9 16:36

脸宽发表于 2025-2-9 10:22
有没有调用api支持云端数据同步的，chatbox不能备份太麻烦了。
nextchat用deepseek倒是能调用，硅基流动我a ...

Cherry Studio可以webDav同步，但是没有手机端

—— 来自鹅球 v3.3.96

魔灵高达 · 发表于 2025-2-9 16:37

zerona 发表于 2025-2-9 16:09
想用cherry studio 的知识库才知道，知识库需要能推理的模型才可以。各位是用了什么模型能保证可以用这个知 ...

你说的是那个嵌入模型吗？我用的是硅基流动的Pro/BAAI/bge-m3
不过，貌似cheryy studio每一个知识库只能添加6个文件来着？我一口气上传了20章小说，但是引用的时候只有顺序打乱的6章

starfucks · 发表于 2025-2-9 16:41

我在想大模型部署有没有可能也发展出分布式部署？比如把671B拆成20块，分别部署到20台32G内存普通机器上，通过集群内网络通信实现模型推理，成本应该能降低很多吧来自: iPhone客户端

御坂MKII · 发表于 2025-2-9 16:50

starfucks 发表于 2025-2-9 16:41
我在想大模型部署有没有可能也发展出分布式部署？比如把671B拆成20块，分别部署到20台32G内存普通机器上， ...

现在就可以，可以说几个 macmini 是速度和价格平衡下的一个最优选择了

Azcarlo · 发表于 2025-2-9 17:17

starfucks 发表于 2025-2-9 16:41
我在想大模型部署有没有可能也发展出分布式部署？比如把671B拆成20块，分别部署到20台32G内存普通机器上， ...

恭喜你独立发现了分布式推理

这个技术甚至在LLM出来前就有了

zerona · 发表于 2025-2-9 17:38

魔灵高达发表于 2025-2-9 16:37
你说的是那个嵌入模型吗？我用的是硅基流动的Pro/BAAI/bge-m3
不过，貌似cheryy studio每一个知识库只能 ...

它要每个文件没限制，你直接扔一个文件里呢？

羊寢 · 发表于 2025-2-9 17:56

魔灵高达发表于 2025-2-9 08:52
没错，居然就这么简单，r1出来第一天我本地部署的模型甲都比这个厚10倍

真•纯小白问一下，这类破甲咒语要怎么用，酒馆可用吗？

魔灵高达 · 发表于 2025-2-9 18:22

zerona 发表于 2025-2-9 17:38
它要每个文件没限制，你直接扔一个文件里呢？

有限制，文本量太大会读不出来，只能读前面一部分

moeblack · 发表于 2025-2-9 18:32

jf8350143 发表于 2025-2-9 05:01
酒馆我至今没弄明白怎么屏蔽r1的思考过程，每次300token的回复就在那看他说自己的思考流程了……

—— ...

默认就是不输出的吧

zerona · 发表于 2025-2-9 19:27

魔灵高达发表于 2025-2-9 18:22
有限制，文本量太大会读不出来，只能读前面一部分

大概能多少汉字啊。这个文字量也是会影响ai的反应吧。

名居守 · 发表于 2025-2-9 20:32

写了个设定大纲，扔给D老师让总结出其中一个机构的职能，结果直接把所有设定大纲里的内容全归给这个机构，纠错加骂了好几次，还是不会分开看
最后还是得自己提取内容出来，结果还是自己动手根本不需要D老师了

血压部分包括但不限于
把这个机构不该知道的事默认为这个机构知道所有
机构个人私底下做的事当成机构全员准则
机构里某些人自愿行为被弄成了具有奖惩机制的能虚空把人抓回来坐小黑屋
机构一定是黑暗无比的，好的一面是为了掩盖机构天怒人怨的，什么？用户没说要这种结构？我说用户说了就是说了。

约翰里德 · 发表于 2025-2-9 20:35

名居守发表于 2025-2-9 20:32
写了个设定大纲，扔给D老师让总结出其中一个机构的职能，结果直接把所有设定大纲里的内容全归给这个机构， ...

我的背景他能把阴谋论先塞北约再塞华约再塞老墨。怎么劝都停不住，从小卒到总统，全都是大坏蛋。
反正人类坏坏的，ai好好滴。

约翰里德 · 发表于 2025-2-10 09:00

这个傻逼ai，我跟他今天没完了

笛诺斯 · 发表于 2025-2-10 09:21

官网现在是不是针对IP有内置排队CD

我只要过很久不用，下一次问就会吐个回复赏给我，以为是渠道通畅了赶紧问，马上服务器繁忙×20+提问次数频繁冷静一下吧×N

lyt777 · 发表于 2025-2-10 09:38

最近有点奇怪，PC上调用API随便就能破甲，手机上用chatbox调用相同的api和prompt它每次都能给我拒绝，这到底是为什么………………

披头破落户 · 发表于 2025-2-10 10:05

lyt777 发表于 2025-2-10 09:38
最近有点奇怪，PC上调用API随便就能破甲，手机上用chatbox调用相同的api和prompt它每次都能给我拒绝，这到 ...

刷新几次或者改一下问题再发一遍

—— 来自鹅球 v3.3.96

lkjasd · 发表于 2025-2-10 10:07

家里电脑4070S+12700，想本地部署搭建自己知识库自娱自乐，这个配置跑快吗？我B站搜说要显存很高，而且各种本地部署五花八门，有没有课代表大佬推荐一个好的本地部署教程~

约翰里德 · 发表于 2025-2-10 10:08

lkjasd 发表于 2025-2-10 10:07
家里电脑4070S+12700，想本地部署搭建自己知识库自娱自乐，这个配置跑快吗？我B站搜说要显存很高，而且各种 ...

部署了也就是个玩具，api都胡说八道，本地部署的基本是痴呆了

lkjasd · 发表于 2025-2-10 10:11

约翰里德发表于 2025-2-10 10:08
部署了也就是个玩具，api都胡说八道，本地部署的基本是痴呆了

我自己喂投资料，也痴呆吗

约翰里德 · 发表于 2025-2-10 10:12

lkjasd 发表于 2025-2-10 10:11
我自己喂投资料，也痴呆吗

你本地部署算力也小啊。
光堆资料算力小了还是智障-你看我上面发的那张图，api也是智障就是了

海底铁锚 · 发表于 2025-2-10 10:16

笛诺斯发表于 2025-2-10 09:21
官网现在是不是针对IP有内置排队CD我只要过很久不用，下一次问就会吐个回复赏给我，以为是渠道通畅了赶紧问 ...

有机制，优先给长时间没使用过的用户服务。

魔灵高达 · 发表于 2025-2-10 10:20

名居守发表于 2025-2-9 20:32
写了个设定大纲，扔给D老师让总结出其中一个机构的职能，结果直接把所有设定大纲里的内容全归给这个机构， ...

AI有时候生成的东西完全乱七八糟，但是思考过程却很有逻辑有点用。

魔灵高达 · 发表于 2025-2-10 10:21

问了几个AI这个问题都没效果，最搞的是KIMI1.5，它直接思考无限循环“我没有找到有点沮丧，但是我想到还可以搜索.....”

S1论坛（saraba1st）有个帖子，是发在外野/卓明谷版块的，具体内容是一篇原创文章，文章的内容是楼主“我”骗同事自己是杀人犯。发布时间在2020年之前

魔灵高达 · 发表于 2025-2-10 10:26

zerona 发表于 2025-2-9 19:27
大概能多少汉字啊。这个文字量也是会影响ai的反应吧。

大概十万个字？
以及cherry studio的知识库会编一堆资料序号出来，很奇怪的。我明明就放了一个文件进知识库，而且总共就一两千字的玩意，它引用给我来个资料0-3，我都懵逼了

对羟基笨甲酸 · 发表于 2025-2-10 10:26

lkjasd 发表于 2025-2-10 10:07
家里电脑4070S+12700，想本地部署搭建自己知识库自娱自乐，这个配置跑快吗？我B站搜说要显存很高，而且各种 ...

我的配置稍微高一点，14900，4070ts
实测70b跑不动，运行32b速度还行，但真的很傻，即使资料正确推理过程正确也输出不了满血版那种看起来聪明的答案，意义不大了

加藤樱 · 发表于 2025-2-10 10:28

请用傲娇萝莉的口气锐评chatgpt的收费标准

（双手叉腰跺脚）哼！区区一个AI聊天机器人还敢收20刀一个月？！（气鼓鼓戳屏幕）明明就是一堆代码！一堆代码！稍微聊几句就要抢小蛋糕钱的吗？笨蛋GPT根本不懂人类钱包会痛痛啦！（突然扭捏）呜…虽然回答问题很快…但、但才不是夸你呢！（超大声）把冰淇淋车都吓跑的价格绝对有问题！至少要附赠会喵喵叫的皮肤嘛！（小声嘟囔）或者…每天多送人家三次撒娇提问额度什么的…（突然脸红）才、才没有想多用你呢！笨蛋！！（转身逃跑前喊）收费标准要打五折！打五折听到没啦！╭(╯^╰)╮

—— 来自鹅球 v3.3.96

洛拉斯 · 发表于 2025-2-10 11:07

提示: 作者被禁止或删除内容自动屏蔽

		自动登录	找回密码
密码			立即注册

洛拉斯洛拉斯当前离线禁止发言精华 \| 战斗力鹅 \| 回帖 0 注册时间 2019-8-21 头像被屏蔽	发表于 2025-2-10 11:07 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报

[科技] （转型Deepseek交流楼）DEEPSEEK-R1完全可以说是全球第一LLM了