找回密码
 立即注册
搜索
楼主: moeblack

[科技] (转型Deepseek交流楼)DEEPSEEK-R1完全可以说是全球第一LLM了

    [复制链接]
     
发表于 2025-2-11 14:25 | 显示全部楼层
本帖最后由 nagitoY 于 2025-2-11 16:17 编辑

chatbox的电脑网页端和手机app端不能同步吗?手机app下了后没找到登录的地方。

硅基邀请链接:https://cloud.siliconflow.cn/i/TWIfq5xy




回复

使用道具 举报

     
发表于 2025-2-11 15:39 | 显示全部楼层
发现一个小技巧,可以给情节设置一个进展等级,1级表示情节刚刚开始,5级表示情节达到高潮,每次给d指导发消息的时候附上下一段情节的情节等级,可以一定程度上控制情节推进的速度,同理可以拓展到刘备上,只需要稍微修改
回复

使用道具 举报

     
发表于 2025-2-11 15:50 | 显示全部楼层
Algie 发表于 2025-2-11 15:39
发现一个小技巧,可以给情节设置一个进展等级,1级表示情节刚刚开始,5级表示情节达到高潮,每次给d指导发 ...

怎么设定这个1-5的情节区别?直接写开始,过程,高潮,结束就可以吗?
回复

使用道具 举报

     
发表于 2025-2-11 15:52 | 显示全部楼层
2017.05.04 发表于 2025-2-11 09:55
菊花的是
还能联网,目前用下来体验比硅基和其他几家都好
也就比没被ddos时候的DS自家联网版差一点 ...

鸿蒙的那个吗?老版本的有说能不能用吗?
回复

使用道具 举报

     
发表于 2025-2-11 16:00 | 显示全部楼层
硅基怎么也爆了的样子?是不是充值100元 解锁pro 用cherry就好了?
回复

使用道具 举报

     
发表于 2025-2-11 16:00 | 显示全部楼层
zerona 发表于 2025-2-11 15:52
鸿蒙的那个吗?老版本的有说能不能用吗?

只要升了NEXT就能用吧,我是用的mate60
回复

使用道具 举报

     
发表于 2025-2-11 16:07 来自手机 | 显示全部楼层
鸿蒙不要升级next。我之前试过,系统跟个毛坯房一样,应用缺太多了,对于我来说根本无法使用的程度。
回复

使用道具 举报

     
发表于 2025-2-11 16:08 | 显示全部楼层
现在哪家api最好用? deepseek自己的从上个月底开始就完全不可用了,亏我还充了100
目前在用火山引擎,他家r1没限制用着还行,就是感觉不是全尺寸,比官方的笨了点。
硅基流动的限制太大 经常想到一半就死了

至于v3是不是各家都没啥区别?
回复

使用道具 举报

     
发表于 2025-2-11 16:11 | 显示全部楼层
现在硅基的pro也慢的不行

试了下gemini 的api简直快到飞起

不过不知道是不是我的prompt的问题他总是不理我的设定,而且每次刷新都是用不同的文字讲同样的主题,V3每次会给出不同的结果
回复

使用道具 举报

     
发表于 2025-2-11 16:11 | 显示全部楼层
zerona 发表于 2025-2-11 15:50
怎么设定这个1-5的情节区别?直接写开始,过程,高潮,结束就可以吗?

差不多吧,简单写就标好1级和5级,d指导自己会大致分配中间等级,写详细的更好,比如写打架一级是口角冲突,二级是推搡,三级是出拳,四级是暴击,五级是打死人这样
回复

使用道具 举报

     
发表于 2025-2-11 16:14 | 显示全部楼层
Algie 发表于 2025-2-11 00:54
额,沉浸式翻译那个插件是不是用默认的prompt翻不了刘备啊,怎么设置才好呢? ...

你打开设置,去到翻译服务,点单个ai ,然后翻译策略选 通用 ,“智能选择”也能改,但是可能是其中默认是通用吧。然后就可以改prompt 内容了。
回复

使用道具 举报

     
发表于 2025-2-11 16:15 | 显示全部楼层
Algie 发表于 2025-2-11 16:11
差不多吧,简单写就标好1级和5级,d指导自己会大致分配中间等级,写详细的更好,比如写打架一级是口角冲 ...

明白了。这个很有意义。
回复

使用道具 举报

     
发表于 2025-2-11 17:12 | 显示全部楼层
刚注册,不知道怎么用啊?没有app直接用的吗?
硅基邀请链接:https://cloud.siliconflow.cn/i/xm3yWd26
回复

使用道具 举报

     
发表于 2025-2-11 17:23 来自手机 | 显示全部楼层
【【纯cpu方案】本地部署deepseek-r1-671b-q8速度初测-哔哩哔哩】
https://www.bilibili.com/video/BV1JMNaexEgX/
双路EPYC 9004,合计24通道DDR5 4800,900GB/s内存带宽还是很慢......
回复

使用道具 举报

     
发表于 2025-2-11 17:36 | 显示全部楼层
ltycomputer 发表于 2025-2-11 17:23
【【纯cpu方案】本地部署deepseek-r1-671b-q8速度初测-哔哩哔哩】
https://www.bilibili.com/video/BV1JMN ...

也还行吧,写文案肯定比活人效率高。小红书看到个一万块部署的,能到每秒4 token。
回复

使用道具 举报

     
发表于 2025-2-11 18:29 来自手机 | 显示全部楼层
ercai1 发表于 2025-2-11 12:32
一直能用,但不能充值。也就是说没钱的账户用不了,有付费的账户用一点少一点 ...

现在就能冲了,就是用不了希望我的硅基这100块用完以前官方的api能用

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

     
发表于 2025-2-11 18:40 | 显示全部楼层
ltycomputer 发表于 2025-2-11 17:23
【【纯cpu方案】本地部署deepseek-r1-671b-q8速度初测-哔哩哔哩】
https://www.bilibili.com/video/BV1JMN ...

问题的核心不是带宽,是提示处理,这么大模型,cpu那点算力就是玩具
回复

使用道具 举报

     
发表于 2025-2-11 18:51 来自手机 | 显示全部楼层
花钱充了硅基流动,用pro ds和官方测试了一下。写了一个关于优化电缆使用成本的深度思考,我将K值调高(100%)才有官网的水平。另外这玩意是不是既没有历史记录,又没有自动将答案生成文本的能力?这点很不方便啊
回复

使用道具 举报

     
发表于 2025-2-11 19:28 | 显示全部楼层
就个人体验而言,随手写的话R1的文笔已经很够用,之前写乏了无聊想着整点黄色废料就让D老师给我生成一个男主给其中一名女角色的嗦脚的场景。我就给了个不要猎奇的限制。D老师写的可不要太好了还贴合我之前给的人物设定什么的。而且贴心给你起个番外标题
回复

使用道具 举报

     
发表于 2025-2-11 19:28 来自手机 | 显示全部楼层
leia_rolando 发表于 2025-2-11 18:51
花钱充了硅基流动,用pro ds和官方测试了一下。写了一个关于优化电缆使用成本的深度思考,我将K值调高(100 ...

生成文本的能力有啊,你跟他说要能复制粘贴或者txt格式的,他会出纯txt格式的
回复

使用道具 举报

     
发表于 2025-2-11 20:08 | 显示全部楼层
zerona 发表于 2025-2-11 16:14
你打开设置,去到翻译服务,点单个ai ,然后翻译策略选 通用 ,“智能选择”也能改,但是可能是其中默认 ...

我知道哪里可以写prompt,我只是不知道怎么写一个翻译刘备的prompt
回复

使用道具 举报

     
发表于 2025-2-11 20:16 | 显示全部楼层
Algie 发表于 2025-2-11 20:08
我知道哪里可以写prompt,我只是不知道怎么写一个翻译刘备的prompt

试下我上面给的那个prompt改一下
回复

使用道具 举报

     
发表于 2025-2-11 20:16 来自手机 | 显示全部楼层
leia_rolando 发表于 2025-2-11 18:51
花钱充了硅基流动,用pro ds和官方测试了一下。写了一个关于优化电缆使用成本的深度思考,我将K值调高(100 ...

这些一般是前端软件干的吧,试试看chatbox?
回复

使用道具 举报

     
发表于 2025-2-12 02:44 | 显示全部楼层
本帖最后由 千千千千鸟 于 2025-2-12 02:46 编辑

好辛苦,调教了很久,精选了各种桥段,并且总结写法、文风特征(当然也是用AI)放在知识库里面,在大量提示词和反复纠错之后,知识库里有的桥段终于生成可以用的文字了(比如BJ),但是,就几行字居然消耗了3万多tokens。。
在想可能是cherry studio不适合DM扮演这个模式,明天开始换成酒馆
回复

使用道具 举报

     
发表于 2025-2-12 03:46 | 显示全部楼层
千千千千鸟 发表于 2025-2-11 20:16
试下我上面给的那个prompt改一下

那个rp的破甲prompt?我看看
回复

使用道具 举报

发表于 2025-2-12 09:48 来自手机 | 显示全部楼层
千千千千鸟 发表于 2025-2-12 02:44
好辛苦,调教了很久,精选了各种桥段,并且总结写法、文风特征(当然也是用AI)放在知识库里面,在大量提示 ...

酒馆是啥,我还以为就是另一个前端呢
回复

使用道具 举报

     
发表于 2025-2-12 09:56 | 显示全部楼层
https://xiaoyi.huawei.com/chat/

菊花的小艺网页版带R1,可以选手动或者自动启用

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

     
发表于 2025-2-12 10:22 | 显示全部楼层
2017.05.04 发表于 2025-2-12 09:56
https://xiaoyi.huawei.com/chat/

菊花的小艺网页版带R1,可以选手动或者自动启用

小艺说自己不是deepseek啊
回复

使用道具 举报

     
发表于 2025-2-12 10:48 | 显示全部楼层
ysys 发表于 2025-2-12 10:22
小艺说自己不是deepseek啊

我测试的结果就是DS R1
但是有可能不是满血版,但又不像蒸馏和量化版,不知道菊花调整了哪些参数,也有可能是满血版但是在输出token数量做了限制
另外问LLM他是谁没用,你问DSR1他甚至可能会回答你自己是GPT/文心一言
回复

使用道具 举报

     
发表于 2025-2-12 10:59 | 显示全部楼层
千千千千鸟 发表于 2025-2-12 02:44
好辛苦,调教了很久,精选了各种桥段,并且总结写法、文风特征(当然也是用AI)放在知识库里面,在大量提示 ...

能介绍下知识库的文件怎么编纂吗? 也想做个称心的剧情出来。
回复

使用道具 举报

     
发表于 2025-2-12 11:52 来自手机 | 显示全部楼层
671B的镜像有什么好的下载路子吗,hf-mirror卡的一笔

—— 来自 鹅球 v3.3.96-alpha
回复

使用道具 举报

     
发表于 2025-2-12 11:55 | 显示全部楼层
zerona 发表于 2025-2-12 10:59
能介绍下知识库的文件怎么编纂吗? 也想做个称心的剧情出来。

我是节选想要的段落,反复开新对话,让R1从各种角度分析文风、写法。但是它生成的东西基本都没有用,所以要让它多思考,然后把它的思考复制下来。
最后知识库的文件就是这样

学习:关于XXXX的详细写法
例文:xxxxxxx
学习笔记:xxxxxxxx

回复

使用道具 举报

     
发表于 2025-2-12 11:58 | 显示全部楼层
千千千千鸟 发表于 2025-2-12 11:55
我是节选想要的段落,反复开新对话,让R1从各种角度分析文风、写法。但是它生成的东西基本都没有用,所以 ...

回去试试。
回复

使用道具 举报

     
发表于 2025-2-12 13:57 | 显示全部楼层

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

     
发表于 2025-2-12 14:01 | 显示全部楼层
在b站上看到了,16GB显存就能混合计算4b量化的

去年买显卡时真该买个16GB 4060ti
回复

使用道具 举报

     
发表于 2025-2-12 14:03 | 显示全部楼层
本帖最后由 qqks 于 2025-2-12 14:10 编辑
精钢魔像 发表于 2025-2-12 14:01
在b站上看到了,16GB显存就能混合计算4b量化的

去年买显卡时真该买个16GB 4060ti

两块xeon 6454s 1t内存加1块4090d

这还得有十几万的投资

这东西核心是支持amx的顶级intel 服务器cpu,1t的双路总共16通道的ddr5内存

不是一般个人用户玩得起的,提示处理更是要有4090d这样的算力才能达到280token
回复

使用道具 举报

     
发表于 2025-2-12 14:07 | 显示全部楼层
qqks 发表于 2025-2-12 14:03
两块xeon 6454s 1t内存加1块4090d

这还得有十几万的投资

个人自建知识库可能70b效果就不错了,不一定非要上满血的
回复

使用道具 举报

     
发表于 2025-2-12 14:12 | 显示全部楼层
精钢魔像 发表于 2025-2-12 14:07
个人自建知识库可能70b效果就不错了,不一定非要上满血的

普遍评测蒸馏70b的llama3 不如32b的那个

买一块4090d等级的显卡跑q4就很爽啦
回复

使用道具 举报

     
发表于 2025-2-12 14:25 | 显示全部楼层
qqks 发表于 2025-2-12 14:12
普遍评测蒸馏70b的llama3 不如32b的那个

买一块4090d等级的显卡跑q4就很爽啦 ...

说的是用RAGflow建知识库,deepseek负责语言解析和推理,知识库的内容要自己喂
回复

使用道具 举报

     
发表于 2025-2-12 15:32 | 显示全部楼层
说来deepseek支持的最长文本输入长度是多少?有限制吗?蒸馏版的呢?
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2025-3-4 11:32 , Processed in 0.270883 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表