西方自找的没落（转型DEEPSEEK讨论楼

kira1988 · 发表于 2025-1-24 11:28

试了下deepseek直接翻车了
问乐奈跟喵梦有什么相似之处，结果答案直接把乐奈答成睦嗞咪了
感觉搜一下都能答对吧

披头破落户 · 发表于 2025-1-24 11:43

机吉斯卡发表于 2025-1-24 11:31
艹，现在是个水群都在传SEEK写的小黄温

就是那个静香的那个

私我看看

—— 来自鹅球 v3.3.96

披头破落户 · 发表于 2025-1-24 11:45

kira1988 发表于 2025-1-24 11:28
试了下deepseek直接翻车了
问乐奈跟喵梦有什么相似之处，结果答案直接把乐奈答成睦嗞咪了
感觉搜一下都能答 ...

要点深度思考和联网搜索才行，我试了试给出的结果基本正确

—— 来自鹅球 v3.3.96

白色的120 · 发表于 2025-1-24 11:52

deepseek玩酒馆还行，主要便宜还速度快，网页版写材料的话有限制

—— 来自鹅球 v3.3.96

clarkgao · 发表于 2025-1-24 11:57

白色的120 发表于 2025-1-24 11:52
deepseek玩酒馆还行，主要便宜还速度快，网页版写材料的话有限制

—— 来自鹅球 v3.3.96 ...

但文字窗口太小了。不知道有没有人搞个专门的部署，开到128K，做一些acg和刘备相关的专门后训练，让大家玩玩。

Realplayer · 发表于 2025-1-24 11:57

overflowal 发表于 2024-12-27 17:55
单卡是放不下了，真想跑可以尝试放到内存用CPU跑，应该速度是能用的。因为是MoE架构 ...

单机版16/32+128g够么？内存要加到多少嘞？

Xerxes_2 · 发表于 2025-1-24 12:13

Mac 用户笑了，14B 跑起来毫无压力
买个顶配应该能跑 70B

—— 来自 Google Pixel 9 Pro, Android 15, 鹅球 v3.3.95-debug

overflowal · 发表于 2025-1-24 12:14

deepseek的做的那几个蒸馏不是r1的缩小版啊，需要说下，ollama竟然把他们放R1同系列的东西宣传

—— 来自鹅球 v3.3.96

cube · 发表于 2025-1-24 12:33

昨天试了下新模型的归纳能力。

只能说牛逼。

cube · 发表于 2025-1-24 12:34

kira1988 发表于 2025-1-24 11:28
试了下deepseek直接翻车了
问乐奈跟喵梦有什么相似之处，结果答案直接把乐奈答成睦嗞咪了
感觉搜一下都能答 ...

要点开深度思考那个按钮，默认模型是老模型，水平是不如Kimi，豆包这些的。

mp5 · 发表于 2025-1-24 12:34

本地部署了一个Q4量化32b的r1, 已经爽到飞起

跟closeai免费帐号的水平差不多, 长推理更是完爆

cube · 发表于 2025-1-24 12:37

kira1988 发表于 2025-1-24 11:28
试了下deepseek直接翻车了
问乐奈跟喵梦有什么相似之处，结果答案直接把乐奈答成睦嗞咪了
感觉搜一下都能答 ...

这是我问到的答案，我觉得还行了，甚至结尾还卖了个萌。

乐奈（通常指《BanG Dream!》中的千叶乐奈）和喵梦（可能指《公主连结》中的凯露或其他萌系角色）的相似之处主要体现在以下几个方面，但需注意角色具体出处可能影响对比：

---

### 1. **慵懒随性的性格**
- **乐奈**：自由散漫，经常突然消失或睡觉，对甜食毫无抵抗力，说话直率。
- **喵梦**（以凯露为例）：表面傲娇但内心柔软，偶尔露出懒散的一面，对美食（尤其是鲷鱼烧）极度执着。
- **相似点**：随性、孩子气的行为模式，容易因喜好（如食物）被吸引。

---

### 2. **猫系元素**
- **乐奈**：绰号“流浪猫”，造型有白**耳发饰，性格像猫一样难以捉摸。
- **喵梦**：名字含“喵”，可能搭配猫耳装饰（如凯露的黑**耳发箍），或具备猫娘属性。
- **相似点**：以“猫”为设计核心，突出萌系反差感。

---

### 3. **萌系反差设定**
- **乐奈**：外表软萌但吉他实力顶尖，反差感强烈。
- **喵梦**：若指凯露，则是傲娇毒舌与脆弱内心的反差；若为其他角色，可能具备外冷内热或能力与外表不符的特点。
- **相似点**：通过性格/能力的反差制造萌点。

---

### 4. **团队中的“不稳定因素”**
- **乐奈**：在乐队MyGO!!!!!中经常任性行动，却无形中推动剧情发展。
- **喵梦**：若为凯露，在“美食殿堂”公会中常吐槽队友，成为搞笑担当。
- **相似点**：在团队中扮演打破常规的角色，增强故事戏剧性。

---

### 5. **二次元文化符号化**
- 两者均符合ACG领域对“萌属性”的提炼：乐奈的“无口猫系”、喵梦的“傲娇猫娘”，均是标签化设计的体现，易于观众记忆和传播。

---

### 差异提示：
- 若“喵梦”指向其他角色（如虚拟主播或原创角色），相似点可能集中在猫系形象、性格萌点等方面，需具体分析。

如果需要更精准的对比，建议补充角色出处信息哦！ (๑>◡<๑)

cube · 发表于 2025-1-24 12:48

至于说多模态，实际上还是受限与DS公司自身的规模和算力。

但是反过来说，一并不是说非多模态的模型没有价值，反而DS目前的路子是部分跳出了之前生成式大模型自己内循环导致性能劣化的局限性，二多模态大模型现在到底该往哪里发展我怕炼这些玩意的自己都说不准，三要是DS能用现在的成本搞出实用的多模态，那某些人就不是急不急的问题了。

SkavenYesYes · 发表于 2025-1-24 12:51

提示: 作者被禁止或删除内容自动屏蔽

coldhot3 · 发表于 2025-1-24 12:54

alixsander 发表于 2025-1-24 10:38
这个多半假的，怎么可能有人不认识DeepSeek。llama2时代开源社群就都知道DS了 ...

这是翻译失真了，关键是out of no where。不是不认识deepseek，是deepseek一个从我们都不知道的地方（暗讽文明之外的野蛮之地）出来的公司，把我们爆杀。

overflowal · 发表于 2025-1-24 12:55

cube 发表于 2025-1-24 12:48
至于说多模态，实际上还是受限与DS公司自身的规模和算力。

但是反过来说，一并不是说非多模态的模型没有价 ...

集中精力搞text2text是对的，api可能95%的用量都是在纯text任务

—— 来自鹅球 v3.3.96

coldhot3 · 发表于 2025-1-24 12:55

本帖最后由 coldhot3 于 2025-1-24 12:59 编辑

cube 发表于 2025-1-24 12:48
至于说多模态，实际上还是受限与DS公司自身的规模和算力。

但是反过来说，一并不是说非多模态的模型没有价 ...

那有没有接口啊，我希望deepseek能读懂word，输出word。
不过我可以问问deepseek，让他自己写一个。

cube · 发表于 2025-1-24 12:58

coldhot3 发表于 2025-1-24 12:55
那有没有接口啊，我希望deepseek能读懂word，输出word。

可以申请API的。

因为用API写作不会受到官网的内容审查限制，现在SEEK写的小黄文满天飞

，全球不分语言玩得不亦乐乎（中国手机号注册有500万免费token）。

参考这个帖子 https://bbs.saraba1st.com/2b/thread-2243830-3-1.html

外挂 · 发表于 2025-1-24 13:01

提示: 作者被禁止或删除内容自动屏蔽

juluck000 · 发表于 2025-1-24 13:02

dpr1太黄暴了，不亏是国人整出来的模型

外挂 · 发表于 2025-1-24 13:02

提示: 作者被禁止或删除内容自动屏蔽

小野賢章 · 发表于 2025-1-24 14:03

风夏发表于 2025-1-24 10:38
请教个问题, ollama跑这些蒸馏qwen的模型的话, 后面这几个参数是啥意思?

推荐 q4_K_M
https://github.com/ggerganov/lla ... sioncomment-6351796

Allowed quantization types:
2  or  Q4_0 :  3.50G, +0.2499 ppl @ 7B - small, very high quality loss - legacy, prefer using Q3_K_M
3  or  Q4_1 :  3.90G, +0.1846 ppl @ 7B - small, substantial quality loss - legacy, prefer using Q3_K_L
8  or  Q5_0 :  4.30G, +0.0796 ppl @ 7B - medium, balanced quality - legacy, prefer using Q4_K_M
9  or  Q5_1 :  4.70G, +0.0415 ppl @ 7B - medium, low quality loss - legacy, prefer using Q5_K_M
  10  or  Q2_K :  2.67G, +0.8698 ppl @ 7B - smallest, extreme quality loss - not recommended
  12  or  Q3_K : alias for Q3_K_M
  11  or  Q3_K_S :  2.75G, +0.5505 ppl @ 7B - very small, very high quality loss
  12  or  Q3_K_M :  3.06G, +0.2437 ppl @ 7B - very small, very high quality loss
  13  or  Q3_K_L :  3.35G, +0.1803 ppl @ 7B - small, substantial quality loss
  15  or  Q4_K : alias for Q4_K_M
  14  or  Q4_K_S :  3.56G, +0.1149 ppl @ 7B - small, significant quality loss
  15  or  Q4_K_M :  3.80G, +0.0535 ppl @ 7B - medium, balanced quality - *recommended*
  17  or  Q5_K : alias for Q5_K_M
  16  or  Q5_K_S :  4.33G, +0.0353 ppl @ 7B - large, low quality loss - *recommended*
  17  or  Q5_K_M :  4.45G, +0.0142 ppl @ 7B - large, very low quality loss - *recommended*
  18  or  Q6_K :  5.15G, +0.0044 ppl @ 7B - very large, extremely low quality loss
7  or  Q8_0 :  6.70G, +0.0004 ppl @ 7B - very large, extremely low quality loss - not recommended
1  or  F16 : 13.00G             @ 7B - extremely large, virtually no quality loss - not recommended
0  or  F32 : 26.00G             @ 7B - absolutely huge, lossless - not recommended

alixsander · 发表于 2025-1-24 14:06

本帖最后由 alixsander 于 2025-1-24 14:08 编辑

coldhot3 发表于 2025-1-24 12:54
这是翻译失真了，关键是out of no where。不是不认识deepseek，是deepseek一个从我们都不知道的地方（暗 ...

我知道teamblind这个人的原文，不是翻译的问题，DS怎么可能算out of nowhere. 一年前就人人都认识了。DS V2.5的时候就开始说中国的策略和temu一样，便宜量大

Bronzecraft · 发表于 2025-1-24 14:26

我试着问了下《暴风城打工实录》最新章是多少，给的答案还是错的

gawain · 发表于 2025-1-24 14:33

cube 发表于 2025-1-24 12:58
可以申请API的。

因为用API写作不会受到官网的内容审查限制，现在SEEK写的小黄文满天飞，全球不分语言玩 ...

为啥我用api还是会被ban nsfw的提示词

论坛助手,iPhone

qratosones1337 · 发表于 2025-1-24 14:43

clarkgao 发表于 2025-1-24 11:57
但文字窗口太小了。不知道有没有人搞个专门的部署，开到128K，做一些acg和刘备相关的专门后训练，让大家 ...

如果不需要长文本的话，现在的API对刘备的支持已经极好了

cube · 发表于 2025-1-24 14:47

gawain 发表于 2025-1-24 14:33
为啥我用api还是会被ban nsfw的提示词

论坛助手,iPhone

用python本地部署一下，调用模型用deepseek-reasoner即R1。

overflowal · 发表于 2025-1-24 14:58

clarkgao 发表于 2025-1-24 11:57
但文字窗口太小了。不知道有没有人搞个专门的部署，开到128K，做一些acg和刘备相关的专门后训练，让大家 ...

openrouter上deepseek有一些供应商有开放128K窗口，但是价格比deepseek官方贵几倍。
国内看看硅基流动会不会上了，之前说春节前上deepseek v3，还没影子

marquez · 发表于 2025-1-24 15:00

提示: 作者被禁止或删除内容自动屏蔽

买码！注册！ · 发表于 2025-1-24 15:06

coldhot3 发表于 2025-1-24 12:54
这是翻译失真了，关键是out of no where。不是不认识deepseek，是deepseek一个从我们都不知道的地方（暗 ...

"out of nowhere"意思是“突然，出乎意料”

如果换个说法"out of blue"可别解读出“来自跟蓝营/蓝州有关系的地方”

流缨 · 发表于 2025-1-24 15:14

Bronzecraft 发表于 2025-1-24 14:26
我试着问了下《暴风城打工实录》最新章是多少，给的答案还是错的

这个估计没法对，独阅读就没有公域流量，搜索不到的，只能爬盗版站的结果

流缨 · 发表于 2025-1-24 15:21

本帖最后由流缨于 2025-1-24 15:25 编辑

mp5 发表于 2025-1-24 12:34
本地部署了一个Q4量化32b的r1, 已经爽到飞起
跟closeai免费帐号的水平差不多, 长推理更是完爆 ...

求问一下硬件环境，手头现在只有一块4090，32B应该没压力吧？

tioit · 发表于 2025-1-24 15:36

deepseek 搜索还是有点问题
昨天我搜 “鸿蒙智行旗下的车，内存大小分别是多少？”
回答的数据不大对。

还得不断训练

億万千 · 发表于 2025-1-24 15:40

闭源大模型现在哪家nb，和这些开源的比呢

lilisipis · 发表于 2025-1-24 15:46

现在哪家模型可以生成虚拟管人，就是把管人聊天风格音色人设输进去生成个虚拟管人和我聊天的

rubus · 发表于 2025-1-24 15:52

马车夫发表于 2024-12-27 17:41
美帝这几年甚至是十多年前万物转码的后遗症，认识不少学机械EE的纷纷抛弃制造业，纯coding又不是什么要智商 ...

国内头部高校现在也是万物转码，反而中等水平的学校还保留了一些传统的研究方向（虽然很大程度并不是自愿的。这帮人就是每次看到疑似风头一窝蜂全去做

断片集 · 发表于 2025-1-24 15:52

lilisipis 发表于 2025-1-24 15:46
现在哪家模型可以生成虚拟管人，就是把管人聊天风格音色人设输进去生成个虚拟管人和我聊天的 ...

这就是llm和tts两者结合的事了，llm的话，只是模仿风格普通聊天的话大概都能，deepseek算是比较有性价比的了
声音的话你可以去b站之类的地方搜下cosyvoice2，效果已经很不错了，基本接近真人水平

用silly tavern把这俩整合起来大概就有你想要的效果了

alixsander · 发表于 2025-1-24 15:53

本帖最后由 alixsander 于 2025-1-24 15:56 编辑

億万千发表于 2025-1-24 15:40
闭源大模型现在哪家nb，和这些开源的比呢

OAI咯

o3 > o1 pro > DS R1≈KIMI1.5 ≈o1 ≈ o3 mini> Gemini 2 flash thinking(这个1M context window, 60K ouput len)

非reasoning的SOTA基模，都差不多吧，都接近4o了。Sonnet在代码和创意写作上强一些。

多模态/全模态（语音-语音端到端）
gemini 2 flash多模态挺强的，感觉和4o多模态差不多，但是能听得懂中文不能说中文。豆包只能语音双工没有视觉能力，但是中文水平是最好的

Agentic
最实用的Google DeepResearch. OAI之前只有一个能执行周期任务的，今天发布了一个operator，200刀能帮你点浏览器，但是基模用的也只是4o。只能说智能体是25年的主要方向，未来可期吧

看月之暗面，幻方，千问什么时候开源智能体，全模态。可能也就落后OAI一到三个月。

ysys · 发表于 2025-1-24 16:23

新人马甲2 发表于 2025-1-24 08:59
昨晚慕名去试了试deepseek，有被震惊到，不仅可以回答相当复杂的专业翻译问题，而且经得起反复追问，能给出 ...

不不不，胡说还是有的

正常情况你也不会啥问题都去看它的解释

只不过能给分析过程看起来确实感觉挺好

andychen · 发表于 2025-1-24 16:40

AI我们能赶上一点都不奇怪，人才储备上基本和对岸是分庭抗礼的
一些你懂的因素也能被绕开，像这回deepseek这样。从这角度看国内商用大公司搞的模型可能看点反而少一些

		自动登录	找回密码
密码			立即注册

SkavenYesYes SkavenYesYes 当前离线禁止发言精华 \| 战斗力鹅 \| 回帖 0 注册时间 2024-1-24 头像被屏蔽	发表于 2025-1-24 12:51 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报

外挂外挂当前离线禁止发言精华 \| 战斗力鹅 \| 回帖 0 注册时间 2016-11-14 头像被屏蔽	发表于 2025-1-24 13:01 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报

外挂外挂当前离线禁止发言精华 \| 战斗力鹅 \| 回帖 0 注册时间 2016-11-14 头像被屏蔽	发表于 2025-1-24 13:02 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报

marquez marquez 当前离线禁止发言精华 \| 战斗力鹅 \| 回帖 0 注册时间 2016-1-12 头像被屏蔽	发表于 2025-1-24 15:00 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报

[科技] 西方自找的没落（转型DEEPSEEK讨论楼