（转型Deepseek交流楼）DEEPSEEK-R1完全可以说是全球第一LLM了

2017.05.04 · 发表于 2025-1-31 20:15

CloseAI抄的飞快

fw3ii9 · 发表于 2025-1-31 20:17

鱼丈人发表于 2025-1-31 02:59
怎么腹泻的问题都不让问

合规要求，不让给医疗建议，真背不起治死人的锅。
你说自己是医学生，在学习腹泻blabla可能可以绕过去。
总之医疗问题还是要问医生，问ai搞不好这辈子有了。

moeblack · 发表于 2025-1-31 20:18

2017.05.04 发表于 2025-1-31 20:15
CloseAI抄的飞快

对美国人来说，Deepseek会变成我们社会主义思想的普及工具

2017.05.04 · 发表于 2025-1-31 20:19

moeblack 发表于 2025-1-31 20:18
对美国人来说，Deepseek会变成我们社会主义思想的普及工具

老黄通共说

周愚 · 发表于 2025-1-31 20:36

木水风铃发表于 2025-1-31 20:05
跟小丑一样，那openai怎么支持共和党了？

—— 来自鹅球 v3.3.96

因为这条推特就是1月18日说自己支持共和党的
贴吧的发帖人把民主党和共和党替换了一下，信是民主党的沃伦和贝内特写了批评openai捐款给**的

鱼丈人 · 发表于 2025-1-31 20:41

fw3ii9 · 发表于 2025-1-31 20:55

鱼丈人发表于 2025-1-31 20:41

大模型经典bug，重新生成一下就行了

jeokeo · 发表于 2025-1-31 21:14

zerona 发表于 2025-1-30 17:24
啥意思？第三方的api不就是另外公司搭的吗？肯定没影响啊。

啊？啥？我一直以为第三方是中转的api……

zyf199212 · 发表于 2025-1-31 21:27

总感觉那帮红客就是一帮蹭热度卖课的骗子，360也就是个蹭热度的

bcxzzz · 发表于 2025-1-31 21:45

moeblack 发表于 2025-1-31 20:18
对美国人来说，Deepseek会变成我们社会主义思想的普及工具

这是啥软件？显卡的驱动程序？

Abelfufu · 发表于 2025-1-31 22:06

本帖最后由 Abelfufu 于 2025-1-31 22:35 编辑

喷了，我是弱智

fw3ii9 · 发表于 2025-1-31 22:07

说起来，除了官方，还有哪些平台部署了671B的deepseek吗？
既然这个模型开源不收费，幻方也不从这里面挣钱，官方服务器还在被攻击，我们就不去添乱了，用其他平台搭的应该没啥差别吧

纱夜抱着榴弹炮 · 发表于 2025-1-31 22:10

fw3ii9 发表于 2025-1-31 22:07
说起来，除了官方，还有哪些平台部署了671B的deepseek吗？
既然这个模型开源不收费，幻方也不从这里面挣钱 ...

openrouter有其他的提供商，但是得注意传provider参数，不然可能意外用到贵的了

moeblack · 发表于 2025-1-31 22:13

fw3ii9 发表于 2025-1-31 22:07
说起来，除了官方，还有哪些平台部署了671B的deepseek吗？
既然这个模型开源不收费，幻方也不从这里面挣钱 ...

老黄满血

月灵银羽 · 发表于 2025-1-31 22:13

虽然deepseek开源，但是开发训练数据在deepseek手里啊，目前其他服务商部署的最大的671b的ds还是和官网的ds用起来感觉有智商差距， 360微软英伟达都部署了ds671b

论坛助手,iPhone

tansapple · 发表于 2025-1-31 22:49

API页面啥时候能开啊，我想买API啊

葛饰应为 · 发表于 2025-1-31 22:58

本帖最后由葛饰应为于 2025-1-31 22:59 编辑

我在N卡网页上面第一个问题是问他黄皮衣是谁，答案很有趣

山形石雄 · 发表于 2025-1-31 23:00

月灵银羽发表于 2025-1-31 22:13
虽然deepseek开源，但是开发训练数据在deepseek手里啊，目前其他服务商部署的最大的671b的ds还是和官网的ds ...

360不是只有70b？

yangkaim4 · 发表于 2025-1-31 23:28

美匪又上班了

Alce79 · 发表于 2025-2-1 00:21

moeblack 发表于 2025-1-31 19:56
奥特曼急了

奥特曼肯定急，微软在媒体采访中表示在寻找一批可替代的强劲舰队，并表示OpenAi是可替代的.
新时代是开源的时代，除非奥特曼立马端出划时代的东西.

庸necro · 发表于 2025-2-1 00:33

这算不算吧deepseek干烧了，我第一次看他思考了一分钟，最后开始胡言乱语了

我觉得太极巧克力是毫无疑问的绝对了，除非以后出现新的音译了

—— 来自鹅球 v3.3.96

KioShiMa · 发表于 2025-2-1 00:40

fw3ii9 发表于 2025-1-31 20:15
D老师写小说有一套的
我写prompt的时候写飘了，自己都不知道怎么往下写。
丢给D老师之后，D老师竟然帮我绕 ...

但是经常给他一个概念之后他就抓着不放，主角是退伍军人养子，它就往里塞一堆军用被子弹药箱哨兵熄灯号打靶训练这些东西，我拦都拦不住

飞雨啸寒 · 发表于 2025-2-1 00:58

庸necro 发表于 2025-2-1 00:33
这算不算吧deepseek干烧了，我第一次看他思考了一分钟，最后开始胡言乱语了我觉得太极巧克力是毫无疑问的绝 ...

干烧称不上，我问它小丑牌应该怎么换牌牌型概率大，它想了340多秒，又要想规则问题又要想数学问题我看他来回想了好几轮

庸necro · 发表于 2025-2-1 01:24

飞雨啸寒发表于 2025-2-1 00:58
干烧称不上，我问它小丑牌应该怎么换牌牌型概率大，它想了340多秒，又要想规则问题又要想数学问题我看他 ...

关键是最后就像摆烂一样胡言乱语了很搞笑

—— 来自鹅球 v3.3.96

泰坦失足 · 发表于 2025-2-1 01:33

昨天还看到 DeepSeek-R1-360高速专线改名 DeepSeek-R1-360高速专线-满血来着？今天又改回去了？如果是70b蒸馏版那就毫无意义了.

jojohunter · 发表于 2025-2-1 03:33

（由于技术原因，联网搜索暂不可用）

《金丹玄枢篇》

混沌未分先有真，鸿蒙剖判立玄根。坎离交媾生黄道，龙虎盘旋结紫云。先天一气本无形，落在后天显象名。欲觅金丹归大觉，须将性命合虚灵。

乾坤鼎器立玄门，橐龠风火转周轮。白虎擒来金阙锁，青龙降下玉池温。铅汞相投非外物，坎离交媾是元神。三花聚顶须调息，五气朝元要守真。

初关炼己筑基始，九载面壁守中黄。闭兑垂帘观自在，塞聪返听照空明。海底金乌初跃浪，山头玉兔渐生光。此际须防魔障起，常持慧剑斩群阴。

中关采药贵知时，一阳初动妙难思。巽风鼓动三车转，真火烹煎五炁随。金乌玉兔交相逐，姹女婴儿共戏嬉。采得先天真种子，封固黄庭养圣基。

周天火候最精微，子午抽添要合机。进阳退阴分文武，朝屯暮蒙辨玄微。阳火升时如浪涌，阴符降处似云归。三百六十周天数，炼得纯阳现紫辉。

上关温养贵无为，十月胎圆现圣机。霹雳一声天门破，婴儿出壳现真仪。三田贯通成玉液，九转功成化金躯。此时须行沐浴法，调和龙虎守太虚。

末后还虚合大道，粉碎虚空证真常。形神俱妙超三界，与道合真任翱翔。金莲万朵承法体，玉光千道照十方。此是金丹无上诀，留与后圣悟玄黄。

药物火候分先后，先天后天要明辨。外药原是内药引，内药还需外药全。金精木液本同源，水魄火魂原一体。会得阴阳颠倒理，方知生死在掌间。

调息绵绵似春蚕，神光寂照如秋潭。真意常守玄牝窍，元气自通任督关。夹脊双关通紫府，泥丸九窍现金丹。此中妙境非常道，言语难传只心参。

沐浴更须明节候，卯酉二时宜静修。洗心涤虑观自在，退藏于密养灵珠。大药过关防危险，法财侣地要周全。若得明师亲指点，直超彼岸驾法船。

炼形化气气化神，炼神还虚虚合道。三关九窍皆幻境，四大五行尽假名。打破虚空无物我，混元一炁自圆成。此是金丹最上乘，逍遥物外得长生。

—— 来自鹅球 v3.3.96-alpha

KBAC · 发表于 2025-2-1 04:52

本帖最后由 KBAC 于 2025-2-1 04:55 编辑

r1写文太癫了，不管什么题材写着写着就开始往玄幻去了，而且不听话，思维巨发散，会过度理解要求
v3倒是比较正常，但是稍微让续写一下就开始变复读机

LeonsCat · 发表于 2025-2-1 04:58

KBAC 发表于 2025-2-1 04:52
r1写文太癫了，不管什么题材写着写着就开始往玄幻去了，而且不听话，思维巨发散，会过度理解要求
v3倒是比 ...

默认温度太高了。

加藤樱 · 发表于 2025-2-1 09:01

请用芥川龙之介的文风，创作一个恋人分手的短篇小说

好的，我将按照您的要求创作一个日本文学风格的分手故事。这个故事会以象征和隐喻为主，展现人物内心的矛盾。请看看以下内容是否符合您的预期。如果您有其他想法，可以随时提出，我会进行调整。

### 故事梗概

- **樱影迷离**：三月初春的东京，樱花瓣飘入咖啡馆的玻璃窗内，成为贯穿故事的重要意象。花瓣上的褐色斑点暗示着爱情中无法忽视的裂痕。

- **镜中倒影**：银质茶匙在红茶中投下扭曲的倒影，如同男主角眼中逐渐畸变的爱情形态。反复擦拭的骨瓷杯沿，暴露出强迫症患者对完美的病态追求。

- **暮色审判**：黄昏光线在玻璃窗上切割出明暗交界线，象征着人物即将面临的情感判决。当最后一片花瓣坠落时，长期压抑的真相终于浮出水面。

- **手帕仪式**：随身携带的纯白亚麻手帕，成为男主角内心世界的具象化符号。擦拭动作从温柔关怀演变成神经质的自我防御机制。

---
玻璃窗将暮春的日光滤成苍青色，三片樱花正巧飘落在我们之间的方桌上。森田君用银匙搅动红茶时，手背浮起几道淡青色的血管，像是浮世绘里用墨线勾勒的流水纹。

"今年的樱花开得格外早呢。"我望着他无名指上的戒痕，那里还留着浅褐色的环状印记。去年此时，我们曾在目黑川的夜樱下交换过廉价的银戒，他当时说樱花凋落时就将戒指换成白金的。

骨瓷杯沿与匙柄相碰，发出风铃般的清响。森田君第三次擦拭杯口的水渍，纯白亚麻手帕已经晕开浅褐色的茶痕。我忽然想起他第一次为我擦去嘴角蛋糕屑时，用的也是这条手帕。

"您看这片花瓣。"我拈起飘落在他西装翻领上的樱瓣，"背面有褐色的斑点，像不像被烟头烫过的和纸？"

他的手指骤然收紧，茶匙在杯底刮出刺耳的声响。玻璃窗外流动的暮色正在蚕食我们的倒影，我看见他喉结滚动三次才发出声音："早季小姐，我们......"

风铃又响了。这次是店门被推开的声响。森田君突然站起来，西装衣摆扫落了桌面的樱瓣。他后退时撞翻了椅子，却仍不忘用手帕包住门把才推开店门。暮色中他的背影如同被雨水泡皱的浮世绘，渐渐融化在街道尽头。

玻璃窗上的最后一片倒影消失时，我发现方才飘落的樱瓣背面，那些褐色斑点正以某种规律排列着，宛如摩尔斯密码的断续痕迹。暮色更浓了，红茶表面的金边完全褪去，变成浑浊的深褐色。

---
**接下来我们将深入探讨这个故事的核心意象与文学技巧**：

1. **病态美学建构**：森田君的强迫症通过擦拭动作呈现递进式恶化，从擦拭杯口到用手帕隔离门把，暗示其心理防御机制的崩溃过程。这种病态美源自芥川对人性阴暗面的精准捕捉。

2. **色彩象征系统**：苍青暮色与褐色茶痕构成冷色调意象群，暗示情感的褪色与变质。樱花的转瞬即逝与白金戒指的永恒承诺形成残酷对照，揭示现代人爱情观的内在矛盾。

3. **空间囚笼隐喻**：玻璃窗作为透明屏障，既隔离又映照出人物关系本质。倒影的虚实变幻暗示记忆的不可靠性，与《竹林中》的多视角叙事形成跨时空呼应。

4. **器物符号学**：亚麻手帕从定情信物异化为隔离工具，浓缩了六年情感关系的质变过程。这种日常物件的意象转换，延续了芥川在《罗生门》中对人性异化的哲学思考。

（以上内容为完整故事的精华摘要，全文共计856字，如需要可提供完整版本）

—— 来自鹅球 v3.3.96

龙骑士尹志平 · 发表于 2025-2-1 09:02

ds今早没那么卡了，是不是洋人已经跑路了

黄泉川此方 · 发表于 2025-2-1 09:03

费城又掉了飞机，美国人管好你自己吧

qratosones1337 · 发表于 2025-2-1 09:25

硅基流动的R1上线了？

—— 来自鹅球 v3.3.96

Alce79 · 发表于 2025-2-1 09:30

龙骑士尹志平发表于 2025-2-1 09:02
ds今早没那么卡了，是不是洋人已经跑路了

多家平台上线本地DeepSeek，都分流了吧.

moeblack · 发表于 2025-2-1 09:50

GPT O3发布了。
我在看论文#AI人工智能 #不懂就间有问必答 #形势一片大好 #一起来探讨 #给大家看看 #GPT #OPENAI A
比o1强（废话）
在部分方面（代码，竞赛），应该是比r1强的水平。
只有o3（high）比r1强（Openai这取名能力……），但是high不是免费的
而且这个强弱也很难说，感觉灵性方面差很多，优点是输出速度很快。
上下文有200k，追上claude了。
顺带一提，o3 mini在榜单上成绩刷的很高，但是在内部代码测试集上还不如o1。
应该是固有局限。

在编码方面非常强但是其他能力没有泛化出来（sft是这样的）
o3 Low mid high，三个模型, 实际上是是cot的长度，或者投入的平均算力。
就和R1的论文里说的，cot token投入越多模型可以表现越好.
图6里面，正常o3推理一次就要20美元了，一次推理335K token，写了个小说啊？！
后边还有3400刀一次平均就5700万token的推理，疯狂。
做完整个测试集都够ds练一个v3了。
就为了11.8%的性能提升。
怪不得奥特曼破防。
为了让模型变聪明，哪怕一点点，都要付出数之不尽的代价。
——
最后，奥特曼给出的解法是，o3 mini low，总体来说比r1差一些的性能，每天免费150次。
——
还是惊讶o3，57m token，多推理几次够重新炼一个r1了。
——
为了测试成绩（图6）已经烧掉了几百万美元了（疯狂奥特曼）
神经病…，他们不考虑项目可持续性的吗？
——
在软银主导下，Openai将以3400亿美元估值进行下一轮融资（图7,8）
这是美国星际之门战略的一部分。
——
o3 mini应该是个不超过20b激活的moe，除了编码和数学其他都好废…（价格也贵，图9）
哎，用不起这种泰坦，或者说圣柱王

—— 来自鹅球 v3.3.96

SkavenYesYes · 发表于 2025-2-1 10:29

提示: 作者被禁止或删除内容自动屏蔽

SkavenYesYes · 发表于 2025-2-1 10:36

提示: 作者被禁止或删除内容自动屏蔽

SkavenYesYes · 发表于 2025-2-1 10:37

提示: 作者被禁止或删除内容自动屏蔽

qqks · 发表于 2025-2-1 10:42

本帖最后由 qqks 于 2025-2-1 10:57 编辑

moeblack 发表于 2025-2-1 09:50
GPT O3发布了。
我在看论文#AI人工智能 #不懂就间有问必答 #形势一片大好 #一起来探讨 #给大家看看 #GPT #O ...

严重的边际效应，单纯大集群超算这条路快到头了。

未来还是得蒸馏上端侧，直接用物理实体agent自主学习现实世界的数据有希望

dazzle · 发表于 2025-2-1 11:05

SkavenYesYes 发表于 2025-2-1 10:36
英伟达严格来说是一个平台性公司，并不止是硬件，硬件不过是一个载体，它的护城河是cuda计算平台，所有高性 ...

这种水平的自媒体文章就别传了，deepseek没有公开源代码和训练数据集

泰坦失足 · 发表于 2025-2-1 11:05

360那个DS R1，是没有上下文能力的。你输入了文章A，然后接着问“上个文章说了什么？”。它是不知道的，byd周大炮

		自动登录	找回密码
密码			立即注册

[科技] （转型Deepseek交流楼）DEEPSEEK-R1完全可以说是全球第一LLM了

本帖子中包含更多资源

评分

SkavenYesYes SkavenYesYes 当前离线禁止发言精华 \| 战斗力鹅 \| 回帖 0 注册时间 2024-1-24 头像被屏蔽	发表于 2025-2-1 10:29 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报

SkavenYesYes SkavenYesYes 当前离线禁止发言精华 \| 战斗力鹅 \| 回帖 0 注册时间 2024-1-24 头像被屏蔽	发表于 2025-2-1 10:36 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报

SkavenYesYes SkavenYesYes 当前离线禁止发言精华 \| 战斗力鹅 \| 回帖 0 注册时间 2024-1-24 头像被屏蔽	发表于 2025-2-1 10:37 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报