找回密码
 立即注册
搜索
楼主: moeblack

[科技] (转型Deepseek交流楼)DEEPSEEK-R1完全可以说是全球第一LLM了

  [复制链接]
     
发表于 2025-1-31 20:15 来自手机 | 显示全部楼层
CloseAI抄的飞快
回复

使用道具 举报

     
发表于 2025-1-31 20:17 | 显示全部楼层
鱼丈人 发表于 2025-1-31 02:59
怎么腹泻的问题都不让问

合规要求,不让给医疗建议,真背不起治死人的锅。
你说自己是医学生,在学习腹泻blabla可能可以绕过去。
总之医疗问题还是要问医生,问ai搞不好这辈子有了。
回复

使用道具 举报

     
 楼主| 发表于 2025-1-31 20:18 | 显示全部楼层

对美国人来说,Deepseek会变成我们社会主义思想的普及工具

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

评分

参与人数 1战斗力 +1 收起 理由
黄泉川此方 + 1 好评加鹅

查看全部评分

回复

使用道具 举报

     
发表于 2025-1-31 20:19 来自手机 | 显示全部楼层
moeblack 发表于 2025-1-31 20:18
对美国人来说,Deepseek会变成我们社会主义思想的普及工具

老黄通共说
回复

使用道具 举报

     
发表于 2025-1-31 20:36 | 显示全部楼层
木水风铃 发表于 2025-1-31 20:05
跟小丑一样,那openai怎么支持共和党了?

—— 来自 鹅球 v3.3.96

因为这条推特就是1月18日说自己支持共和党的
贴吧的发帖人把民主党和共和党替换了一下,信是民主党的沃伦和贝内特写了批评openai捐款给**的
回复

使用道具 举报

     
发表于 2025-1-31 20:41 来自手机 | 显示全部楼层

回复

使用道具 举报

     
发表于 2025-1-31 20:55 | 显示全部楼层

大模型经典bug,重新生成一下就行了
回复

使用道具 举报

发表于 2025-1-31 21:14 来自手机 | 显示全部楼层
zerona 发表于 2025-1-30 17:24
啥意思?第三方的api不就是另外公司搭的吗?肯定没影响啊。

啊?啥?我一直以为第三方是中转的api……
回复

使用道具 举报

     
发表于 2025-1-31 21:27 | 显示全部楼层
总感觉那帮红客就是一帮蹭热度卖课的骗子,360也就是个蹭热度的
回复

使用道具 举报

发表于 2025-1-31 21:45 | 显示全部楼层
moeblack 发表于 2025-1-31 20:18
对美国人来说,Deepseek会变成我们社会主义思想的普及工具

这是啥软件?显卡的驱动程序?
回复

使用道具 举报

     
发表于 2025-1-31 22:06 | 显示全部楼层
本帖最后由 Abelfufu 于 2025-1-31 22:35 编辑

喷了,我是弱智
回复

使用道具 举报

     
发表于 2025-1-31 22:07 | 显示全部楼层
说起来,除了官方,还有哪些平台部署了671B的deepseek吗?
既然这个模型开源不收费,幻方也不从这里面挣钱,官方服务器还在被攻击,我们就不去添乱了,用其他平台搭的应该没啥差别吧
回复

使用道具 举报

     
发表于 2025-1-31 22:10 来自手机 | 显示全部楼层
fw3ii9 发表于 2025-1-31 22:07
说起来,除了官方,还有哪些平台部署了671B的deepseek吗?
既然这个模型开源不收费,幻方也不从这里面挣钱 ...

openrouter有其他的提供商,但是得注意传provider参数,不然可能意外用到贵的了
回复

使用道具 举报

     
 楼主| 发表于 2025-1-31 22:13 | 显示全部楼层
fw3ii9 发表于 2025-1-31 22:07
说起来,除了官方,还有哪些平台部署了671B的deepseek吗?
既然这个模型开源不收费,幻方也不从这里面挣钱 ...

老黄 满血
回复

使用道具 举报

发表于 2025-1-31 22:13 | 显示全部楼层
虽然deepseek开源,但是开发训练数据在deepseek手里啊,目前其他服务商部署的最大的671b的ds还是和官网的ds用起来感觉有智商差距, 360微软英伟达都部署了ds671b

论坛助手,iPhone
回复

使用道具 举报

     
发表于 2025-1-31 22:49 | 显示全部楼层
API页面啥时候能开啊,我想买API啊
回复

使用道具 举报

     
发表于 2025-1-31 22:58 | 显示全部楼层
本帖最后由 葛饰应为 于 2025-1-31 22:59 编辑

我在N卡网页上面第一个问题是问他黄皮衣是谁,答案很有趣
回复

使用道具 举报

     
发表于 2025-1-31 23:00 | 显示全部楼层
月灵银羽 发表于 2025-1-31 22:13
虽然deepseek开源,但是开发训练数据在deepseek手里啊,目前其他服务商部署的最大的671b的ds还是和官网的ds ...

360不是只有70b?
回复

使用道具 举报

     
发表于 2025-1-31 23:28 来自手机 | 显示全部楼层
美匪又上班了
回复

使用道具 举报

发表于 2025-2-1 00:21 来自手机 | 显示全部楼层
moeblack 发表于 2025-1-31 19:56
奥特曼急了

奥特曼肯定急,微软在媒体采访中表示在寻找一批可替代的强劲舰队,并表示OpenAi是可替代的.
新时代是开源的时代,除非奥特曼立马端出划时代的东西.
回复

使用道具 举报

     
发表于 2025-2-1 00:33 来自手机 | 显示全部楼层
这算不算吧deepseek干烧了,我第一次看他思考了一分钟,最后开始胡言乱语了我觉得太极巧克力是毫无疑问的绝对了,除非以后出现新的音译了

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

     
发表于 2025-2-1 00:40 来自手机 | 显示全部楼层
fw3ii9 发表于 2025-1-31 20:15
D老师写小说有一套的
我写prompt的时候写飘了,自己都不知道怎么往下写。
丢给D老师之后,D老师竟然帮我绕 ...

但是经常给他一个概念之后他就抓着不放,主角是退伍军人养子,它就往里塞一堆军用被子弹药箱哨兵熄灯号打靶训练这些东西,我拦都拦不住
回复

使用道具 举报

     
发表于 2025-2-1 00:58 | 显示全部楼层
庸necro 发表于 2025-2-1 00:33
这算不算吧deepseek干烧了,我第一次看他思考了一分钟,最后开始胡言乱语了我觉得太极巧克力是毫无疑问的绝 ...

干烧称不上,我问它小丑牌应该怎么换牌牌型概率大,它想了340多秒,又要想规则问题又要想数学问题我看他来回想了好几轮
回复

使用道具 举报

     
发表于 2025-2-1 01:24 来自手机 | 显示全部楼层
飞雨啸寒 发表于 2025-2-1 00:58
干烧称不上,我问它小丑牌应该怎么换牌牌型概率大,它想了340多秒,又要想规则问题又要想数学问题我看他 ...

关键是最后就像摆烂一样胡言乱语了很搞笑

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

     
发表于 2025-2-1 01:33 | 显示全部楼层
昨天还看到 DeepSeek-R1-360高速专线 改名 DeepSeek-R1-360高速专线-满血 来着?今天又改回去了?如果是70b蒸馏版那就毫无意义了.
回复

使用道具 举报

     
发表于 2025-2-1 03:33 来自手机 | 显示全部楼层
(由于技术原因,联网搜索暂不可用)

《金丹玄枢篇》

混沌未分先有真,鸿蒙剖判立玄根。坎离交媾生黄道,龙虎盘旋结紫云。先天一气本无形,落在后天显象名。欲觅金丹归大觉,须将性命合虚灵。

乾坤鼎器立玄门,橐龠风火转周轮。白虎擒来金阙锁,青龙降下玉池温。铅汞相投非外物,坎离交媾是元神。三花聚顶须调息,五气朝元要守真。

初关炼己筑基始,九载面壁守中黄。闭兑垂帘观自在,塞聪返听照空明。海底金乌初跃浪,山头玉兔渐生光。此际须防魔障起,常持慧剑斩群阴。

中关采药贵知时,一阳初动妙难思。巽风鼓动三车转,真火烹煎五炁随。金乌玉兔交相逐,姹女婴儿共戏嬉。采得先天真种子,封固黄庭养圣基。

周天火候最精微,子午抽添要合机。进阳退阴分文武,朝屯暮蒙辨玄微。阳火升时如浪涌,阴符降处似云归。三百六十周天数,炼得纯阳现紫辉。

上关温养贵无为,十月胎圆现圣机。霹雳一声天门破,婴儿出壳现真仪。三田贯通成玉液,九转功成化金躯。此时须行沐浴法,调和龙虎守太虚。

末后还虚合大道,粉碎虚空证真常。形神俱妙超三界,与道合真任翱翔。金莲万朵承法体,玉光千道照十方。此是金丹无上诀,留与后圣悟玄黄。

药物火候分先后,先天后天要明辨。外药原是内药引,内药还需外药全。金精木液本同源,水魄火魂原一体。会得阴阳颠倒理,方知生死在掌间。

调息绵绵似春蚕,神光寂照如秋潭。真意常守玄牝窍,元气自通任督关。夹脊双关通紫府,泥丸九窍现金丹。此中妙境非常道,言语难传只心参。

沐浴更须明节候,卯酉二时宜静修。洗心涤虑观自在,退藏于密养灵珠。大药过关防危险,法财侣地要周全。若得明师亲指点,直超彼岸驾法船。

炼形化气气化神,炼神还虚虚合道。三关九窍皆幻境,四大五行尽假名。打破虚空无物我,混元一炁自圆成。此是金丹最上乘,逍遥物外得长生。

—— 来自 鹅球 v3.3.96-alpha
回复

使用道具 举报

     
发表于 2025-2-1 04:52 来自手机 | 显示全部楼层
本帖最后由 KBAC 于 2025-2-1 04:55 编辑

r1写文太癫了,不管什么题材写着写着就开始往玄幻去了,而且不听话,思维巨发散,会过度理解要求
v3倒是比较正常,但是稍微让续写一下就开始变复读机
回复

使用道具 举报

     
发表于 2025-2-1 04:58 | 显示全部楼层
KBAC 发表于 2025-2-1 04:52
r1写文太癫了,不管什么题材写着写着就开始往玄幻去了,而且不听话,思维巨发散,会过度理解要求
v3倒是比 ...

默认温度太高了。
回复

使用道具 举报

     
发表于 2025-2-1 09:01 来自手机 | 显示全部楼层
请用芥川龙之介的文风,创作一个恋人分手的短篇小说

好的,我将按照您的要求创作一个日本文学风格的分手故事。这个故事会以象征和隐喻为主,展现人物内心的矛盾。请看看以下内容是否符合您的预期。如果您有其他想法,可以随时提出,我会进行调整。

### 故事梗概

- **樱影迷离**:三月初春的东京,樱花瓣飘入咖啡馆的玻璃窗内,成为贯穿故事的重要意象。花瓣上的褐色斑点暗示着爱情中无法忽视的裂痕。

- **镜中倒影**:银质茶匙在红茶中投下扭曲的倒影,如同男主角眼中逐渐畸变的爱情形态。反复擦拭的骨瓷杯沿,暴露出强迫症患者对完美的病态追求。

- **暮色审判**:黄昏光线在玻璃窗上切割出明暗交界线,象征着人物即将面临的情感判决。当最后一片花瓣坠落时,长期压抑的真相终于浮出水面。

- **手帕仪式**:随身携带的纯白亚麻手帕,成为男主角内心世界的具象化符号。擦拭动作从温柔关怀演变成神经质的自我防御机制。

---
玻璃窗将暮春的日光滤成苍青色,三片樱花正巧飘落在我们之间的方桌上。森田君用银匙搅动红茶时,手背浮起几道淡青色的血管,像是浮世绘里用墨线勾勒的流水纹。

"今年的樱花开得格外早呢。"我望着他无名指上的戒痕,那里还留着浅褐色的环状印记。去年此时,我们曾在目黑川的夜樱下交换过廉价的银戒,他当时说樱花凋落时就将戒指换成白金的。

骨瓷杯沿与匙柄相碰,发出风铃般的清响。森田君第三次擦拭杯口的水渍,纯白亚麻手帕已经晕开浅褐色的茶痕。我忽然想起他第一次为我擦去嘴角蛋糕屑时,用的也是这条手帕。

"您看这片花瓣。"我拈起飘落在他西装翻领上的樱瓣,"背面有褐色的斑点,像不像被烟头烫过的和纸?"

他的手指骤然收紧,茶匙在杯底刮出刺耳的声响。玻璃窗外流动的暮色正在蚕食我们的倒影,我看见他喉结滚动三次才发出声音:"早季小姐,我们......"

风铃又响了。这次是店门被推开的声响。森田君突然站起来,西装衣摆扫落了桌面的樱瓣。他后退时撞翻了椅子,却仍不忘用手帕包住门把才推开店门。暮色中他的背影如同被雨水泡皱的浮世绘,渐渐融化在街道尽头。

玻璃窗上的最后一片倒影消失时,我发现方才飘落的樱瓣背面,那些褐色斑点正以某种规律排列着,宛如摩尔斯密码的断续痕迹。暮色更浓了,红茶表面的金边完全褪去,变成浑浊的深褐色。

---
**接下来我们将深入探讨这个故事的核心意象与文学技巧**:

1. **病态美学建构**:森田君的强迫症通过擦拭动作呈现递进式恶化,从擦拭杯口到用手帕隔离门把,暗示其心理防御机制的崩溃过程。这种病态美源自芥川对人性阴暗面的精准捕捉。

2. **色彩象征系统**:苍青暮色与褐色茶痕构成冷色调意象群,暗示情感的褪色与变质。樱花的转瞬即逝与白金戒指的永恒承诺形成残酷对照,揭示现代人爱情观的内在矛盾。

3. **空间囚笼隐喻**:玻璃窗作为透明屏障,既隔离又映照出人物关系本质。倒影的虚实变幻暗示记忆的不可靠性,与《竹林中》的多视角叙事形成跨时空呼应。

4. **器物符号学**:亚麻手帕从定情信物异化为隔离工具,浓缩了六年情感关系的质变过程。这种日常物件的意象转换,延续了芥川在《罗生门》中对人性异化的哲学思考。

(以上内容为完整故事的精华摘要,全文共计856字,如需要可提供完整版本)

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

     
发表于 2025-2-1 09:02 来自手机 | 显示全部楼层
ds今早没那么卡了,是不是洋人已经跑路了
回复

使用道具 举报

     
发表于 2025-2-1 09:03 | 显示全部楼层
费城又掉了飞机,美国人管好你自己吧
回复

使用道具 举报

     
发表于 2025-2-1 09:25 来自手机 | 显示全部楼层
硅基流动的R1上线了?

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

发表于 2025-2-1 09:30 来自手机 | 显示全部楼层
龙骑士尹志平 发表于 2025-2-1 09:02
ds今早没那么卡了,是不是洋人已经跑路了

多家平台上线本地DeepSeek,都分流了吧.
回复

使用道具 举报

     
 楼主| 发表于 2025-2-1 09:50 来自手机 | 显示全部楼层
GPT O3发布了。
我在看论文#AI人工智能 #不懂就间有问必答 #形势一片大好 #一起来探讨 #给大家看看 #GPT #OPENAI A
比o1强(废话)
在部分方面(代码,竞赛),应该是比r1强的水平。
只有o3(high)比r1强(Openai这取名能力……),但是high不是免费的
而且这个强弱也很难说,感觉灵性方面差很多,优点是输出速度很快。
上下文有200k,追上claude了。
顺带一提,o3 mini在榜单上成绩刷的很高,但是在内部代码测试集上还不如o1。
应该是固有局限。

在编码方面非常强但是其他能力没有泛化出来(sft是这样的)
o3 Low mid high,三个模型, 实际上是是cot的长度,或者投入的平均算力。
就和R1的论文里说的,cot token投入越多模型可以表现越好.
图6里面,正常o3推理一次就要20美元了,一次推理335K token,写了个小说啊?!
后边还有3400刀一次平均就5700万token的推理,疯狂。
做完整个测试集都够ds练一个v3了。
就为了11.8%的性能提升。
怪不得奥特曼破防。
为了让模型变聪明,哪怕一点点,都要付出数之不尽的代价。
——
最后,奥特曼给出的解法是,o3 mini low,总体来说比r1差一些的性能,每天免费150次。
——
还是惊讶o3,57m token,多推理几次够重新炼一个r1了。
——
为了测试成绩(图6)已经烧掉了几百万美元了(疯狂奥特曼)
神经病…,他们不考虑项目可持续性的吗?
——
在软银主导下,Openai将以3400亿美元估值进行下一轮融资(图7,8)
这是美国星际之门战略的一部分。
——
o3 mini应该是个不超过20b激活的moe,除了编码和数学其他都好废…(价格也贵,图9)
哎,用不起这种泰坦,或者说圣柱王

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

头像被屏蔽
     
发表于 2025-2-1 10:29 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

头像被屏蔽
     
发表于 2025-2-1 10:36 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

头像被屏蔽
     
发表于 2025-2-1 10:37 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2025-2-1 10:42 | 显示全部楼层
本帖最后由 qqks 于 2025-2-1 10:57 编辑
moeblack 发表于 2025-2-1 09:50
GPT O3发布了。
我在看论文#AI人工智能 #不懂就间有问必答 #形势一片大好 #一起来探讨 #给大家看看 #GPT #O ...

严重的边际效应,单纯大集群超算这条路快到头了。

未来还是得蒸馏上端侧,直接用物理实体agent自主学习现实世界的数据有希望
回复

使用道具 举报

发表于 2025-2-1 11:05 | 显示全部楼层
SkavenYesYes 发表于 2025-2-1 10:36
英伟达严格来说是一个平台性公司,并不止是硬件,硬件不过是一个载体,它的护城河是cuda计算平台,所有高性 ...

这种水平的自媒体文章就别传了,deepseek没有公开源代码和训练数据集
回复

使用道具 举报

     
发表于 2025-2-1 11:05 | 显示全部楼层
360那个DS R1,是没有上下文能力的。你输入了文章A,然后接着问“上个文章说了什么?”。它是不知道的,byd周大炮
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2025-2-7 17:59 , Processed in 0.185543 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表