找回密码
 立即注册
搜索
查看: 278681|回复: 2063

[科技] (转型Deepseek交流楼)DEEPSEEK-R1完全可以说是全球第一LLM了

    [复制链接]
     
发表于 2025-1-21 13:24 来自手机 | 显示全部楼层 |阅读模式
本帖最后由 moeblack 于 2025-1-26 15:58 编辑


livebench出分全球第二,价格消耗和o1已经是两个数量级了。
MIT协议的开源模型,671b参数量,后面看有没有人卷api价格
这种数量级的成本差异上来说,这差的分完全无所谓。
今天早上试了一早上,效果无敌。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

评分

参与人数 1战斗力 +1 收起 理由
偽物 + 1 好评加鹅

查看全部评分

回复

使用道具 举报

     
发表于 2025-1-21 13:32 | 显示全部楼层
那这个模型下有哪些应用可以给我们用呢?推荐一下
回复

使用道具 举报

     
发表于 2025-1-21 13:38 来自手机 | 显示全部楼层
星星狐 发表于 2025-1-21 13:32 那这个模型下有哪些应用可以给我们用呢?推荐一下

官网文档里有,实用集成。来自: iPhone客户端
回复

使用道具 举报

     
发表于 2025-1-21 13:43 | 显示全部楼层
星星狐 发表于 2025-1-21 13:32
那这个模型下有哪些应用可以给我们用呢?推荐一下

https://chat.deepseek.com/
点深度思考用的就是R1

评分

参与人数 1战斗力 +1 收起 理由
faithlifer + 1 好评加鹅

查看全部评分

回复

使用道具 举报

     
发表于 2025-1-21 13:44 | 显示全部楼层
可用、参数量不太大、算力需求不太高
这三条已经在踹closeai的屁股了
希望对面那条路能彻底证伪
回复

使用道具 举报

     
发表于 2025-1-21 13:48 | 显示全部楼层
试了下R1,有点意思
回复

使用道具 举报

     
发表于 2025-1-21 13:50 来自手机 | 显示全部楼层
和v3有什么使用方向上的区别吗

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

     
 楼主| 发表于 2025-1-21 13:56 来自手机 | 显示全部楼层
枯风瘦雪 发表于 2025-1-21 13:44
可用、参数量不太大、算力需求不太高
这三条已经在踹closeai的屁股了
希望对面那条路能彻底证伪 ...

这种数量级的性能差异可以说其他模型路线就走偏了
回复

使用道具 举报

     
发表于 2025-1-21 13:57 来自手机 | 显示全部楼层
Nanachi 发表于 2025-1-21 13:50
和v3有什么使用方向上的区别吗

—— 来自 鹅球 v3.3.96

这个是长思维模型,适合数学、推理等高难度需要过程的任务。在通用任务上可能表现会比较奇特。
v3适合普通的直觉、知识类任务,通用能力稳定。

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

     
发表于 2025-1-21 14:00 | 显示全部楼层
q4 需要500G内存,2台m2 ultra可跑。
回复

使用道具 举报

     
发表于 2025-1-21 14:01 | 显示全部楼层
R1是V3的再升级?
回复

使用道具 举报

     
发表于 2025-1-21 14:07 来自手机 | 显示全部楼层
sonnet 1022这个coding真高的耀眼,这还是都三个月没怎么更新模型
回复

使用道具 举报

     
发表于 2025-1-21 14:10 | 显示全部楼层
GitHub的copilot用的是什么模型,我还有十个多月的会员
回复

使用道具 举报

     
发表于 2025-1-21 14:13 | 显示全部楼层
之前就可以点那个深度思考了,这个R1模型是刚刚部署还是刚刚出分?
回复

使用道具 举报

     
发表于 2025-1-21 14:14 | 显示全部楼层
弱问下
这些模型是啥意思,区别在哪里?
就是原始数据处理的方法吗?
回复

使用道具 举报

     
发表于 2025-1-21 14:18 | 显示全部楼层
弗兰肯斯坦 发表于 2025-1-21 14:13
之前就可以点那个深度思考了,这个R1模型是刚刚部署还是刚刚出分?

昨天刚正式发布
回复

使用道具 举报

     
发表于 2025-1-21 14:20 | 显示全部楼层
油条小贩 发表于 2025-1-21 14:14
弱问下
这些模型是啥意思,区别在哪里?
就是原始数据处理的方法吗?

直接去问啊
回复

使用道具 举报

     
发表于 2025-1-21 14:43 来自手机 | 显示全部楼层
弗兰肯斯坦 发表于 2025-1-21 14:13
之前就可以点那个深度思考了,这个R1模型是刚刚部署还是刚刚出分?

之前是R1-LITE

R1-LITE是个1几B的MOE

R1是670B的MOE
回复

使用道具 举报

     
发表于 2025-1-21 14:47 来自手机 | 显示全部楼层
只想知道代码能力咋样,用了一圈感觉都不如gpt4,这个咋样了
回复

使用道具 举报

     
发表于 2025-1-21 14:49 来自手机 | 显示全部楼层
本帖最后由 alixsander 于 2025-1-21 18:54 编辑
枯风瘦雪 发表于 2025-1-21 13:44
可用、参数量不太大、算力需求不太高
这三条已经在踹closeai的屁股了
希望对面那条路能彻底证伪 ...


只是MOE和一些训练和推理工程(MLA MTP DUALPIPE PD分离什么)上的优化

和其他LLM又没有什么路线之争
回复

使用道具 举报

     
发表于 2025-1-21 14:51 来自手机 | 显示全部楼层
这模型用来翻译的话效率如何?
回复

使用道具 举报

发表于 2025-1-21 14:53 | 显示全部楼层
主要是提升的思维链能力,通用任务和code上可能还不如V3
回复

使用道具 举报

     
发表于 2025-1-21 14:53 | 显示全部楼层
neptunehs 发表于 2025-1-21 14:51
这模型用来翻译的话效率如何?

翻译你用1.5b核显都能跑的超小型模型都能完爆传统机翻了,用不上这么高档的东西。


这东西就是把一个数学系研究生塞你电脑里去了
回复

使用道具 举报

头像被屏蔽
     
发表于 2025-1-21 14:54 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2025-1-21 14:56 来自手机 | 显示全部楼层
油条小贩 发表于 2025-1-21 14:14
弱问下
这些模型是啥意思,区别在哪里?
就是原始数据处理的方法吗?


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

     
发表于 2025-1-21 15:01 来自手机 | 显示全部楼层
小ghoul 发表于 2025-1-21 14:47
只想知道代码能力咋样,用了一圈感觉都不如gpt4,这个咋样了

4o什么cjb,非reasoning模型的代码和数学能力很难和reseaning model比(可能sonnet是个例外)

什么QwQ, Gemini 2 Flash thinking,o1 从mini到pro,sonnet3.5, 当然包括R1 4o,这种普通多模态的数学,代码和科学能力是比不上的。




本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

     
发表于 2025-1-21 15:04 | 显示全部楼层
小野賢章 发表于 2025-1-21 14:10
GitHub的copilot用的是什么模型,我还有十个多月的会员

claude 3.5 sonnet和gpt 4o
集成进vscode后好像能一直免费用了
回复

使用道具 举报

     
发表于 2025-1-21 15:06 来自手机 | 显示全部楼层
卧槽,这个太牛逼了

这玩意稍微调教一下可以直接做流体仿真,Claude3.5s是打死都学不会的

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

评分

参与人数 1战斗力 +1 收起 理由
熊猫团 + 1 加个plt.tight_layout()吧,都叠一起去了.

查看全部评分

回复

使用道具 举报

     
发表于 2025-1-21 15:30 | 显示全部楼层
狠狠打脸了说中国AI落后美国N年的人一巴掌。
回复

使用道具 举报

     
发表于 2025-1-21 16:20 | 显示全部楼层
但是我实际使用下来,觉得和 claude 3.5 sonnet还是有差距 的, 虽然某些特定的问题已经比claude 3.5 sonnet好,但是深入一点解决方案的话,还是claude 3.5 sonnet要优秀

但考虑到DEEPSEEK是完全开源的,那就很恐怖了。非常吊炸天了
回复

使用道具 举报

     
发表于 2025-1-21 16:24 来自手机 | 显示全部楼层



— from S1 Next Goose v3.3.96
回复

使用道具 举报

     
发表于 2025-1-21 16:29 | 显示全部楼层
lzrtwilight 发表于 2025-1-21 13:43
https://chat.deepseek.com/
点深度思考用的就是R1

这个是完全不要钱吗?
回复

使用道具 举报

     
发表于 2025-1-21 16:30 来自手机 | 显示全部楼层
D家甚至把qwen和llama的R1蒸馏模型也放出来了

大洋对岸的什么close路边公司,DS才是真正的源神

— from S1 Next Goose v3.3.96
回复

使用道具 举报

     
发表于 2025-1-21 16:37 | 显示全部楼层
某浩 发表于 2025-1-21 16:20
但是我实际使用下来,觉得和 claude 3.5 sonnet还是有差距 的, 虽然某些特定的问题已经比claude 3.5 sonne ...

推理模型不是Chat模型的上位平替,最后还是要看迭代之后的V3。下一个版本的V3估计会引入更多的R1合成数据
回复

使用道具 举报

发表于 2025-1-21 17:06 | 显示全部楼层
这玩意儿好像还活在去年



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

发表于 2025-1-21 17:06 | 显示全部楼层
某浩 发表于 2025-1-21 16:20
但是我实际使用下来,觉得和 claude 3.5 sonnet还是有差距 的, 虽然某些特定的问题已经比claude 3.5 sonne ...

R1这种推理模型在某些领域是不如普通模型的,擅长的是复杂coding和数学推理,这方面可以吊着所有非推理模型打
回复

使用道具 举报

     
发表于 2025-1-21 17:10 来自手机 | 显示全部楼层
话说翻译最好的模型还是claude3.5吗?
回复

使用道具 举报

     
发表于 2025-1-21 17:15 | 显示全部楼层
nukacolamania 发表于 2025-1-21 17:06
这玩意儿好像还活在去年

可以勾选【联网搜索】
回复

使用道具 举报

     
发表于 2025-1-21 17:27 | 显示全部楼层
小野賢章 发表于 2025-1-21 17:15
可以勾选【联网搜索】

联网搜索的模型是V3
回复

使用道具 举报

     
发表于 2025-1-21 17:29 来自手机 | 显示全部楼层
实测到底怎么样,网上营销号实在太多了,真真假假
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2025-3-4 02:59 , Processed in 0.178836 second(s), 7 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表