找回密码
 立即注册
搜索
楼主: moeblack

[科技] (转型Deepseek交流楼)DEEPSEEK-R1完全可以说是全球第一LLM了

[复制链接]
     
发表于 2025-1-22 11:09 | 显示全部楼层

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

评分

参与人数 3战斗力 +4 收起 理由
soulatomy + 1 欢乐多
overflowal + 2 欢乐多
徐老师 + 1 好评加鹅

查看全部评分

回复

使用道具 举报

     
发表于 2025-1-22 11:14 | 显示全部楼层
本帖最后由 qratosones1337 于 2025-1-22 11:32 编辑

我觉得有必要第114514次强调,推理模型跟Chat模型不是同一个路线的产品,不涉及推理的问题问了之后没有意义。

类似地情况还有,向o1-preview提问“Linux下如何安装CUDA12.2”,然后o1思考了两个小时,最后回答“我不知道”,当然现在似乎是修好了(可能检测到类似情况会直接转发给4o,也可能是综合普通数据做SFT训练)
回复

使用道具 举报

     
发表于 2025-1-22 11:26 | 显示全部楼层
用了一下,确实可以,但没有没有多模读不了图还是有点遗憾。
回复

使用道具 举报

     
发表于 2025-1-22 11:54 | 显示全部楼层

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

     
发表于 2025-1-22 13:01 来自手机 | 显示全部楼层
nb,感觉已经可以独立写小论文了。

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

     
发表于 2025-1-22 13:20 | 显示全部楼层
api实在是太便宜了,让我一点本地化部署的想法的都没有

论坛助手,iPhone
回复

使用道具 举报

     
发表于 2025-1-22 14:37 | 显示全部楼层
个人最近在帮人翻译文章 几个大模型都试了下
目前中文语境下最好的还是gemini 1206 大毛病改了不少 但有时候翻译方式会比较绕圈圈,而且几乎用不了api
其次是claude opus 比sonnet 3.5好 但太贵了  1w字差不多要4美刀,sonet 3.5稍微差点 而且api也不便宜
再其次4o,o1是翻译准确但需要人工润色得地方比较多,4o最大毛病不应该扩写得地方帮你扩写,不应该省略得地方帮你省略,很麻烦也很降智。
deepseek国内最强大得模型,用的是v3(r1我觉得不太适合用来翻译)目前测试用来翻牛背和轻小说问题应该不大,比4omini和haiku3.5都好
但目前所有模型翻译出来的东西都不能直接用,至少得人工润色和审核两遍工序
回复

使用道具 举报

     
发表于 2025-1-22 14:52 来自手机 | 显示全部楼层
stanzgy 发表于 2025-1-22 13:20
api实在是太便宜了,让我一点本地化部署的想法的都没有

论坛助手,iPhone

求问有什么方便易于新手使用的,浏览器接入deepseek的api方法吗刚部署好python,求一个链接谢谢

—— 来自 鹅球 v3.3.96-alpha
回复

使用道具 举报

     
发表于 2025-1-22 15:03 | 显示全部楼层
推上随便看了下,英文大部分是技术性讨论,偶尔看到几个不懂技术的拿DEEPSEEK无法回答某些国内法规限制的问题截图来证明这个AI不行,日本人则是复读中华AI会泄露啥的。
回复

使用道具 举报

     
发表于 2025-1-22 15:09 | 显示全部楼层
本帖最后由 右代宫嘉音 于 2025-1-22 15:34 编辑
小ghoul 发表于 2025-1-21 14:47
只想知道代码能力咋样,用了一圈感觉都不如gpt4,这个咋样了

用很久了,和4o差不多的水平,通用问题远不如claude。
不过特定问题确实还可以,比如优化代码。
回复

使用道具 举报

     
发表于 2025-1-22 15:27 | 显示全部楼层
faithlifer 发表于 2025-1-22 14:52
求问有什么方便易于新手使用的,浏览器接入deepseek的api方法吗刚部署好python,求一个链接谢谢

—— 来 ...

没看懂你想表达什么,如果你只是想在浏览器上和ai对话,可以直接 https://chat.deepseek.com/ 注册使用
回复

使用道具 举报

     
发表于 2025-1-22 18:26 | 显示全部楼层
sellboy 发表于 2025-1-21 17:27
联网搜索的模型是V3

现在深度思考和联网搜索可以一起勾选了
回复

使用道具 举报

     
发表于 2025-1-22 18:43 | 显示全部楼层
遗尿 发表于 2025-1-22 15:03
推上随便看了下,英文大部分是技术性讨论,偶尔看到几个不懂技术的拿DEEPSEEK无法回答某些国内法规限制的问 ...

我觉得日本人是最弱智的,明明自己屁制裁没受,但是在AI方面完全没有作为,other中的other,却满是优越感的指点,活像个太监讨论怎么生小孩一样
回复

使用道具 举报

     
发表于 2025-1-22 18:46 | 显示全部楼层
sellboy 发表于 2025-1-21 17:27
联网搜索的模型是V3

r1可以联网搜索,两个可以一起开了
你两个都点上是同时有网络资料和cot输出的
回复

使用道具 举报

     
发表于 2025-1-22 19:30 | 显示全部楼层
faithlifer 发表于 2025-1-22 14:52
求问有什么方便易于新手使用的,浏览器接入deepseek的api方法吗刚部署好python,求一个链接谢谢

—— 来 ...

如果你单纯的想考察一下他的api效果,可以考虑使用沉浸式翻译插件然后加上自己的key,用免费额度读几个国外网站
前一阵飞银杏叶的时候我用了不少,最直接的感受就是快,还没看见圈儿转几下就出来了,就这点就比其他老牌的玩意儿强很多了
再一个对语料识别很强大,有些异体英文版“火星文”(比如$hort,A=4这种)都能正确转义成中文能理解的含义
回复

使用道具 举报

发表于 2025-1-23 01:46 | 显示全部楼层
有没有傻瓜方案,调用 v3 的 api 搞翻译啊,用 chat 界面很麻烦

论坛助手,iPhone
回复

使用道具 举报

     
发表于 2025-1-24 07:49 | 显示全部楼层
本帖最后由 黄泉川此方 于 2025-1-24 08:01 编辑

试了下本地部署,感觉纯图一乐
家用显卡还是继续打游戏吧,显卡钱买API用到天荒地老了
回复

使用道具 举报

     
发表于 2025-1-25 04:29 来自手机 | 显示全部楼层
深度思考模式的碎碎念感觉神经兮兮的又有点蠢萌。。。
回复

使用道具 举报

发表于 2025-1-25 06:59 来自手机 | 显示全部楼层
求一个可以瑟瑟的模型
回复

使用道具 举报

     
发表于 2025-1-25 09:37 | 显示全部楼层
有鱼 发表于 2025-1-23 01:46
有没有傻瓜方案,调用 v3 的 api 搞翻译啊,用 chat 界面很麻烦

论坛助手,iPhone ...

https://immersivetranslate.com/zh-Hans/
沉浸式翻译,市面上应该找不到比他更好的解决方案了,非常傻瓜,到deepseek生成api key填上去完事

评分

参与人数 3战斗力 +3 收起 理由
YESIARE + 1 好评加鹅
你知道我的 + 1
beta10 + 1 好评加鹅

查看全部评分

回复

使用道具 举报

     
发表于 2025-1-25 09:38 来自手机 | 显示全部楼层
AMD宣布要集成deepseek了,苏妈能不能崛起痛击皮衣黄
回复

使用道具 举报

发表于 2025-1-25 10:34 来自手机 | 显示全部楼层
x上中文圈我只关注黄,日本一般都是正常人居多

中文全基本都是搞黄色和鉴证

有趣的事一些亚裔 ai infra 研究者会把自己的社交账号挂出来,点进去看会在x上和外国研究这讨论技术细节。同时,这群人也会用知乎,在知乎用中文讨论
回复

使用道具 举报

     
发表于 2025-1-25 10:51 来自手机 | 显示全部楼层
FeteFete 发表于 2025-1-25 10:34
x上中文圈我只关注黄,日本一般都是正常人居多

中文全基本都是搞黄色和鉴证

他们的X账号就是用于国外AI研究社群的

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

     
发表于 2025-1-25 10:51 | 显示全部楼层
流缨 发表于 2025-1-25 09:37
https://immersivetranslate.com/zh-Hans/
沉浸式翻译,市面上应该找不到比他更好的解决方案了,非常傻瓜 ...

确实好用,感谢推荐
回复

使用道具 举报

     
发表于 2025-1-25 10:58 | 显示全部楼层
本帖最后由 美坂汐里 于 2025-1-25 11:01 编辑
黄泉川此方 发表于 2025-1-24 07:49
试了下本地部署,感觉纯图一乐
家用显卡还是继续打游戏吧,显卡钱买API用到天荒地老了 ...

主要是本地部署的用处比较特殊,一个是本地工作内容涉及商业机密不能交给外网,一个是工作内容特化所以通用模型干不了,一个是瑟瑟

评分

参与人数 1战斗力 +1 收起 理由
黄泉川此方 + 1 干活最重要,我是自己图一乐

查看全部评分

回复

使用道具 举报

     
发表于 2025-1-25 10:59 来自手机 | 显示全部楼层
笑死,我把《Meta GenAI Org 彻底慌了》这篇爆料文喂给它问它态度,它说道:

DeepSeek 的潜在心态**
- **冷静的自信**:不因巨头的慌乱而自大,而是聚焦技术迭代和生态建设。  

- **务实的挑衅**:用实际成果而非口水战,证明“小团队也能颠覆游戏规则”。  

- **行业重塑者的野心**:通过性价比和开源策略,重新定义 AI 竞赛的胜负手。

回答充满了作为Game Changer的自豪与暗爽。

真是太智能了。
回复

使用道具 举报

     
发表于 2025-1-25 11:32 | 显示全部楼层
拿它喂了下自己之前写过的一些东西,让它续写。看完我自己都惊到了。这比文心强一个纪元吧。
回复

使用道具 举报

     
发表于 2025-1-25 11:40 | 显示全部楼层
我突然想到海龟汤喂进去咋样?
回复

使用道具 举报

发表于 2025-1-25 12:05 来自手机 | 显示全部楼层
如果想要用deepseek写八股文啥的,怎么搞比较方便?用网页和客户端好像是得过审查,并不能写的出来

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

     
发表于 2025-1-25 17:21 | 显示全部楼层
colice 发表于 2025-1-25 12:05
如果想要用deepseek写八股文啥的,怎么搞比较方便?用网页和客户端好像是得过审查,并不能写的出来

——  ...

这样的?用OLLAMA+Open WebUI本地跑的,B站一搜就有教程


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

     
发表于 2025-1-25 18:03 | 显示全部楼层
是不是不能登录帐号和密码?比如让它登录后浏览卓明谷的帖子
回复

使用道具 举报

     
发表于 2025-1-25 18:32 来自手机 | 显示全部楼层
大韩李明博 发表于 2025-1-21 15:30
狠狠打脸了说中国AI落后美国N年的人一巴掌。

现在nga的处开始说要不是没有欧美就没有ai了,现在能比美国强有啥用别人做出了0到1!!!

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

     
发表于 2025-1-25 18:42 来自手机 | 显示全部楼层
moekyo 发表于 2025-1-22 11:09

这是谁啊
回复

使用道具 举报

     
发表于 2025-1-25 18:44 来自手机 | 显示全部楼层
梅杜莎 发表于 2025-1-25 18:03
是不是不能登录帐号和密码?比如让它登录后浏览卓明谷的帖子

我问了他说不能访问外部链接
回复

使用道具 举报

     
发表于 2025-1-25 18:46 | 显示全部楼层
梅杜莎 发表于 2025-1-25 18:03
是不是不能登录帐号和密码?比如让它登录后浏览卓明谷的帖子

这个要搭个cline
回复

使用道具 举报

     
发表于 2025-1-25 18:50 来自手机 | 显示全部楼层
ds的“联网搜索”只是能让ai自己想关键词然后去调用搜索引擎,指望它实际访问网页、登录账号什么的就不可能了
回复

使用道具 举报

     
发表于 2025-1-25 18:56 | 显示全部楼层
我让他模仿泥潭预期写帖子和回复倒是成功了
如果你只是想用它调用单篇贴子,可以自己复制黏贴进去
回复

使用道具 举报

     
发表于 2025-1-25 19:12 | 显示全部楼层

李彦宏
回复

使用道具 举报

     
发表于 2025-1-25 19:29 | 显示全部楼层
我问他如何看待R1发布后业界震动,他是这么回应的:
总结:技术乐观主义者的谨慎期待
作为观察者,我认为DeepSeek-R1的突破值得喝彩,但其意义更多在于**“证明了一种可能性”**——开源模式可以诞生高性能垂直模型,且中国团队有能力参与高阶竞争。然而,将其视为“颠覆性转折点”仍为时尚早。

未来关键节点:

能否在6-12个月内推出支持多模态的R2版本?

开源生态能否吸引超过10万名活跃开发者?

是否会出现“杀手级应用”(如基于R1的全民编程教育平台)?

唯有时间能验证这些问题的答案。在此之前,保持对技术的敬畏,对竞争的清醒,或许是对创新最好的尊重。

后续不会真按照这个步骤走吧
回复

使用道具 举报

     
发表于 2025-1-25 19:37 来自手机 | 显示全部楼层
深空坍缩 发表于 2025-1-25 19:29
我问他如何看待R1发布后业界震动,他是这么回应的:
总结:技术乐观主义者的谨慎期待
作为观察者,我认为De ...

作为亲身体验者和受益者,我可以很有信心的说AI辅助已经让编程学习和实现的门槛降得前所未有的低,而deepseek这波又把成本降低了数个数量级,大规模普及编程学习的时代很可能即将到来
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2025-1-27 21:53 , Processed in 0.193526 second(s), 4 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表