找回密码
 立即注册
搜索
楼主: overflowal

[科技] 幻方旗下的DeepSeek发布全新DeepSeek V3开源大模型

[复制链接]
     
发表于 2024-12-27 22:10 | 显示全部楼层
看看同期的清华,字节的发展。

这群论文制霸学阀和“顶级”高校弟子组成的论文大神专业队伍,做出来的模型,真的是一言难尽,纯纯浪费电力。

幻方能从一堆论文天才和顶会霸王导师里面选了纯国产的几位大牛搞出deepseek这个模型,这个眼光是真没得说。

评分

参与人数 1战斗力 +1 收起 理由
偽物 + 1 好评加鹅

查看全部评分

回复

使用道具 举报

     
发表于 2024-12-27 22:11 | 显示全部楼层
洛拉斯 发表于 2024-12-27 21:46
因为服务器ai翻译服务器响应本来就慢

谷歌块那是机翻

懂了,感谢
回复

使用道具 举报

     
发表于 2024-12-27 22:16 | 显示全部楼层
试用了下翻译  玩了会酒馆 感觉不错
回复

使用道具 举报

     
发表于 2024-12-27 22:51 | 显示全部楼层
用来给酒馆和日用coder的,酒馆温度高点用个好预设真打平克劳德,而且价格低所以roll完全不心疼

—— 来自 S1Fun
回复

使用道具 举报

头像被屏蔽
     
发表于 2024-12-27 22:53 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2024-12-27 22:53 | 显示全部楼层
自带的"深度思考"反而会让ai变成不听人话的智障,不过真的很好用。
回复

使用道具 举报

 楼主| 发表于 2024-12-27 22:54 来自手机 | 显示全部楼层
takitaki 发表于 2024-12-27 22:53
自带的"深度思考"反而会让ai变成不听人话的智障,不过真的很好用。

深度思考是另一个模型在回答,r1-lite

—— 来自 Xiaomi 23049RAD8C, Android 14上的 S1Next-鹅版 v2.5.2-play
回复

使用道具 举报

     
发表于 2024-12-27 22:55 | 显示全部楼层
这价格涨得有点猛啊,看来要提前多充点。
回复

使用道具 举报

     
发表于 2024-12-27 23:01 | 显示全部楼层
之前是真便宜 看了眼就算涨价了还是很便宜
回复

使用道具 举报

     
发表于 2024-12-27 23:05 | 显示全部楼层
浅井惠 发表于 2024-12-27 13:31
最重要的是不知道v3上线后还能不能继续用v2,目前主要用来翻译小黄油感觉其实v2已经够用了,玩得多一个月估 ...

看公告今天已经换v3了 应该是没有v2对外的接口了
原来黄油这么大的文字量吗
回复

使用道具 举报

     
发表于 2024-12-27 23:06 来自手机 | 显示全部楼层
闷吸 发表于 2024-12-27 11:30
充分说明深度学习在量化行业没有那么work

因为股价不太是一个自回归系统,用transformer直接预测next token从建模角度是不合理的。用无监督范式呢,建模方式倒是合理了,但是样本量需求量更大,要大好几个数量级才能训出来,也不容易啦
回复

使用道具 举报

     
发表于 2024-12-28 00:35 | 显示全部楼层
宣传上有功夫,meta当时有成熟的fp8驱动吗?好意思跟人家比训练时间。
回复

使用道具 举报

     
发表于 2024-12-28 00:50 来自手机 | 显示全部楼层
有大佬测过翻译和4o比差别大吗

—— 来自 鹅球 v3.1.88.3
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2025-1-31 17:46 , Processed in 0.115076 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表