找回密码
 立即注册
搜索
查看: 84561|回复: 489

[科技] 西方自找的没落(转型DEEPSEEK讨论楼

[复制链接]
头像被屏蔽
     
发表于 2024-12-27 16:25 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2024-12-27 16:28 | 显示全部楼层
从搞量化私募直接转行搞LLM,这个决心和眼界是真的牛逼
回复

使用道具 举报

     
发表于 2024-12-27 16:28 来自手机 | 显示全部楼层
deepseek的软文?
回复

使用道具 举报

     
发表于 2024-12-27 16:29 来自手机 | 显示全部楼层
本帖最后由 出逃白鲸 于 2024-12-27 16:32 编辑

楼主没贴作者名字,个人凭感觉这个作者肯定不是制造业的,说了半天很空洞。
观点也许对,但内容空,套话多,爱用无关例证,这种行文像是经常写蹭热度文章忽悠外行留下的习惯
回复

使用道具 举报

     
发表于 2024-12-27 16:31 | 显示全部楼层
软文
回复

使用道具 举报

     
发表于 2024-12-27 16:32 | 显示全部楼层
等chatgpt降价再说吧
回复

使用道具 举报

     
发表于 2024-12-27 16:33 | 显示全部楼层
以六代机为首的竞争刚好体现美国洛克希德马丁等制造业公司的极限,这就是美国人临盆难产面对的刚体洛希极限
回复

使用道具 举报

发表于 2024-12-27 16:34 | 显示全部楼层
本帖最后由 绝地潜兵 于 2024-12-27 16:35 编辑

机器人确实发展得好,但那个过程是在臆想吧。感觉是deepseek软文
回复

使用道具 举报

     
发表于 2024-12-27 16:35 来自手机 | 显示全部楼层
今天倒是微博上看到几个说v3效率惊人的,不过还是等能用到手再说吧

—— 来自 HUAWEI NOH-AN00, Android 12上的 S1Next-鹅版 v3.0.0.81-alpha
回复

使用道具 举报

发表于 2024-12-27 16:38 | 显示全部楼层
出逃白鲸 发表于 2024-12-27 16:29
楼主没贴作者名字,个人凭感觉这个作者肯定不是制造业的,说了半天很空洞。
观点也许对,但内容空,套话多 ...

第一行就是微博原文链接
回复

使用道具 举报

     
发表于 2024-12-27 16:39 来自手机 | 显示全部楼层
木水风铃 发表于 2024-12-27 16:35
今天倒是微博上看到几个说v3效率惊人的,不过还是等能用到手再说吧

—— 来自 HUAWEI NOH-AN00, Android 1 ...

V3你上他们官网就能用了。论文和权重也都开放了下载了
回复

使用道具 举报

     
发表于 2024-12-27 16:40 | 显示全部楼层
关注的几个傻X博主同时发了QVQ的商稿,对通义千问的好感大降。
另外之前Deepseek的API看了半天,发现没写多模态输入在哪。这次的V3也一样没多模态。
隔壁OpenAI除了翻车的Sora,多模态的4o,长推理的o1。得到的结果就是一个可以实时理解视频流和音频流并即时输出的模型,而不是走 视频/音频->文字->音频TTS的道路
回复

使用道具 举报

     
发表于 2024-12-27 16:42 | 显示全部楼层
做自媒体的人
回复

使用道具 举报

     
发表于 2024-12-27 16:45 | 显示全部楼层
我只能说我在推上搜DeepSeek基本都是吹的,和半年多之前的千问差不多
回复

使用道具 举报

头像被屏蔽
     
发表于 2024-12-27 16:48 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

发表于 2024-12-27 16:51 | 显示全部楼层
以前熟知的杭州大企业就一个阿里。现在知道的,有游戏科学,宇树,deepseek。
回复

使用道具 举报

     
发表于 2024-12-27 16:51 来自手机 | 显示全部楼层
本帖最后由 a4ac7 于 2024-12-27 17:03 编辑

在文字处理方面,感觉o1是有挺大提升的

拿坛友这个对子问



o1回答至少字数和结构对上了,4o和seek半斤八两,不过能达到4o也很nb了

试了下deepseek的深度思考,有点意思



—— 来自 鹅球 v3.2.91
回复

使用道具 举报

     
发表于 2024-12-27 16:55 | 显示全部楼层
软文,但是deepseek真的不错,这几天TWZ的文章我都用它翻译了看,有个回复里有个英文非主流词 '$hort' 都翻译对了,试了一下传统的翻译器都没做到
回复

使用道具 举报

发表于 2024-12-27 17:00 | 显示全部楼层
泰坦失足 发表于 2024-12-27 16:40
关注的几个傻X博主同时发了QVQ的商稿,对通义千问的好感大降。
另外之前Deepseek的API看了半天,发现没写多 ...

deepseek本来就不是个多模态模型啊。
回复

使用道具 举报

     
发表于 2024-12-27 17:03 | 显示全部楼层

纯软广,预训练技术路线已经到头了
下一代路线如果摸索出来,预训练直接被扫进垃圾桶

至于幻方转AI,纯被证监会制裁转行罢了,可以搜下《证券市场程序化交易管理规定》
回复

使用道具 举报

头像被屏蔽
     
发表于 2024-12-27 17:05 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2024-12-27 17:07 来自手机 | 显示全部楼层
不能这么拼,波士顿动力仍然有西方企业的核心技术优势:画饼
回复

使用道具 举报

发表于 2024-12-27 17:12 | 显示全部楼层
yuialon 发表于 2024-12-27 17:03
纯软广,预训练技术路线已经到头了
下一代路线如果摸索出来,预训练直接被扫进垃圾桶

这有啥好软广的。x上各路ai圈的推主这两天都在谈deepseek的新模型,openrouter上到deepseek api的流量翻了3倍。
回复

使用道具 举报

头像被屏蔽
发表于 2024-12-27 17:14 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2024-12-27 17:17 | 显示全部楼层
人家模型开源了,技术报告发了,官网也上线了,楼上一堆刷软文的是只会复读么?
回复

使用道具 举报

     
发表于 2024-12-27 17:26 | 显示全部楼层
一眼deepseek软文,deepseek牛逼没错,也不至于翻到豆包千问前面去
回复

使用道具 举报

     
发表于 2024-12-27 17:27 来自手机 | 显示全部楼层
本帖最后由 a4ac7 于 2024-12-27 17:34 编辑
洛拉斯 发表于 2024-12-27 17:05
下联你贴出来一下可以吗
问题:
帮我对个对子,一艘两攻共三架飞机四款新品搞得五角大楼六神无主七上八下酒后加班十分难受

ChatGPT o1:
下面是一条与原句在字数和节奏上相匹配的下联示例,可供参考。为了与上联同样带有“跳过九”的趣味,且在内容上与“五角大楼”“六神无主”“七上八下”等处形成对应,下联也巧用了数字与词语搭配,保持了同样的诙谐气质。

上联:
一艘两攻共三架飞机四款新品搞得五角大楼六神无主七上八下酒后加班十分难受

下联(示例):
一言两疑惹三大盟友四处施压惊动五角白宫六魄无存七扯八纠酒尽方言十分狼狈

拆分对照与释义:
  • 一言 两疑
    上联“一艘 两攻”,下联用“一言 两疑”呼应,皆为四字,暗示“说一句话却生出两种猜忌”。

  • 惹三大盟友
    对应上联“共三架飞机”。“三大盟友”既点出“三”这个数字,也让情节更加国际化。

  • 四处施压
    对应上联“四款新品”,同样以“四”字开头,表达多方向、多方面的动作。

  • 惊动五角白宫
    上联是“搞得五角大楼”,下联改为“惊动五角白宫”,既保留“五角”这一核心元素,又把“大楼”变成“白宫”,进一步衬托美方焦虑。

  • 六魄无存
    对应上联“六神无主”,继续使用“六”字+“魄”来与“神”对仗,营造神魂颠倒之感。

  • 七扯八纠
    上联“七上八下”,下联用“七扯八纠”,依旧是数字七、八的并列,形容混乱局面。

  • 酒尽方言
    上联是“酒后加班”,下联“酒尽方言”则表现“酒喝光了才开始胡说”之意,与加班后烦躁相呼应。

  • 十分狼狈
    对应“十分难受”,以“狼狈”烘托窘迫、糟糕的状态,跟“难受”形成近义映衬。


如果觉得用词或主题还可以进一步润色,也可以在保持字数和数词位置不变的前提下,根据实际需要做微调。希望对你的创作有所启发!

ChatGPT 4o:
上联:
一艘两攻共三架飞机四款新品搞得五角大楼六神无主七上八下酒后加班十分难受

下联:
九天八荒携七条龙舟六尺金枪破得五岳四海三江两岸一战风流

Deepseek:
十全九美有八斗才七步成诗六艺精通五湖四海三心二意一夜成名百般得意

Deepseek(带深度思考):
这是一句带有数字和对仗色彩的顺口溜,描述了一种混乱和无奈的场景。下面是对这句顺口溜的解释和可能的“对子”:

原句:
一艘两攻共三架飞机四款新品搞得五角大楼六神无主七上八下酒后加班十分难受

解释:
  • 一艘两攻:
    可能指一艘具有两种攻击能力的舰船。

  • 共三架飞机:
    指共有三架飞机。

  • 四款新品:
    指四种新产品或新装备。

  • 搞得五角大楼:
    可能指这些装备让五角大楼(美国国防部)感到困扰。

  • 六神无主:
    形容非常慌乱,没有头绪。

  • 七上八下:
    形容心情不安,忐忑不定。

  • 酒后加班:
    指在喝酒之后还要加班工作。

  • 十分难受:
    形容非常不舒服,可能指身体或心理上的不适。


对子:
(上联)一艘两攻共三架飞机四款新品搞得五角大楼六神无主七上八下酒后加班十分难受

(下联)一面五星展六尺红旗七彩光芒照亮八方天地九天揽月十分自豪

解释:
  • 一面五星:
    指一面五星红旗。

  • 展六尺红旗:
    展开六尺长的红旗。

  • 七彩光芒:
    形容红旗在阳光下闪耀着七彩的光芒。

  • 照亮八方天地:
    指红旗的光芒照亮了四周。

  • 九天揽月:
    指登月等航天成就。

  • 十分自豪:
    形容对国家成就感到非常自豪。


这个对子通过对比原句的混乱和无奈,表达了对国家成就的自豪感。

顺便这个第一次 Deepseek 带深度思考对的,“一花两叶共三春花开四季芬芳扑鼻使得五湖四海六合同春七彩斑斓八方来客九九归一十分和谐”,看来不太稳定

—— 来自 鹅球 v3.2.91

评分

参与人数 1战斗力 +1 收起 理由
洛拉斯 + 1 好评加鹅

查看全部评分

回复

使用道具 举报

发表于 2024-12-27 17:32 | 显示全部楼层
本帖最后由 overflowal 于 2024-12-27 17:33 编辑
笨拙的机器人 发表于 2024-12-27 17:26
一眼deepseek软文,deepseek牛逼没错,也不至于翻到豆包千问前面去

大家觉得deepseek牛逼是因为它在各种benchmark表现真的跟闭源模型硬刚了啊,他们自己报告里也写了和qwen的对比。别这里虚空排位干不过豆包千问
回复

使用道具 举报

     
发表于 2024-12-27 17:32 | 显示全部楼层
本帖最后由 qratosones1337 于 2024-12-27 17:39 编辑
笨拙的机器人 发表于 2024-12-27 17:26
一眼deepseek软文,deepseek牛逼没错,也不至于翻到豆包千问前面去

笑死,论模型能力,豆包就是个CJB,也就是产品做的比较好而已,现在DeepSeek和Qwen就是国内的Top-2。然后Qwen现在已经放弃了超大模型冲SOTA了,专注于做中小模型,跟DeepSeek生态位正好错开了。
回复

使用道具 举报

     
发表于 2024-12-27 17:40 | 显示全部楼层
坐等千问qwq
回复

使用道具 举报

发表于 2024-12-27 17:41 | 显示全部楼层
美帝这几年甚至是十多年前万物转码的后遗症,认识不少学机械EE的纷纷抛弃制造业,纯coding又不是什么要智商的玩意儿,,
剩下的本土制造业学生疯狂追星马斯克这根独苗,tesla的实习目测不给钱简历都收爆
回复

使用道具 举报

发表于 2024-12-27 17:42 | 显示全部楼层
qratosones1337 发表于 2024-12-27 17:17
人家模型开源了,技术报告发了,官网也上线了,楼上一堆刷软文的是只会复读么? ...

国内公司发了一个堪比商业闭源模型的开源模型,技术报告写的清清楚楚,国外ai圈子讨论的热火朝天。
国内自媒体反应过来跟着吹一下,一群人第一反应是软文大内宣,我也是服
回复

使用道具 举报

     
发表于 2024-12-27 17:45 来自手机 | 显示全部楼层
overflowal 发表于 2024-12-27 17:32
大家觉得deepseek牛逼是因为它在各种benchmark表现真的跟闭源模型硬刚了啊,他们自己报告里也写了和qwen的 ...

别跑题,我的重点在软文,前面把宇树抬出来是因为直接说deepseek啊排行榜啊这种抽象的东西,你不容易有感。先用宇树吸睛,再吹deepseek,我的雷达响了
回复

使用道具 举报

     
发表于 2024-12-27 17:48 | 显示全部楼层
这玩意尺寸是671B,啥卡能放下啊. llama 3.2的405b都挺抽象的了.
回复

使用道具 举报

发表于 2024-12-27 17:50 | 显示全部楼层
笨拙的机器人 发表于 2024-12-27 17:45
别跑题,我的重点在软文,前面把宇树抬出来是因为直接说deepseek啊排行榜啊这种抽象的东西,你不容易有感 ...

那行吧,就是软文。deepseek这公司怎么会出现在在公众视野呢,肯定是软文没跑了
回复

使用道具 举报

     
发表于 2024-12-27 17:52 来自手机 | 显示全部楼层
这篇文章确实是标准的软文结构啊
标题是“西方vs中国”的标准引战标题党吸引眼球,开头讲了大概1/4的机械狗发展历程(宇树只是提了一嘴,更多的是“理性客观公正”地分析局势)
然后剩下3/4,“接下来说说软件”的转场之后,就是长篇大论“只针对”deepseek的夸奖和吹捧,放了一大段老板的个人访谈
直到最后文末总结,也把标题和开头扔在一边,专注于“优秀的老板和企业家”这个部分
就算他吹的是现在蓝星第一,那也是软文啊()

—— 来自 HUAWEI ALN-AL80, Android 12上的 S1Next-鹅版 v2.1.2
回复

使用道具 举报

     
发表于 2024-12-27 17:53 | 显示全部楼层
再加一个游科,软文就更明显了
回复

使用道具 举报

发表于 2024-12-27 17:55 | 显示全部楼层
泰坦失足 发表于 2024-12-27 17:48
这玩意尺寸是671B,啥卡能放下啊. llama 3.2的405b都挺抽象的了.

单卡是放不下了,真想跑可以尝试放到内存用CPU跑,应该速度是能用的。因为是MoE架构
回复

使用道具 举报

     
发表于 2024-12-27 17:55 | 显示全部楼层
泰坦失足 发表于 2024-12-27 17:48
这玩意尺寸是671B,啥卡能放下啊. llama 3.2的405b都挺抽象的了.

本来就放不下啊 moe结构说白了是省电费又不是省显存…

论坛助手,iPhone
回复

使用道具 举报

     
发表于 2024-12-27 18:07 | 显示全部楼层
overflowal 发表于 2024-12-27 17:42
国内公司发了一个堪比商业闭源模型的开源模型,技术报告写的清清楚楚,国外ai圈子讨论的热火朝天。
国内 ...

说明泥潭喜欢不懂装懂的懂哥太多了,啥都想插一句嘴,然后自己又根本不懂(甚至可能都没到一知半解的地步),自然就只能甩锅软文咯。毕竟只要“雷达响了”就自动立于不败之地了
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2025-3-4 03:20 , Processed in 0.196275 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表