枯风瘦雪
发表于 2025-1-22 09:23
qratosones1337 发表于 2025-1-22 09:17
非常搞笑的是,国内乃至全球的AI top玩家,其中一个是Qwen,属于阿里集团…
现在已经基本上压过了llama
阿里在它愿意投钱给某个领域的时候其实还行吧。
达摩院其实也投了挺多年才收回来的,虽然那个环境确实没法做点啥正经研究吧,但起码也没啥干扰
moekyo
发表于 2025-1-22 09:23
虽然我看到百分之九十以上都是正面的,但是还是看到不少傻逼在哪里问问你懂的,搞不懂想表达什么
qratosones1337
发表于 2025-1-22 09:35
枯风瘦雪 发表于 2025-1-22 09:23
阿里在它愿意投钱给某个领域的时候其实还行吧。
达摩院其实也投了挺多年才收回来的,虽然那个环境确实没 ...
所以这么看来,算力限制还是有点好处的,居安思危有助于克服大企业病
banrendacha
发表于 2025-1-22 09:36
我已经看到下一家要被美国制裁,被说威胁美国国家安全的公司了
Holyted
发表于 2025-1-22 09:47
工口兔 发表于 2025-1-22 07:11
OpenAI看来真急了,直接宣布砸4000亿刀开始Stargate计划
多少?4000亿刀?
这尼玛快赶上08年我们的4万亿了
真离谱
overflowal
发表于 2025-1-22 10:11
本帖最后由 overflowal 于 2025-1-22 10:14 编辑
alixsander 发表于 2025-1-22 02:38
1、OK我看了下DeepSeek V3的API统计,TTFT是1.9s,吞吐是50tokens/s。首token比sonnet低,增量吞吐和sonne ...
chat不消耗啥资源,很多人问一下就走了,最多问几轮。用api才是真正的消耗大头,你把deepseek怼在cline或者aider上试试,随随便便就几十万token烧了,chat就引流用。
d2loader
发表于 2025-1-22 10:21
本帖最后由 d2loader 于 2025-1-22 10:31 编辑
riin2 发表于 2025-1-22 01:35
有没有啥文章视频能说清楚为啥这样一个名不见经转的投资公司能把LLM研究的这么成功的 ...
省流: 幻方的研发据说人均IMO/IOI/ACM拿牌选手
另外幻方是国内四大量化已经是这轮AI炒作之前的事了....说人家名不见经传只是你不了解相关行业
alixsander
发表于 2025-1-22 10:42
工口兔 发表于 2025-1-22 07:11
OpenAI看来真急了,直接宣布砸4000亿刀开始Stargate计划
500B,怎么吃了100B
陈乔恩
发表于 2025-1-22 10:51
工口兔 发表于 2025-1-22 07:11
OpenAI看来真急了,直接宣布砸4000亿刀开始Stargate计划
closeAI啥时候开源啊
—— 来自 HUAWEI TAH-AN00m, Android 12上的 S1Next-鹅版 v2.2.2.1
moekyo
发表于 2025-1-22 10:57
本帖最后由 moekyo 于 2025-1-22 12:01 编辑
找到了,编辑
myarms
发表于 2025-1-22 12:11
本帖最后由 myarms 于 2025-1-22 12:19 编辑
要理解发生什么事对我这种外行人有些困难,所以相当吃力地看了一个外国科技博主的科普,或者说吹逼
1.deepseek R1开源和学术论文公开是一件行业标志性事件,中国团队能在相对有限的资金投入情况下开发出这模型,对打破美帝在大数据模型的垄断上有里程碑式的意义,能真正推动AI模型的发展,也标志着中国在这一领域的步伐并不落后
2.deepseek重要用途是可以用它来训练其他小模型,极大降低了其他人员资金不足的小团队在AI模型上的开发难度,进一步推动了AI行业的发展
3.根据公布的论文,deepseek R1在商业化版本后面,还有个一个叫deepseek R1 Zero的版本,那玩意目前属于“观察”性质,因为那是个能自我进化的人工智能模型,和需要不断输入新数据训练的大模型不同,deepseek R1 Zero只要输了了一定的数据,并且给予鼓励,它就能不断自行推导,这推动过程还不是线性的,而是会出现类似人类“等等,好像之前的步骤有些问题,我回去看看”这种反应,然后推导出一些人类也不一定能理解的论证过程,那博主举例是AlphaGo的下棋思路,还会出现一些类似“顿悟”之类的推导成果
第三段文字我打出来都觉得有些科幻,我个人没有这方面的知识去判断是不是真的,以下是我看的科普视频看,请自行分析
【美著名AI博主震惊详细解读DeepSeek R1模型】 https://www.bilibili.com/video/B ... df4944d4d95e54b8889
蜇灵
发表于 2025-1-22 12:28
qqks 发表于 2025-1-22 06:11
幻方不是有名的量化公司吗,在缅a割韭菜割得那么爽,还怕亏钱?
这家能做起来,大方的开源,真的要感谢广 ...
这不正是金融市场存在的意义吗,不如说有问题的是整个大环境
VALKIRA
发表于 2025-1-22 12:28
就和六代机一样的
你说美国人从nasa吹过的项目里刨出来一个改吧改吧上天难吗?一点也不难
问题是成本,他已经做不到在可接受的价格内把这玩意搓出来了
美国人现在研发能力还是有的,但是制造业的衰退已经让他失去把大部分科研项目转化为实际商品的能力了
qqks
发表于 2025-1-22 12:40
蜇灵 发表于 2025-1-22 12:28
这不正是金融市场存在的意义吗,不如说有问题的是整个大环境
拿高频交易核动力收割缅a韭菜,然后拿抢来的钱训练开源ai大模型造福全人类,总觉得这里面有点不对
枯风瘦雪
发表于 2025-1-22 12:42
qqks 发表于 2025-1-22 12:40
拿高频交易核动力收割缅a韭菜,然后拿抢来的钱训练开源ai大模型造福全人类,总觉得这里面有点不对 ...
你怎么知道是韭菜不是别的资本
—— 来自 S1Fun
泰坦失足
发表于 2025-1-22 12:48
本帖最后由 泰坦失足 于 2025-1-22 12:52 编辑
https://weibo.com/1564834725/P9rustbTF
平原公子赵胜
#美国山火# 忽然想起一件旧事,就在美国和殖人狂吹人工智能的那档口,英伟达放了个卫星,叫做《人工智能如何帮助加州应对肆虐的野火》。 英伟达吹嘘说可以使用Digitalpath先进的AI技术,利用其GPU强大的性能,配合加州的数千个摄像头,改善卷积神经网络,实时监控山林火灾,甚至可以“预测火灾”…… 听起来简直就是《少数派报告》中的科幻故事,结果,加州山火就在英伟达的和黑科技监控下烧了个通天彻地,不但没能“预测火灾”,甚至连配合消防部门救火都做不到,反而是加州的水库、蓄水池、消防栓都“精准”地没水了,这才是真“人工智能”。 美国的所谓AI在现实中恐怕仅仅是吸引眼球,笼络资本,维护美国霸权的一种政治或科技阳谋。它实在找不到任何更有价值的高科技噱头了。 美国科技公司拼了命地砸资源,拼算力,养大模型,实际上能用的地方很少,投入远远超出产出,所以,本质上还是个金融游戏。 AI有用,但这个用处绝不是什么文字生成、图片生成、视频生成软件……这些事情毫无价值,有人说可以用于系统内部的水论文写报告做方案,可以提高“效率”,然而这件事的结果就是上班混日子的混子越来越多,报告方案的内容越来越水,形式主义越来越严重,效率没有提高,各部门都被垃圾内容塞满了。 你有没有想过——openAI的那条路,是条错路呢?所谓的深度学习、神经网络,本质上还是个“概率统计”,它并不理解一件事的定义、逻辑和原理,而只是靠着大规模的数据投喂“猜出了近似答案”,这种东西,是无法从根本上推动科技进步、提高生产力的。 chatGPT和SORA消耗了巨量的算力和资源,最终拿出来的东西也不过就是些废话生成器、漏洞百出的假视频,效率上还不如国产的Deepseek,DeepSeek的训练成本仅558万美元,训练时长仅两个月,远低于GPT逾1亿美元的成本及约三个月的训练时长。DeepSeek在训练过程中仅使用2048个低端芯片,而GPT用了上万片英伟达高端芯片……而当时号称“震惊世界”的sora,至今还是个半残品,国产的“可灵”已经随便用了,生成视频的水平也远超sora……openAI干的的事情,与其说科技创新,更像是是在烧经费、炒股价、做账。 对于“通用大模型“来说,真正的瓶颈已经来了,因为数据已经喂完了,场景太有限了。已经都没数据训练了,还要那么高的算力和性能干什么?明年,AI算力卡维持今年的出货水平就够用了。以后的瓶颈是数据和算法,算力将步入低速增长…… 这个事情,东大也在跟,但东大因为工业及其发达、电力极为充足,所以东大的方向是多元化、全体系的,并不执着于聊天对话文字图片视频之类的“通用大模型”,而是更多用于交通、运输、气象、工业、工程、城市管理之类的实体领域……这些“数据”都是基于真实世界的,应用也是在真实世界。 从东大最务实的场景来看,未来AI实用领域可能是工业和农业,配合机器人、灵巧手作一些采摘、简单装配的工作,不需要太大算力。搞不好今年就是AI算力需求的顶峰。那么英伟达重金搞高性能高制程计算卡结果可能是赚不了几个钱。最终,最大需求可能维持在性价比制程,比如5nm 7nm甚至是 28nm。 美国几十年科技的停滞,导致他们迫切需要一场科技“放卫星”来提振士气、增加信心……实体工业他们一个都进步不了,只能寄希望于虚无缥缈的“人工智能”。 连美国自己的专家都在喷“你们搞的东西有什么卵用?是让通用汽车生产线自动化了?是让纽约有了智慧城市了?是让美国港口无人化了?还是让美国修好跨海大桥了?………” “这不就是个电子上帝吗”? 还是美国人更懂他们自己,宗教立国的国家,信仰“赛博上帝”,非常合理。 今天,open ai 在deepseek 面前简直一无是处,前者费用是后者的100倍,消耗的算力更高,浪费的资源更多,花费的时间更是好几倍,最终一点正经事都干不了。 这些“放卫星”的破事,还可以追溯到之前的企图去中心化的区块链技术,扎克伯格,黄仁勋等人都要all in的“元宇宙”……一次次的“第四次科技革命”,除了拉高股价割韭菜、赢得远程养殖动物隔海高潮之外,没有任何意义。 在中国的真实AI工业化场景,自动化武器,矿山,港口,机器人面前,美国的AI文字图像视频的实际生产力基本可以忽略…… 当然,也可以说AI“预测”到了加州山火,毕竟今美国保险公司提前停止了加州地区的住宅保险,这算不算“未卜先知”? 但是这种事不需要AI,不需要什么英伟达的先进计算卡,你就算把一条狗绑在加州山林里,它也能当“先知”!
每次看到这种没写过一行代码的鉴证大V指点江山,都在想,mb的这不是胡说八道吗。所以他们说的别的那些,他们真的懂吗?
蜇灵
发表于 2025-1-22 12:58
为什么要看鉴证大V?
alixsander
发表于 2025-1-22 13:40
泰坦失足 发表于 2025-1-22 12:48
https://weibo.com/1564834725/P9rustbTF
平原公子赵胜
看外面那个星际之门的帖子就知道了。大部分人只关注是这边的还是那边的,赢还是输。
而且都没人知道Stargate SG1了
alixsander
发表于 2025-1-24 01:39
o3-mini下周发布,免费账户可用
看来DEEPSEEK把OAI是真打疼了
qqks
发表于 2025-1-24 01:48
他就是免费账户可用,按closeai的尿性也会有一堆限制,哪有自己托管的开源大杯爽快?再说了,一大堆企业部门需要对数据保密更加不会订阅三方模型的在线服务。开源这次是大赢特赢啊
mimighost
发表于 2025-1-24 05:56
alixsander 发表于 2025-1-24 01:39
o3-mini下周发布,免费账户可用
看来DEEPSEEK把OAI是真打疼了
好事情
大家一起加速
机吉斯卡
发表于 2025-1-24 07:59
泰坦失足 发表于 2025-1-22 12:48
https://weibo.com/1564834725/P9rustbTF
平原公子赵胜
这个人就别看了,尤其是技术类的
都这年头了还在说马老板搞不了回收,米国月球登月是假的,航天圈里恶名昭彰
然后这人和知乎恨国带V是一个MCN的,知道了吧
陈乔恩
发表于 2025-1-24 08:50
VALKIRA 发表于 2025-1-22 12:28
就和六代机一样的
你说美国人从nasa吹过的项目里刨出来一个改吧改吧上天难吗?一点也不难
问题是成本,他已 ...
还是不一样,六代机美国基本已经没有制造能力了。但是AI领域是目前美国仅有的同时在软件,设计,硬件,制造领域都有可控性产业链且领先我国的产业,这也是为什么美帝要all in AI的关键
—— 来自 HUAWEI TAH-AN00m, Android 12上的 S1Next-鹅版 v2.2.2.1
枯风瘦雪
发表于 2025-1-24 08:57
陈乔恩 发表于 2025-1-24 08:50
还是不一样,六代机美国基本已经没有制造能力了。但是AI领域是目前美国仅有的同时在软件,设计,硬件,制 ...
这也是为啥一旦AI泡沫吹不下去就会引起恐怖的连锁垮塌的原因……
说实话,哪怕曼哈顿计划,也是给不同技术路线同样的支持和试错机会的,但阿美All in AI这一波却几乎算是同态竞争和内卷了,为了股价让整个研发路径非常不健康
阿尔特曼前一阵还放卫星说会展示他们在可控聚变上取得的进展呢,现在也无声无息了
新人马甲2
发表于 2025-1-24 08:59
本帖最后由 新人马甲2 于 2025-1-24 09:01 编辑
昨晚慕名去试了试deepseek,有被震惊到,不仅可以回答相当复杂的专业翻译问题,而且经得起反复追问,能给出自己判断依据(与后来追加的资料依据能清楚区分开),能自行推断出提供资料中没有清楚解释的部分,能自行检查自己之前的回答有无错漏处
综合来说可以认为它有相当完整的逻辑思维能力,且不大会像之前说的一些模型一样在判断不足的时候直接胡说或瞎编
不过某之前也没用过别的语言模型,不知道和现在的其他尖端模型比怎么样,反正对某来说在专业疑难问题上都很够用了
ddwhzh
发表于 2025-1-24 09:08
泥潭什么时候把水军和赢🐴🐶杀杀呀,deepseek用了一周,对比OpenAI使用体验也就那样,但GPT可以网络搜索,多模态,这就开始赢上天是不是无语了,至少使用体验更上一个台阶再说吧。
弗兰肯斯坦
发表于 2025-1-24 09:26
ddwhzh 发表于 2025-1-24 09:08
泥潭什么时候把水军和赢🐴🐶杀杀呀,deepseek用了一周,对比OpenAI使用体验也就那样,但GPT可以网络搜索, ...
deepseek可以网络搜索的
moekyo
发表于 2025-1-24 09:29
本帖最后由 moekyo 于 2025-1-24 09:35 编辑
ddwhzh 发表于 2025-1-24 09:08
泥潭什么时候把水军和赢🐴🐶杀杀呀,deepseek用了一周,对比OpenAI使用体验也就那样,但GPT可以网络搜索, ...
所以便宜和开源不是使用体验的一环吗,而且deepseek的吹捧最大还是白皮他们,但凡你去搜搜,真就是海外大量好评,然后被“自己人”反思,真的贱
qratosones1337
发表于 2025-1-24 09:37
本帖最后由 qratosones1337 于 2025-1-24 09:40 编辑
ddwhzh 发表于 2025-1-24 09:08
泥潭什么时候把水军和赢🐴🐶杀杀呀,deepseek用了一周,对比OpenAI使用体验也就那样,但GPT可以网络搜索, ...
按你这套逻辑,你自己不就是1450么?明目张胆的造谣胡扯。
DeepSeek一直都支持网络搜索,而且最大的优势是联网和深度推理可以一起开——R1也可以网络搜索,反观GPT,只要开了o1就不能联网了,使用局限性极大。
这还没算写作,R1的创意和文笔对GPT全家都是碾压级吊打
overflowal
发表于 2025-1-24 09:38
本帖最后由 overflowal 于 2025-1-24 09:39 编辑
ddwhzh 发表于 2025-1-24 09:08
泥潭什么时候把水军和赢🐴🐶杀杀呀,deepseek用了一周,对比OpenAI使用体验也就那样,但GPT可以网络搜索, ...
什么体验?我用的api,性价比完爆closeAI,还是开源模型。你这种啥都不提供的"也就这样"党才像水军吧?还没有联网搜索,R1都有联网功能好吧,你爹爹closeAI的O1都没开放呢
—— 来自 鹅球 v3.3.96
枯风瘦雪
发表于 2025-1-24 09:44
overflowal 发表于 2025-1-24 09:38
什么体验?我用的api,性价比完爆closeAI,还是开源模型。你这种啥都不提供的"也就这样"党才像水军吧?还 ...
就ds这条路线,本来就不用啥都比closeai强
它就光是在算力和训练成本有限的前提下,得到一个差距可以接受的开源大模型,就足可以改变业态了
qratosones1337
发表于 2025-1-24 09:48
枯风瘦雪 发表于 2025-1-24 09:44
就ds这条路线,本来就不用啥都比closeai强
它就光是在算力和训练成本有限的前提下,得到一个差距可以接受 ...
R1发布之后就已经不是差距不差距了,这玩意在文学创作方面展现了极其可怕的才能和创意,对比OpenAI全家那都是断崖式吊打,让GPT(4o和o1都包括)看着跟弱智一样那种。
宇洋
发表于 2025-1-24 09:52
ddwhzh 发表于 2025-1-24 09:08
泥潭什么时候把水军和赢🐴🐶杀杀呀,deepseek用了一周,对比OpenAI使用体验也就那样,但GPT可以网络搜索, ...
多模态不清楚,但deepseek是能网络搜索的。
好的,用户需要我帮忙搜索2025年春节联欢晚会的节目名单,任何初稿都可以。首先,我需要从提供的搜索结果中找到相关的信息。用户给的是多个网页结果,其中有些是央视春晚,有些是网络春晚,还有卫视的,比如湖南卫视。得注意区分这些不同的晚会。
网页1、5、7、9都是关于央视春晚的内容。网页1提到了第四次彩排在1月22日进行,并列举了部分节目和主持人。比如歌曲《苹果香》由狼戈演唱,还有周深的《花开忘忧》等。主持人方面,北京主会场是任鲁豫、撒贝宁等,分会场的主持人也列出了。网页5是百度百科的内容,详细介绍了春晚的各个部分,包括吉祥物、分会场设置、技术应用等,但节目单部分可能不够详细。网页7是央视的新闻发布会,提到了主持人阵容和一些创新节目,比如传统建筑创演秀《栋梁》,但具体的节目列表可能不完整。网页9是**的条目,节目单部分有一些歌曲和表演,但看起来可能不完整,比如《倒转地球》由刘德华和张子枫演唱,还有王菲的《世界赠予我的》等,但不确定是否是最新信息。
而网页2、3、4、6、8、10都是关于央视网络春晚的内容,用户可能需要的是央视主春晚的节目单,所以这些可能不太相关。不过用户说任何初稿都可以,所以如果有网络春晚的节目单,也可以考虑是否要包含进去。但根据用户的问题,更可能是在问央视主春晚的节目单。
需要确认的是,网页1和网页5都提到了部分节目。例如,网页1列出的节目包括《苹果香》《花开忘忧》《常回家看看》《伤心太平洋》等,还有戏曲节目如《谁说女子不如男》《唱脸谱》等。网页9**的节目单里有一些不同的歌曲,比如刘德华的《倒转地球》,王菲的《世界赠予我的》,还有戏曲节目《声动梨园》等。这里可能存在不同来源的信息差异,需要确认哪个更准确。
此外,网页5提到总台春晚的节目单中包括创演秀《栋梁》,武术《笔走龙蛇》等,可能和网页1的内容互补。但可能网页1的信息更具体,因为它是彩排后的节目列表,而**可能还在编辑中,信息可能不全。
另外,注意时间,今天是2025年1月24日,而央视春晚的正式播出时间是1月28日,所以用户可能想要的是已经公布的彩排节目单,即初稿。网页1是第四次彩排后的节目单,可能比较接近最终版本,而网页9的**可能还在更新中,但不确定其准确性。
需要综合网页1、5、7、9的信息,整理出节目名单。可能需要指出这些是彩排中的节目,实际播出可能会有变动。比如,网页1中的节目列表较为详细,包括多个歌曲、舞蹈、戏曲节目,而网页9的**有更多其他节目,比如刘德华、王菲的歌曲,但需要确认是否可靠。此外,网页5提到《世界赠予我的》由王菲演唱,这可能是一个重要信息。
因此,整理出的节目单可能包含网页1中的节目列表,并补充网页5和网页9中的部分内容,同时注明这些是初稿或彩排中的节目,可能变动。需要引用对应的网页编号作为来源,比如网页1、网页5、网页9。
还需要注意主持人信息,网页1、5、7、9都提到了主持人阵容,但用户主要需要节目名单,这部分可以简要提及,但重点放在节目上。
总结:需要将网页1中的节目列表作为主要来源,结合其他网页中的补充信息,整理出央视春晚的初稿节目名单,并注明来源和可能的变动。
根据搜索结果,2025年中央广播电视总台春节联欢晚会(央视春晚)的节目单(初稿或彩排版本)已部分公布,以下是目前可汇总的信息:
2025年央视春晚节目单(初稿/彩排版)
歌曲类
《苹果香》 演唱:狼戈1
《花开忘忧》 演唱:周深1
《常回家看看》 演唱:蔡国庆、包贝尔、月亮1
《伤心太平洋》 演唱:任贤齐1
《祝您平安》 演唱:孙悦,表演:中国残疾人艺术团1
《世界赠予我的》 演唱:王菲(**版本)9
《倒转地球》 演唱:刘德华、张子枫(**版本)9
《孤勇者》 演唱:陈奕迅,联合奥运冠军(**版本)9
舞蹈与技艺类
《奔腾》 领舞:姜铁红1
《千年莫高 乐动敦煌》 乐器演奏:章益、王梓等;舞蹈:王晓婷、刘丽丽等1
《笔走龙蛇》 武术表演(**版本)9
芭蕾舞《伊人》(**版本)9
戏曲与传统文化类
《谁说女子不如男》 演唱:小香玉1
《唱脸谱》 表演:阎鹤祥、北京戏娃京剧团1
京剧《定军山》选段 表演:王珮瑜1
《声动梨园》 戏曲联演(**版本)9
创演秀《栋梁》 以榫卯结构、北京中轴线为灵感,结合三维建筑模型与虚拟技术(新闻发布会提及)79
语言类节目
小品、相声等节目尚未公布具体名称,但彩排中提到“现场喜气洋洋、笑声不断”15。
分会场特色节目
重庆分会场:巴渝歌舞与年俗表演57
西藏拉萨分会场:民族风情表演,如藏舞与民族团结主题环节57
江苏无锡分会场:传统曲调与现代情景演绎结合5
湖北武汉分会场:新派戏曲与经典影视IP融合5
其他亮点节目
《将进酒》 演唱:厨戏乐队1
《四季人生》 演唱:林晓峰1
《一格格》 演唱:卫兰1
主持人阵容
北京主会场:任鲁豫、撒贝宁、尼格买提、龙洋、马凡舒
分会场:
重庆:张韬、何苗苗
湖北武汉:杨帆、陈超
西藏拉萨:朱迅、斯塔罗布
江苏无锡:王音棋、李好157
补充说明
技术应用:晚会采用虚拟现实、裸眼3D、8K超高清等技术,例如《栋梁》通过XR与数字孪生技术呈现古建筑三维模型79;首次推出视障与听障版无障碍转播,结合AI语音与AR手语解说57。
主题与吉祥物:以“巳巳如意,生生不息”为主题,吉祥物为青绿色“巳升升”,灵感源自甲骨文“巳”字59。
以上信息基于彩排及部分官方发布内容整理,最终节目以1月28日除夕夜(20:00)正式播出为准157。如需完整节目单,可关注央视官方渠道或查看直播。
枯风瘦雪
发表于 2025-1-24 09:52
qratosones1337 发表于 2025-1-24 09:48
R1发布之后就已经不是差距不差距了,这玩意在文学创作方面展现了极其可怕的才能和创意,对比OpenAI全家那 ...
嗯,DS很神奇的展示出了可用的文学创作能力,这个就很有意思,也不知道是咋涌现的
万恶淫猥手
发表于 2025-1-24 09:59
我们的 Agent 已经准备切换到 DeepSeek 了,测试中的效果比我们之前在用的 4o 要好的
新人马甲2
发表于 2025-1-24 10:10
本帖最后由 新人马甲2 于 2025-1-24 10:21 编辑
联网这块,某最惊讶的是deepseek在不联网取得额外信息的情况下就能给出相当完整且逻辑性强的回答,然后它自己说自己并不需要利用太多即时分配的算力和联网信息,算力影响的主要是响应时间而非回答准确性,所谓的算力不足导致瞎答很大程度上是训练不充分、内置的判断逻辑不足、对提问理解不准确、以及模型训练时过度要求回答流畅性云云(昨晚问的,具体内容不记得那么多了,大意如此,另外这方面肯定是开发者预设了答案的,谨慎采信吧)
另外它有一句回答中它给出了一个虚构的依据进行举例,某一开始没留意以为是联网得到的新结果,它还能自己意识到上面那个举例有可能误导了某,提出将来会更加高亮显示“此依据为虚构”的改进建议
反正是比某听说的其他语言模型的表现要强得多的,某暂时也没有马上开个别的会员去对比的兴趣(反正现在别的语言模型厂商已经开始恐慌了),只能说确实非常够用了
可靠性方面,虽然也存在一些一开始给出的推断嫌草率的情况,但起码比很多人类靠谱了,而且过程可查
通心粉
发表于 2025-1-24 10:16
太乐了
https://mp.weixin.qq.com/s/xVux1jo1nLpSSrt7JlxfKA
最先陷入恐慌的,似乎是同样推崇开源的 Meta。
最近,有 Meta 员工在美国匿名职场社区 teamblind 上面发布了一个帖子。帖子提到,国内 AI 创业公司 DeepSeek 最近的一系列动作让 Meta 的生成式 AI 团队陷入了恐慌,因为在前者的低成本高歌猛进下,后者无法解释自己的超高预算的合理性。
原文如下:
这一切始于 DeepSeek-V3,它在基准测试中就已经让 Llama 4 落后。更糟糕的是那个「拥有 550 万训练预算的不知名中国公司」。
工程师们正在疯狂地分析 DeepSeek,试图从中复制任何可能的东西。这一点都不夸张。
管理层担心如何证明庞大的生成式 AI 组织的成本是合理的。当生成式 AI 组织中的每个「领导」的薪资都比训练整个 DeepSeek-V3 的成本还要高,而我们有好几十个这样的「领导」时,他们要如何面对高层?
DeepSeek-R1 让情况变得更加可怕。虽然我不能透露机密信息,但这些很快就会公开。
这本应该是一个以工程为重点的小型组织,但是因为很多人想要参与进来分一杯羹,人为地膨胀了组织的招聘规模,结果每个人都成了输家。
stanzgy
发表于 2025-1-24 10:16
deepseek目前看唯一欠缺的就是多模态能力,其他方面当前阶段看非常不错了,说实话多模态现在用的并不多,也没有什么场景强需求这个。
工作里token使用量最大的还是接到vscode vim各种插件里,sonnet 3.5/qwen coder都用过,现在已经切到deepseek了
论坛助手,iPhone
thermite
发表于 2025-1-24 10:29
联网搜索+深度思考真的薄纱其它一众模型
比如我问2024年的台风资料,它不会跟我瞎JB轱辘一长串COT然后给出一个巨他妈离谱的错误答案
没开联网的时候它直接跟你说我不会,开联网它能给你个准确的总结归纳
至于说它的专业能力——要么自己微调,要么等深度求索自己公布更专业细分的模型
现在的程度已经够一般人使用了
moekyo
发表于 2025-1-24 10:36
stanzgy 发表于 2025-1-24 10:16
deepseek目前看唯一欠缺的就是多模态能力,其他方面当前阶段看非常不错了,说实话多模态现在用的并不多,也 ...
我觉得最大问题是,我不能截图甩给它说,这里的实现有问题,改一下
页:
1
2
3
4
[5]
6
7
8
9
10
11
12
13