找回密码
 立即注册
搜索
查看: 20781|回复: 82

[科技] 慎用腾讯元宝

[复制链接]
     
发表于 2025-2-27 20:53 | 显示全部楼层 |阅读模式
号称是DS满血版,写出的东西也像模像样的,但细细一看就让人大吃一惊,他文章中给出的非常多的论据,例如某报说了什么话,或者某人说了什么话,你去做事实核查根本查不到信源 ,并且他给出的作为参考资料的网页里面也找不到相关的能证明其说法的东西,这就很离谱。
回复

使用道具 举报

     
发表于 2025-2-27 20:54 | 显示全部楼层
现在AI的特点:喜欢瞎编
回复

使用道具 举报

     
发表于 2025-2-27 20:56 | 显示全部楼层
官网的DS也这样吧,也有很多内容是编的
回复

使用道具 举报

     
发表于 2025-2-27 20:56 | 显示全部楼层
ai都是这样,ds的幻觉问题还是比较严重的,里面的资料数据肯定不能直接用,会瞎编,起码在用之前要自己查阅确认一遍。
回复

使用道具 举报

     
发表于 2025-2-27 20:56 | 显示全部楼层
老生常谈了
回复

使用道具 举报

     
发表于 2025-2-27 20:57 | 显示全部楼层
这个DS不也一样吗?一样喜欢编,纠正了也不改,而是把纠正的内容再缝进去编个新的出来
回复

使用道具 举报

     
发表于 2025-2-27 20:57 | 显示全部楼层
DS官网不会吧,我用grok3搜不到的,用DS都搜到Nature上去了
回复

使用道具 举报

发表于 2025-2-27 20:57 来自手机 | 显示全部楼层
把温度调低一些,就可以避免这种
回复

使用道具 举报

     
 楼主| 发表于 2025-2-27 20:59 | 显示全部楼层
本帖最后由 teufelsy 于 2025-2-27 21:00 编辑
汪达 发表于 2025-2-27 20:56
官网的DS也这样吧,也有很多内容是编的

DS有的时候也有这样的毛病,我也发现了,最好玩的就是我让腾讯元宝对我怀疑的某些条目进行事实核查的时候,他居然给我编了一整套事实核查的内容,并跟我说来源没问题,的确有这样的来源……然后我放狗去搜,完全搜不到……
回复

使用道具 举报

     
发表于 2025-2-27 21:00 | 显示全部楼层
AI连意义都不理解,怎么可能知道自己说的是对是错……
回复

使用道具 举报

     
发表于 2025-2-27 21:03 | 显示全部楼层
teufelsy 发表于 2025-2-27 20:59
DS有的时候也有这样的毛病,我也发现了,最好玩的就是我让腾讯元宝对我怀疑的某些条目进行事实核查的时候 ...

官网DS也是这样的,我问过一些历史问题,问出处,也是会编一些根本不存在的来源
回复

使用道具 举报

     
发表于 2025-2-27 21:08 | 显示全部楼层
就是编的啊,哪个ai都这样,我让他解答一些面试分析题,都给给你编出来很多那位大人没说过的话
回复

使用道具 举报

     
发表于 2025-2-27 21:10 来自手机 | 显示全部楼层
我输入“请分析以下代码”,代码还没粘上去就敲了回车,然后ai给我回了一大段分析……

—— 来自 HUAWEI NOH-AN00, Android 12上的 S1Next-鹅版 v2.5.4
回复

使用道具 举报

     
发表于 2025-2-27 21:10 来自手机 | 显示全部楼层
你对生成式ai的原理可能有些误解,建议看点简单易懂的原理介绍,再理解一下为什么概率模型天然带有幻觉,或者说幻觉才是他的实质。

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

     
发表于 2025-2-27 21:12 | 显示全部楼层
信息来源应该是微信公众号吧,联网搜索会给来源
回复

使用道具 举报

     
发表于 2025-2-27 21:14 | 显示全部楼层




论坛助手,iPhone

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

     
发表于 2025-2-27 21:16 | 显示全部楼层
腾讯那个不能开联网搜索,公众号的权重过高,反而会降低AI能力
回复

使用道具 举报

     
发表于 2025-2-27 21:21 来自手机 | 显示全部楼层
你跟它描述某网站的子页面名称,它找不到会编一个网址出来的
不信试试
回复

使用道具 举报

     
发表于 2025-2-27 21:22 | 显示全部楼层
鹅厂给公众号很大权重,结果就是D指导恶堕了
大家都知道的,90%以上的公众号只生产文字垃圾
回复

使用道具 举报

     
发表于 2025-2-27 21:22 | 显示全部楼层
现阶段的AI不光自己产生幻觉,还能给人带来它是真的在思考的幻觉
回复

使用道具 举报

     
发表于 2025-2-27 21:27 来自手机 | 显示全部楼层
这也不是什么新鲜事啊。从transformer开始火起来的对话ai本来就只会说出流畅的对话,但是对话的内容从来都没多少完全准确的。

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

     
发表于 2025-2-27 21:33 | 显示全部楼层
元宝的联网搜索能力是真的不太行,甚至没法指定只采信某几个公众号,一联网就给我塞垃圾公众号文章进去
回复

使用道具 举报

     
发表于 2025-2-27 21:34 来自手机 | 显示全部楼层
ai并没有“现实世界”这个认知,在现在的发展程度下它是人为的被调低了非黑即白的逻辑判断力后才显得可以像人一样对话,换言之它没有撒谎的“道德”负担。不是说它不能更严谨,但可能通过普通prompt形式达不到
回复

使用道具 举报

     
发表于 2025-2-27 21:36 | 显示全部楼层
瞎编论据参考文献也不算什么,问题是它连个简单的应用题都能算错。

本来想着用AI省力的,但还是自己来吧。
回复

使用道具 举报

发表于 2025-2-27 21:44 | 显示全部楼层
ai本来就会胡编

—— 来自 S1Fun
回复

使用道具 举报

     
发表于 2025-2-27 21:46 | 显示全部楼层
widder 发表于 2025-2-27 20:54
现在AI的特点:喜欢瞎编

你是开服就注册了么??
回复

使用道具 举报

     
发表于 2025-2-27 21:48 | 显示全部楼层
这两天刷小破站,用元宝搜了几个抽象梗,一个也答不出来,感觉不如Kimi
回复

使用道具 举报

发表于 2025-2-27 21:52 来自手机 | 显示全部楼层
kimi有时会提供联网搜索到结果,这点还不错 方便验证
回复

使用道具 举报

     
发表于 2025-2-27 21:57 来自手机 | 显示全部楼层
我司的ai今天信誓旦旦跟我说deepseek是阿里云开发的,还给我编出了四五个来源,还带链接
回复

使用道具 举报

     
发表于 2025-2-27 21:59 来自手机 | 显示全部楼层
元宝最要命的是读图文字都读不好
回复

使用道具 举报

     
发表于 2025-2-27 22:11 | 显示全部楼层
今天用ds写教案出题还不错,就是要求只满足了8成,10道题有2道考法错了,不过也比学科网收费的要好
回复

使用道具 举报

     
发表于 2025-2-27 22:12 来自手机 | 显示全部楼层
大语言模型都是这样的。
回复

使用道具 举报

     
发表于 2025-2-27 22:24 | 显示全部楼层
代码这块还好,起码能立马验证一次,不对了还能回头,其他的不行,我只敢自己写
回复

使用道具 举报

     
发表于 2025-2-27 22:40 | 显示全部楼层
感觉D指导这一波让很多没用过的LLM的人用上LLM了
回复

使用道具 举报

     
发表于 2025-2-27 22:42 | 显示全部楼层
现在AI大模型都有瞎编的毛病,而且能不要联网就不要联网
回复

使用道具 举报

     
发表于 2025-2-27 23:02 | 显示全部楼层
幻觉的概率比以前低,但还是存在的,而且更隐蔽了,偶尔还是会出现癫狂的呓语,直到超时才能停下来。
回复

使用道具 举报

     
发表于 2025-2-27 23:07 来自手机 | 显示全部楼层
没部署好吧,跟我用 vLLM 部署的似的,稍微花点时间调一下会好很多
回复

使用道具 举报

     
发表于 2025-2-27 23:10 | 显示全部楼层
deepseek原版不到10mb, 腾讯元宝接近200mb, 我就没敢下, 不知道里面都塞了什么东西
回复

使用道具 举报

     
发表于 2025-2-27 23:12 来自手机 | 显示全部楼层
我现在有ds的api都不知道在哪用……
回复

使用道具 举报

     
发表于 2025-2-27 23:36 | 显示全部楼层
从chatgpt诞生之初就有的AI幻觉还要单独发帖啊
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2025-3-4 02:57 , Processed in 0.142760 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表