找回密码
 立即注册
搜索
楼主: teufelsy

[科技] 慎用腾讯元宝

[复制链接]
发表于 2025-2-27 23:40 | 显示全部楼层
要我说这玩意儿现在就不该叫AI。
直接叫大数据语模+资料整合器还差不多。
回复

使用道具 举报

     
发表于 2025-2-27 23:42 | 显示全部楼层
DS的幻觉水平大概在2.4%左右,中流水平
回复

使用道具 举报

     
发表于 2025-2-27 23:46 | 显示全部楼层
even001 发表于 2025-2-27 23:36
从chatgpt诞生之初就有的AI幻觉还要单独发帖啊

市场下沉了啊 之前肯定都没用过
回复

使用道具 举报

发表于 2025-2-28 00:23 来自手机 | 显示全部楼层
信源微信公众号,公众号信源不写四舍五入就是传谣了已经
回复

使用道具 举报

     
发表于 2025-2-28 00:57 来自手机 | 显示全部楼层
本帖最后由 仓岛千百合 于 2025-2-28 00:58 编辑

第一次用ai?
DS幻觉水平在全世界所有ai里也就中等级别。不够看。

回复

使用道具 举报

     
发表于 2025-2-28 01:06 | 显示全部楼层
我让ai帮我做合法性审查,他说的都很有道理,但是他引用的发条基本都不太对,也不是完全不对,但是你去看他说的那一条基本写的都不是他说的东西很神奇
回复

使用道具 举报

     
发表于 2025-2-28 01:06 | 显示全部楼层
我用多个模型交叉验证答案,就是慢
回复

使用道具 举报

     
发表于 2025-2-28 07:23 来自手机 | 显示全部楼层
前两天用kimi套格式,有个加乘法算出来是112223元,他给我按111223往后算,让我验算了半天。甚至我问他怎么回事他说这是一个打字错误
回复

使用道具 举报

     
发表于 2025-2-28 07:56 来自手机 | 显示全部楼层
ds也一样,不信问一下“暗黑3怎么做牧牛杖”,这个问题是ai试金石
回复

使用道具 举报

     
发表于 2025-2-28 08:13 | 显示全部楼层
谢谢楼主提醒,我最近确实用元宝比较多。因为这个响应最快了。
回复

使用道具 举报

     
发表于 2025-2-28 08:29 | 显示全部楼层
本帖最后由 1096beam 于 2025-2-28 09:14 编辑

我看很多人聊起天来各种数据也是信手拈来啊
回复

使用道具 举报

     
发表于 2025-2-28 08:33 来自手机 | 显示全部楼层
本帖最后由 中已矣 于 2025-2-28 08:42 编辑

我让ai断网分析过s1用户,他编了很多账号出来分析,我让ai分析中韩棋院如果当时现场申述年前裁判问题会怎么处理,他编了很多比赛规则以及其他相关内容,等我问他出处,他会编网址,当我质疑他是假的他会编新的。编的内容有条有款煞有其事
回复

使用道具 举报

     
发表于 2025-2-28 08:37 | 显示全部楼层
是这样的,而且仔细一看信源一大堆微信公众号或者百度百科·····完全不可靠
回复

使用道具 举报

     
发表于 2025-2-28 08:38 | 显示全部楼层
大模型幻觉,你可以要求对举例严格出处,能好一点
回复

使用道具 举报

     
发表于 2025-2-28 08:41 来自手机 | 显示全部楼层
现在ai都是混着用的
ds最大的优点就是知道他有思考过程,并且是智能最高的搜索ai
但是文字处理还是相信gpt
回复

使用道具 举报

     
发表于 2025-2-28 09:06 来自手机 | 显示全部楼层
phoenixxj 发表于 2025-2-28 08:41
现在ai都是混着用的
ds最大的优点就是知道他有思考过程,并且是智能最高的搜索ai
但是文字处理还是相信gpt ...

信GPT不如信我是秦始皇
回复

使用道具 举报

     
发表于 2025-2-28 09:30 | 显示全部楼层
本帖最后由 phoenixxj 于 2025-2-28 09:31 编辑
空気力学 发表于 2025-2-28 09:06
信GPT不如信我是秦始皇

gpt作为文字处理相当好用
他理解能力很好,你不需要输入繁琐的指令
而且很少僭越你的命令
举个最简单的例子
让元宝(姑且认为他是目前非本家最好用的ds吧)
处理一些最基础的文字,比如删除括号以及括号内的文字(无法通过word进行一键替换)  并且严格要求他不允许改动其他文字。他不仅会给你改,还会自己增加额外的内容
本家可能同样能做的很好,但是本家因为网络繁忙,基本我都会在能使用的情况下询问一些更具有建设性的问题。
而且其他一些弱智模型,没办法准确理解你的含义,而且处理也有缺陷。
用来用去还是gpt4.0好用
回复

使用道具 举报

     
发表于 2025-2-28 10:53 | 显示全部楼层
phoenixxj 发表于 2025-2-28 09:30
gpt作为文字处理相当好用
他理解能力很好,你不需要输入繁琐的指令
而且很少僭越你的命令

删除括号以及括号内的文字,用woed的替换功能将(*)替换为空不是就可以吗
回复

使用道具 举报

     
发表于 2025-2-28 10:59 | 显示全部楼层
马桶3 发表于 2025-2-28 10:53
删除括号以及括号内的文字,用woed的替换功能将(*)替换为空不是就可以吗 ...

我就举个例子
用来测试ai的,毕竟这如果都做不好那更复杂的就没法用了。
回复

使用道具 举报

     
发表于 2025-2-28 12:20 | 显示全部楼层
AI编代码的时候也经常找些不知道哪里来的野鸡API信誓旦旦说可以用
回复

使用道具 举报

     
发表于 2025-2-28 12:46 | 显示全部楼层
这破玩意默认用的腾讯混元模型
回复

使用道具 举报

     
发表于 2025-2-28 12:52 来自手机 | 显示全部楼层
所以我用元宝从来不开联网搜索,效果会好很多,至少不用吃公众号的二手便便

要用到联网搜索的时候就换回d指导本体app吧
回复

使用道具 举报

     
发表于 2025-2-28 12:54 | 显示全部楼层
simonroam 发表于 2025-2-27 21:22
现阶段的AI不光自己产生幻觉,还能给人带来它是真的在思考的幻觉

人类在思考没准大多数情况也是幻觉
回复

使用道具 举报

     
发表于 2025-2-28 13:24 来自手机 | 显示全部楼层
千万不要把大语言模型真的当成搜索引擎为你搜索/生成时讯内容,但与之相反,让deepseek为你辅助代码,翻译,解题,讲述科学内容是很好用的。
回复

使用道具 举报

     
发表于 2025-2-28 13:28 来自手机 | 显示全部楼层
长生久视 发表于 2025-2-28 07:56
ds也一样,不信问一下“暗黑3怎么做牧牛杖”,这个问题是ai试金石

我看了下好像没啥问题

—— 来自 鹅球 v3.3.96-alpha
回复

使用道具 举报

     
发表于 2025-2-28 13:28 来自手机 | 显示全部楼层
长生久视 发表于 2025-2-28 07:56
ds也一样,不信问一下“暗黑3怎么做牧牛杖”,这个问题是ai试金石

我看了下好像没啥问题

—— 来自 鹅球 v3.3.96-alpha
回复

使用道具 举报

发表于 2025-2-28 13:31 | 显示全部楼层
飞霞精灵 发表于 2025-2-27 23:40
要我说这玩意儿现在就不该叫AI。
直接叫大数据语模+资料整合器还差不多。 ...

说白了现在的AI就类似一个人背了无数本超级无敌大辞典,但是还是没背全,靠的只是惊人的记忆力和总结能力把答案背出来了,但一涉及到逻辑性就没了……现在看到的逻辑问题其实也是在背答案
回复

使用道具 举报

     
发表于 2025-2-28 13:34 | 显示全部楼层
长生久视 发表于 2025-2-28 07:56
ds也一样,不信问一下“暗黑3怎么做牧牛杖”,这个问题是ai试金石

试金石有点太夸张了,只是恰巧在他知识范围内罢了。我之前问原版DS暗黑地牢的阵容搭配,原版DS跟我说修女可以拿来刷压力,反倒是我司自己接入的不知名AI说出了阵容回压不足和AOE不够的问题
回复

使用道具 举报

     
发表于 2025-2-28 14:27 来自手机 | 显示全部楼层
阿卵真是牛逼 发表于 2025-2-28 13:34
试金石有点太夸张了,只是恰巧在他知识范围内罢了。我之前问原版DS暗黑地牢的阵容搭配,原版DS跟我说修女 ...

ds也不能完全答对牧牛杖的做法,只不过其他大模型更差
回复

使用道具 举报

     
发表于 2025-2-28 14:54 | 显示全部楼层
hftrrt 发表于 2025-2-28 12:46
这破玩意默认用的腾讯混元模型

废话,本来就是混元的APP,就是多加了个DS。你们是多看一眼点切换都懒哦?
回复

使用道具 举报

     
发表于 2025-2-28 15:17 | 显示全部楼层
黑暗之眼 发表于 2025-2-28 14:54
废话,本来就是混元的APP,就是多加了个DS。你们是多看一眼点切换都懒哦? ...

广告宣传只字不提,号称是满血dp
回复

使用道具 举报

     
发表于 2025-2-28 15:22 来自手机 | 显示全部楼层
瞎编就可怕了……
回复

使用道具 举报

     
发表于 2025-2-28 15:40 | 显示全部楼层
无恨 发表于 2025-2-27 21:12
信息来源应该是微信公众号吧,联网搜索会给来源

这不更完犊子了吗
回复

使用道具 举报

     
发表于 2025-2-28 15:47 来自手机 | 显示全部楼层
hftrrt 发表于 2025-2-28 15:17
广告宣传只字不提,号称是满血dp

有各种各样的前端,不管是本就开源的还是各家自己的
deepseek开源的模型大家都能部署,都能接入
于是确实可以在腾讯元宝这个软件里切换到deepseek的模型来使用,话是这么说……

只是你得自己从混元切过去。
我操你的腾讯,我给家里人介绍完之后,有人就中招下成这个了。
回复

使用道具 举报

发表于 2025-2-28 18:34 | 显示全部楼层
用D老师分析了小区充电IC卡的的数据,余额是明文记录的,但后面还有个校验码,问了好几家D老师,都信誓旦旦的说是CRC-16/MODBUS算法,还编程计算,都说自己算的是对的,我自己找了个crc计算的网站从crc8到crc32,没有一个能和D老师的结果对得上,但看多次观看D老师的思考过程给了不少启发,修改要求词和去除无关数据后还是靠着D老师算出来了
回复

使用道具 举报

     
发表于 2025-2-28 18:46 来自手机 | 显示全部楼层
ds原版就很会瞎编,而且还喜欢指点江山。你让他翻译全文他总结,你让它逐页翻译它偷懒
回复

使用道具 举报

     
发表于 2025-2-28 18:50 | 显示全部楼层
本帖最后由 allegray 于 2025-2-28 18:56 编辑

https://zhuanlan.zhihu.com/p/26343102498
有人测的国内4个平台DeepSeek R1的性能对比测试。不过他测的是api。
回复

使用道具 举报

     
发表于 2025-2-28 18:57 来自手机 | 显示全部楼层
汪达 发表于 2025-2-27 20:56
官网的DS也这样吧,也有很多内容是编的

不止编,你指出他编的内容有问题,他还会煞有介事的给你解释半天,你坚持他是错的他会给你再编一段
回复

使用道具 举报

     
发表于 2025-2-28 19:33 来自手机 | 显示全部楼层
用过一段时间腾讯元宝,让他给我按模板修正文本格式,总是前几篇按要求做,之后的就疯狂画蛇添足。

也不知道有什么毛病,提要求修正也没用,我行我素,用的人血压都高了……
回复

使用道具 举报

     
发表于 2025-2-28 20:56 来自手机 | 显示全部楼层
问它我家在哪个街道都能给我胡编一个…
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2025-3-4 07:04 , Processed in 0.207606 second(s), 4 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表