慎用腾讯元宝

飞霞精灵 · 发表于 2025-2-27 23:40

要我说这玩意儿现在就不该叫AI。
直接叫大数据语模+资料整合器还差不多。

随风来去 · 发表于 2025-2-27 23:42

DS的幻觉水平大概在2.4%左右，中流水平

烦死了 · 发表于 2025-2-27 23:46

even001 发表于 2025-2-27 23:36
从chatgpt诞生之初就有的AI幻觉还要单独发帖啊

市场下沉了啊之前肯定都没用过

凯尔薇斯 · 发表于 2025-2-28 00:23

信源微信公众号，公众号信源不写

四舍五入就是传谣了已经

仓岛千百合 · 发表于 2025-2-28 00:57

本帖最后由仓岛千百合于 2025-2-28 00:58 编辑

第一次用ai?
DS幻觉水平在全世界所有ai里也就中等级别。不够看。

goranger · 发表于 2025-2-28 01:06

我让ai帮我做合法性审查，他说的都很有道理，但是他引用的发条基本都不太对，也不是完全不对，但是你去看他说的那一条基本写的都不是他说的东西

很神奇

卡嘎米 · 发表于 2025-2-28 01:06

我用多个模型交叉验证答案，就是慢

wing130083 · 发表于 2025-2-28 07:23

前两天用kimi套格式，有个加乘法算出来是112223元，他给我按111223往后算，让我验算了半天。甚至我问他怎么回事他说这是一个打字错误

长生久视 · 发表于 2025-2-28 07:56

ds也一样，不信问一下“暗黑3怎么做牧牛杖”，这个问题是ai试金石

子虚乌有 · 发表于 2025-2-28 08:13

谢谢楼主提醒，我最近确实用元宝比较多。因为这个响应最快了。

1096beam · 发表于 2025-2-28 08:29

本帖最后由 1096beam 于 2025-2-28 09:14 编辑

我看很多人聊起天来各种数据也是信手拈来啊

中已矣 · 发表于 2025-2-28 08:33

本帖最后由中已矣于 2025-2-28 08:42 编辑

我让ai断网分析过s1用户，他编了很多账号出来分析，我让ai分析中韩棋院如果当时现场申述年前裁判问题会怎么处理，他编了很多比赛规则以及其他相关内容，等我问他出处，他会编网址，当我质疑他是假的他会编新的。编的内容有条有款煞有其事

触手皇帝 · 发表于 2025-2-28 08:37

是这样的，而且仔细一看信源一大堆微信公众号或者百度百科·····完全不可靠

yangkaim4 · 发表于 2025-2-28 08:38

大模型幻觉，你可以要求对举例严格出处，能好一点

phoenixxj · 发表于 2025-2-28 08:41

现在ai都是混着用的
ds最大的优点就是知道他有思考过程，并且是智能最高的搜索ai
但是文字处理还是相信gpt

空気力学 · 发表于 2025-2-28 09:06

phoenixxj 发表于 2025-2-28 08:41
现在ai都是混着用的
ds最大的优点就是知道他有思考过程，并且是智能最高的搜索ai
但是文字处理还是相信gpt ...

信GPT不如信我是秦始皇

phoenixxj · 发表于 2025-2-28 09:30

本帖最后由 phoenixxj 于 2025-2-28 09:31 编辑

空気力学发表于 2025-2-28 09:06
信GPT不如信我是秦始皇

gpt作为文字处理相当好用
他理解能力很好，你不需要输入繁琐的指令
而且很少僭越你的命令
举个最简单的例子
让元宝（姑且认为他是目前非本家最好用的ds吧）
处理一些最基础的文字，比如删除括号以及括号内的文字（无法通过word进行一键替换）并且严格要求他不允许改动其他文字。他不仅会给你改，还会自己增加额外的内容
本家可能同样能做的很好，但是本家因为网络繁忙，基本我都会在能使用的情况下询问一些更具有建设性的问题。
而且其他一些弱智模型，没办法准确理解你的含义，而且处理也有缺陷。
用来用去还是gpt4.0好用

马桶3 · 发表于 2025-2-28 10:53

phoenixxj 发表于 2025-2-28 09:30
gpt作为文字处理相当好用
他理解能力很好，你不需要输入繁琐的指令
而且很少僭越你的命令

删除括号以及括号内的文字，用woed的替换功能将（*）替换为空不是就可以吗

phoenixxj · 发表于 2025-2-28 10:59

马桶3 发表于 2025-2-28 10:53
删除括号以及括号内的文字，用woed的替换功能将（*）替换为空不是就可以吗 ...

我就举个例子
用来测试ai的，毕竟这如果都做不好那更复杂的就没法用了。

好想破坏 · 发表于 2025-2-28 12:20

AI编代码的时候也经常找些不知道哪里来的野鸡API信誓旦旦说可以用

hftrrt · 发表于 2025-2-28 12:46

这破玩意默认用的腾讯混元模型

oh_my_god · 发表于 2025-2-28 12:52

所以我用元宝从来不开联网搜索，效果会好很多，至少不用吃公众号的二手便便

要用到联网搜索的时候就换回d指导本体app吧

鸳鸳相抱 · 发表于 2025-2-28 12:54

simonroam 发表于 2025-2-27 21:22
现阶段的AI不光自己产生幻觉，还能给人带来它是真的在思考的幻觉

人类在思考没准大多数情况也是幻觉

香港记者巴拉森 · 发表于 2025-2-28 13:24

千万不要把大语言模型真的当成搜索引擎为你搜索/生成时讯内容，但与之相反，让deepseek为你辅助代码，翻译，解题，讲述科学内容是很好用的。

fei狗 · 发表于 2025-2-28 13:28

长生久视发表于 2025-2-28 07:56
ds也一样，不信问一下“暗黑3怎么做牧牛杖”，这个问题是ai试金石

我看了下好像没啥问题

—— 来自鹅球 v3.3.96-alpha

fei狗 · 发表于 2025-2-28 13:28

长生久视发表于 2025-2-28 07:56
ds也一样，不信问一下“暗黑3怎么做牧牛杖”，这个问题是ai试金石

我看了下好像没啥问题

—— 来自鹅球 v3.3.96-alpha

酱豆腐 · 发表于 2025-2-28 13:31

飞霞精灵发表于 2025-2-27 23:40
要我说这玩意儿现在就不该叫AI。
直接叫大数据语模+资料整合器还差不多。 ...

说白了现在的AI就类似一个人背了无数本超级无敌大辞典，但是还是没背全，靠的只是惊人的记忆力和总结能力把答案背出来了，但一涉及到逻辑性就没了……现在看到的逻辑问题其实也是在背答案

阿卵真是牛逼 · 发表于 2025-2-28 13:34

长生久视发表于 2025-2-28 07:56
ds也一样，不信问一下“暗黑3怎么做牧牛杖”，这个问题是ai试金石

试金石有点太夸张了，只是恰巧在他知识范围内罢了。我之前问原版DS暗黑地牢的阵容搭配，原版DS跟我说修女可以拿来刷压力

，反倒是我司自己接入的不知名AI说出了阵容回压不足和AOE不够的问题

长生久视 · 发表于 2025-2-28 14:27

阿卵真是牛逼发表于 2025-2-28 13:34
试金石有点太夸张了，只是恰巧在他知识范围内罢了。我之前问原版DS暗黑地牢的阵容搭配，原版DS跟我说修女 ...

ds也不能完全答对牧牛杖的做法，只不过其他大模型更差

黑暗之眼 · 发表于 2025-2-28 14:54

hftrrt 发表于 2025-2-28 12:46
这破玩意默认用的腾讯混元模型

废话，本来就是混元的APP，就是多加了个DS。你们是多看一眼点切换都懒哦？

hftrrt · 发表于 2025-2-28 15:17

黑暗之眼发表于 2025-2-28 14:54
废话，本来就是混元的APP，就是多加了个DS。你们是多看一眼点切换都懒哦？ ...

广告宣传只字不提，号称是满血dp

胜改藏 · 发表于 2025-2-28 15:22

瞎编就可怕了……

whyczc · 发表于 2025-2-28 15:40

无恨发表于 2025-2-27 21:12
信息来源应该是微信公众号吧，联网搜索会给来源

这不更完犊子了吗

库德里尔 · 发表于 2025-2-28 15:47

hftrrt 发表于 2025-2-28 15:17
广告宣传只字不提，号称是满血dp

有各种各样的前端，不管是本就开源的还是各家自己的
deepseek开源的模型大家都能部署，都能接入
于是确实可以在腾讯元宝这个软件里切换到deepseek的模型来使用，话是这么说……

只是你得自己从混元切过去。
我操你的腾讯，我给家里人介绍完之后，有人就中招下成这个了。

深度思考 · 发表于 2025-2-28 18:34

用D老师分析了小区充电IC卡的的数据，余额是明文记录的，但后面还有个校验码，问了好几家D老师，都信誓旦旦的说是CRC-16/MODBUS算法，还编程计算，都说自己算的是对的，我自己找了个crc计算的网站从crc8到crc32，没有一个能和D老师的结果对得上

，但看多次观看D老师的思考过程给了不少启发，修改要求词和去除无关数据后还是靠着D老师算出来了

decemus · 发表于 2025-2-28 18:46

ds原版就很会瞎编，而且还喜欢指点江山。你让他翻译全文他总结，你让它逐页翻译它偷懒

allegray · 发表于 2025-2-28 18:50

本帖最后由 allegray 于 2025-2-28 18:56 编辑

https://zhuanlan.zhihu.com/p/26343102498
有人测的国内4个平台DeepSeek R1的性能对比测试。不过他测的是api。

LilyWhite · 发表于 2025-2-28 18:57

汪达发表于 2025-2-27 20:56
官网的DS也这样吧，也有很多内容是编的

不止编，你指出他编的内容有问题，他还会煞有介事的给你解释半天，你坚持他是错的他会给你再编一段

东之伊甸 · 发表于 2025-2-28 19:33

用过一段时间腾讯元宝，让他给我按模板修正文本格式，总是前几篇按要求做，之后的就疯狂画蛇添足。

也不知道有什么毛病，提要求修正也没用，我行我素，用的人血压都高了……

dongzi81 · 发表于 2025-2-28 20:56

问它我家在哪个街道都能给我胡编一个…

		自动登录	找回密码
密码			立即注册

[科技] 慎用腾讯元宝