找回密码
 立即注册
搜索
查看: 6526|回复: 29

[科技] 放假无聊测了下各ai。

[复制链接]
     
发表于 2025-1-26 13:14 | 显示全部楼层 |阅读模式
https://www.zhihu.com/question/529704177/answer/87247704559
题目是 写一个尚书风格的册命文
结论是deepseek断档的强,kimi我之前看到铺天盖地的软文,目前看还算好,deepseek写的太短太干瘪,kimi辞藻比较华丽。但kimi写到末尾就在无限循环卡死。

其他几家基本都是把尚书和后面朝代的圣旨混起来编。完全没有古意。

评分

参与人数 1战斗力 +1 收起 理由
偽物 + 1 好评加鹅

查看全部评分

回复

使用道具 举报

     
发表于 2025-1-26 13:44 | 显示全部楼层
豆包文字处理其实很强的,但是指令遵循差劲。自然语言听不太懂,必须采用prompt那种模式。我给豆包三本50万字以上的专业书它秒读总结对照,重点抓的极好。
但是加入你让它根据文本直接生成一个综述,有什么细节你想改一下,你就只能手动改了,无论你说啥它都听不明白……
回复

使用道具 举报

     
发表于 2025-1-26 13:46 来自手机 | 显示全部楼层
ai做得好不如广告打的好
回复

使用道具 举报

     
发表于 2025-1-26 13:53 来自手机 | 显示全部楼层
很久就在那边l 发表于 2025-1-26 13:46
ai做得好不如广告打的好

有一说一,豆包确实也是很强的了,并不只是广告营销。
回复

使用道具 举报

     
发表于 2025-1-26 14:01 来自手机 | 显示全部楼层
试了下4o,也垃圾

册命文

惟岁在乙卯,正月既望,天清地宁,万象归一。皇天眷佑,兆民安康,文德昭昭,武功赫赫。朕以洪恩泽被,思治国理政,察群臣有功者,俾以显荣,庶励勋德,广开太平之基。

今闻某某,志操高洁,才略宏远,忠勤可鉴,勋绩卓然。昔在艰危之际,运筹帷幄,殚精竭虑;今承平日久,抚邦治民,兢兢业业。惠风畅施,泽流黎庶,垂范万世,功莫大焉。

爰以皇命,特加册封,赐某某以某某之职,统理某某之事,锡以俸禄,宠以荣光。宜体天心,以奉职守;宜怀谦恭,以宣化泽。毋怠毋荒,毋恃毋骄,允执厥中,克尽厥职。

钦哉!其敬承天命,以祗皇恩,辅佐国家,永绥庶民,庶彰盛世之光,永固金瓯之鼎。

制曰:嘉尔勋绩,宜加宠命,奉兹册命,钦哉钦哉!



—— 来自 鹅球 v3.3.96
回复

使用道具 举报

发表于 2025-1-26 14:15 | 显示全部楼层
很久就在那边l 发表于 2025-1-26 13:46
ai做得好不如广告打的好

豆包的语音端到端优势在手机上是极具统治力的,反倒是那个kimi才是广告打多了。
回复

使用道具 举报

     
发表于 2025-1-26 14:18 来自手机 | 显示全部楼层
很久就在那边l 发表于 2025-1-26 13:46
ai做得好不如广告打的好

豆包这个名字和唐人虚拟形象实在是太接地气了,完全没有使用的欲望
回复

使用道具 举报

     
发表于 2025-1-26 14:27 来自手机 | 显示全部楼层
豆包在多样性和方便上确实要强一点。现在已经是我娃日常必用app了。拍题答疑功能相当的不错,比deepseek强。
回复

使用道具 举报

     
发表于 2025-1-26 14:31 | 显示全部楼层
deepseek没多模态吧,怎么得出豆包拍照答题比deepseek强的?
回复

使用道具 举报

     
发表于 2025-1-26 14:35 | 显示全部楼层
很久就在那边l 发表于 2025-1-26 13:46
ai做得好不如广告打的好

对普通用户(小朋友+广大中老年)来说 豆包的易用性真的强很多
回复

使用道具 举报

     
发表于 2025-1-26 14:56 来自手机 | 显示全部楼层
我上传PDF然后想要AI总结,DeepSeek经常要解析很久而且百分比卡死在22/38%这些位置。Google系反而顺畅很多。墙内外测试过了。我想问问哪个AI在解读多个PDF上(需要比较和寻找内在联系)比较强?
回复

使用道具 举报

     
发表于 2025-1-26 15:23 | 显示全部楼层
GreenBird 发表于 2025-1-26 14:56
我上传PDF然后想要AI总结,DeepSeek经常要解析很久而且百分比卡死在22/38%这些位置。Google系反而顺畅很多 ...

pdf是纯文字么?文本为主的试试豆包,有惊喜
回复

使用道具 举报

     
发表于 2025-1-26 15:25 来自手机 | 显示全部楼层
本帖最后由 白色池塘 于 2025-1-26 15:33 编辑

前一阵心血来潮,想看看这些AI助手对文本的分析能力到底如何,就随便做了个实验。
滚石乐队有首曲子叫《mother's little helper》,反映了家庭主妇的药物成瘾问题,但表达得有点儿含蓄。我让文小言、kimi、豆包和deepseek以这首歌为意象创作一张图片。
文小言纯废物,我开了会员,结果还是表示它不能处理英文问题,直接拒绝作答。
豆包作了图,但画的是一群重金属大哥穿着写有“mother's little helper”字样的皮夹克演出的情景,有些牛头不对马嘴。
kimi和deepseek没有作图,但提供了绘画思路,明确指出了药物成瘾的母亲的形象。不过这俩的思路有点太相似了,都表示可以让这妈一边嗑药一边听着收音机里播放那首歌,给我一种互相洗稿的感觉
回复

使用道具 举报

     
发表于 2025-1-26 15:29 来自手机 | 显示全部楼层
deepseek不让写党八股,豆包图标太唐,所以我工作就只能用kimi了。

—— 来自 鹅球 v3.3.96-alpha

评分

参与人数 1战斗力 +1 收起 理由
鱼丈人 + 1 欢乐多

查看全部评分

回复

使用道具 举报

     
发表于 2025-1-26 15:38 | 显示全部楼层
豆包的算法有点奇怪,生图同样带点擦边的关键字有时候可以生成有时候不可以,不过文本功能日常是够用了。之后再试试deepseek。
回复

使用道具 举报

     
发表于 2025-1-26 15:39 来自手机 | 显示全部楼层
如果要用来大批量翻译文本,那个更好用?

—— 来自 Xiaomi 2211133C, Android 14上的 S1Next-鹅版 v2.5.2-play
回复

使用道具 举报

     
 楼主| 发表于 2025-1-26 20:43 来自手机 | 显示全部楼层
tillnight 发表于 2025-1-26 13:53
有一说一,豆包确实也是很强的了,并不只是广告营销。

上次阑夕说,字节一年在ai上的投资等于Baidu利润的四倍,Baidu拿头打。

这几个ai对比里,最差的就是文小言,连白话文都出来了。

—— 来自 鹅球 v3.3.96-alpha
回复

使用道具 举报

发表于 2025-1-26 21:55 来自手机 | 显示全部楼层
cqc1021 发表于 2025-1-26 15:29
deepseek不让写党八股,豆包图标太唐,所以我工作就只能用kimi了。

—— 来自 鹅球 v3.3.96-alpha ...

有一说一,党八股用豆包有奇效,用了一年的ai写作了,年初的kimi智普等等就基本是吹牛逼,生成的不大行,后面通义千问对他们是碾压,但也一般般,小标题得调教。年末用的豆包,效果拔群,没白挖通义的墙角,小标题一次成型的概率高多了。现在deepseek成文方面不如豆包,但可以提供比较新的观点和想法,和豆包正好互补。
回复

使用道具 举报

     
发表于 2025-1-26 21:57 | 显示全部楼层
问了个谐音梗冷笑话 全部答不出来 r1想了30秒还是错了 其他基本秒答秒错
千问直接去搜索抄答案 kimi要你叫他搜才搜 长考版和r1差不多 长考答错 甚至让他搜了会搜错关键字
弱智吧语料还得继续努力
回复

使用道具 举报

     
发表于 2025-1-26 22:59 来自手机 | 显示全部楼层
还有阿里的通义千问,腾讯的元宝,百度的文心一言呢?
回复

使用道具 举报

     
 楼主| 发表于 2025-1-26 23:16 来自手机 | 显示全部楼层
ieahgiergn 发表于 2025-1-26 22:59
还有阿里的通义千问,腾讯的元宝,百度的文心一言呢?

我在知乎写了,通义,文心我都试了。

腾讯的元宝我不知道。

上面两个都是不如意。

—— 来自 鹅球 v3.3.96-alpha
回复

使用道具 举报

     
发表于 2025-1-27 01:37 | 显示全部楼层
所以给点材料来写一个基本没人看的新闻稿,或者没啥用的工作总结,个人评价,只要求能把话讲明白说的过去,用啥比较推荐呢?谢谢各位坛友了
回复

使用道具 举报

     
发表于 2025-1-27 07:22 来自手机 | 显示全部楼层
Veronica0096 发表于 2025-1-26 15:39
如果要用来大批量翻译文本,那个更好用?

—— 来自 Xiaomi 2211133C, Android 14上的 S1Next-鹅版 v2.5.2 ...

翻黄文的话,还是ds,但是建议伪装为海外用户

—— 来自 OPPO PCLM10, Android 12上的 S1Next-鹅版 v2.5.4
回复

使用道具 举报

     
发表于 2025-1-27 07:25 来自手机 | 显示全部楼层
本帖最后由 pf67 于 2025-1-27 07:31 编辑
OVTVO 发表于 2025-1-26 20:43
上次阑夕说,字节一年在ai上的投资等于Baidu利润的四倍,Baidu拿头打。

这几个ai对比里,最差的就是文小 ...

字节的投资主要是买卡,国内的卡都买光了
这些卡很多也不是给豆包用的,字节内部部门太多了
百度文心不能打也不是因为投资不够

—— 来自 OPPO PCLM10, Android 12上的 S1Next-鹅版 v2.5.4
回复

使用道具 举报

     
发表于 2025-1-27 07:28 来自手机 | 显示全部楼层
GreenBird 发表于 2025-1-26 14:56
我上传PDF然后想要AI总结,DeepSeek经常要解析很久而且百分比卡死在22/38%这些位置。Google系反而顺畅很多 ...

处理各种多模态数据输入格式那还是openai

—— 来自 OPPO PCLM10, Android 12上的 S1Next-鹅版 v2.5.4
回复

使用道具 举报

     
发表于 2025-1-27 09:02 来自手机 | 显示全部楼层
big9999 发表于 2025-1-26 21:55
有一说一,党八股用豆包有奇效,用了一年的ai写作了,年初的kimi智普等等就基本是吹牛逼,生成的不大行, ...

太对了。我也是这样。我现在日用就再加一个4o。豆包的文字能力极强,比4o还强,毕竟4o肯定是忽视中文语料训练的。deepseek近期才用,推理确实无敌,有些复杂的问题我都会使用DeepSeek,在这一点上豆包就很差劲,豆包对指令的遵循太差了。你只能给豆包东西让他处理,让他自己发挥就一塌糊涂。
这两个在生成的东西质量上都胜于4o,当然这和我用汉语有不小的关系。不过4o对自然语言指令的遵循和文本输出内容的拟人性都远胜这俩ai。豆包和DeepSeek都很难对输出内容微调,我的指令基本当听不见。而且如果只对话的话也能明显感觉到是ai,没有4o有温度。
总得来说就是各有千秋,没有一个包罗万象的。也是好事情,促进发展。按DeepSeek这个发展趋势就等多模态推出了,那怕啥真的名副其实的世界第一ai了
回复

使用道具 举报

     
发表于 2025-1-27 11:24 | 显示全部楼层
我现在日常就用豆包和deepseek,感觉比别家都强(kimi,文心一言比较下来都不太行)
回复

使用道具 举报

发表于 2025-1-27 12:42 | 显示全部楼层
可以问下各自行业的专业问题。
回复

使用道具 举报

     
发表于 2025-1-27 13:06 | 显示全部楼层
本帖最后由 lukesweet 于 2025-1-27 13:07 编辑
很久就在那边l 发表于 2025-1-26 13:46
ai做得好不如广告打的好

豆包的文字也不弱的,可以说是泛SFT思路的极致体现,不是这次DS异军突起,国内top1肯定是豆包了;外加还有极强的声音和过得去的图像。
你这图里最接近炒作狗的是Kimi
回复

使用道具 举报

     
发表于 2025-1-27 13:44 来自手机 | 显示全部楼层
豆包和ds我随手让他们算了下等额本息的利率计算,豆包是瞎说的,ds算的对
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2025-1-27 22:06 , Processed in 0.127581 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表