放假无聊测了下各ai。

OVTVO · 发表于 2025-1-26 13:14

https://www.zhihu.com/question/529704177/answer/87247704559
题目是写一个尚书风格的册命文
结论是deepseek断档的强，kimi我之前看到铺天盖地的软文，目前看还算好，deepseek写的太短太干瘪，kimi辞藻比较华丽。但kimi写到末尾就在无限循环卡死。

其他几家基本都是把尚书和后面朝代的圣旨混起来编。完全没有古意。

假面骑士decade · 发表于 2025-1-26 13:44

豆包文字处理其实很强的，但是指令遵循差劲。自然语言听不太懂，必须采用prompt那种模式。我给豆包三本50万字以上的专业书它秒读总结对照，重点抓的极好。
但是加入你让它根据文本直接生成一个综述，有什么细节你想改一下，你就只能手动改了，无论你说啥它都听不明白……

很久就在那边l · 发表于 2025-1-26 13:46

ai做得好不如广告打的好

tillnight · 发表于 2025-1-26 13:53

很久就在那边l 发表于 2025-1-26 13:46
ai做得好不如广告打的好

有一说一，豆包确实也是很强的了，并不只是广告营销。

云卷花开 · 发表于 2025-1-26 14:01

试了下4o，也垃圾

册命文

惟岁在乙卯，正月既望，天清地宁，万象归一。皇天眷佑，兆民安康，文德昭昭，武功赫赫。朕以洪恩泽被，思治国理政，察群臣有功者，俾以显荣，庶励勋德，广开太平之基。

今闻某某，志操高洁，才略宏远，忠勤可鉴，勋绩卓然。昔在艰危之际，运筹帷幄，殚精竭虑；今承平日久，抚邦治民，兢兢业业。惠风畅施，泽流黎庶，垂范万世，功莫大焉。

爰以皇命，特加册封，赐某某以某某之职，统理某某之事，锡以俸禄，宠以荣光。宜体天心，以奉职守；宜怀谦恭，以宣化泽。毋怠毋荒，毋恃毋骄，允执厥中，克尽厥职。

钦哉！其敬承天命，以祗皇恩，辅佐国家，永绥庶民，庶彰盛世之光，永固金瓯之鼎。

制曰：嘉尔勋绩，宜加宠命，奉兹册命，钦哉钦哉！

—— 来自鹅球 v3.3.96

clarkgao · 发表于 2025-1-26 14:15

很久就在那边l 发表于 2025-1-26 13:46
ai做得好不如广告打的好

豆包的语音端到端优势在手机上是极具统治力的，反倒是那个kimi才是广告打多了。

卡仑治糖 · 发表于 2025-1-26 14:18

很久就在那边l 发表于 2025-1-26 13:46
ai做得好不如广告打的好

豆包这个名字和唐人虚拟形象实在是太接地气了，完全没有使用的欲望

姚纳 · 发表于 2025-1-26 14:27

豆包在多样性和方便上确实要强一点。现在已经是我娃日常必用app了。拍题答疑功能相当的不错，比deepseek强。

marsquake · 发表于 2025-1-26 14:31

deepseek没多模态吧，怎么得出豆包拍照答题比deepseek强的？

kouym · 发表于 2025-1-26 14:35

很久就在那边l 发表于 2025-1-26 13:46
ai做得好不如广告打的好

对普通用户（小朋友+广大中老年）来说豆包的易用性真的强很多

GreenBird · 发表于 2025-1-26 14:56

我上传PDF然后想要AI总结，DeepSeek经常要解析很久而且百分比卡死在22/38%这些位置。Google系反而顺畅很多。墙内外测试过了。我想问问哪个AI在解读多个PDF上（需要比较和寻找内在联系）比较强？

假面骑士decade · 发表于 2025-1-26 15:23

GreenBird 发表于 2025-1-26 14:56
我上传PDF然后想要AI总结，DeepSeek经常要解析很久而且百分比卡死在22/38%这些位置。Google系反而顺畅很多 ...

pdf是纯文字么？文本为主的试试豆包，有惊喜

白色池塘 · 发表于 2025-1-26 15:25

本帖最后由白色池塘于 2025-1-26 15:33 编辑

前一阵心血来潮，想看看这些AI助手对文本的分析能力到底如何，就随便做了个实验。
滚石乐队有首曲子叫《mother's little helper》，反映了家庭主妇的药物成瘾问题，但表达得有点儿含蓄。我让文小言、kimi、豆包和deepseek以这首歌为意象创作一张图片。
文小言纯废物，我开了会员，结果还是表示它不能处理英文问题，直接拒绝作答。
豆包作了图，但画的是一群重金属大哥穿着写有“mother's little helper”字样的皮夹克演出的情景，有些牛头不对马嘴。
kimi和deepseek没有作图，但提供了绘画思路，明确指出了药物成瘾的母亲的形象。不过这俩的思路有点太相似了，都表示可以让这妈一边嗑药一边听着收音机里播放那首歌，给我一种互相洗稿的感觉

cqc1021 · 发表于 2025-1-26 15:29

deepseek不让写党八股，豆包图标太唐，所以我工作就只能用kimi了。

—— 来自鹅球 v3.3.96-alpha

風卷豹 · 发表于 2025-1-26 15:38

豆包的算法有点奇怪，生图同样带点擦边的关键字有时候可以生成有时候不可以，不过文本功能日常是够用了。之后再试试deepseek。

Veronica0096 · 发表于 2025-1-26 15:39

如果要用来大批量翻译文本，那个更好用？

—— 来自 Xiaomi 2211133C, Android 14上的 S1Next-鹅版 v2.5.2-play

OVTVO · 发表于 2025-1-26 20:43

tillnight 发表于 2025-1-26 13:53
有一说一，豆包确实也是很强的了，并不只是广告营销。

上次阑夕说，字节一年在ai上的投资等于Baidu利润的四倍，Baidu拿头打。

这几个ai对比里，最差的就是文小言，连白话文都出来了。

—— 来自鹅球 v3.3.96-alpha

big9999 · 发表于 2025-1-26 21:55

cqc1021 发表于 2025-1-26 15:29
deepseek不让写党八股，豆包图标太唐，所以我工作就只能用kimi了。

—— 来自鹅球 v3.3.96-alpha ...

有一说一，党八股用豆包有奇效，用了一年的ai写作了，年初的kimi智普等等就基本是吹牛逼，生成的不大行，后面通义千问对他们是碾压，但也一般般，小标题得调教。年末用的豆包，效果拔群，没白挖通义的墙角，小标题一次成型的概率高多了。现在deepseek成文方面不如豆包，但可以提供比较新的观点和想法，和豆包正好互补。

Fingest · 发表于 2025-1-26 21:57

问了个谐音梗冷笑话全部答不出来 r1想了30秒还是错了其他基本秒答秒错
千问直接去搜索抄答案 kimi要你叫他搜才搜长考版和r1差不多长考答错甚至让他搜了会搜错关键字
弱智吧语料还得继续努力

ieahgiergn · 发表于 2025-1-26 22:59

还有阿里的通义千问，腾讯的元宝，百度的文心一言呢？

OVTVO · 发表于 2025-1-26 23:16

ieahgiergn 发表于 2025-1-26 22:59
还有阿里的通义千问，腾讯的元宝，百度的文心一言呢？

我在知乎写了，通义，文心我都试了。

腾讯的元宝我不知道。

上面两个都是不如意。

—— 来自鹅球 v3.3.96-alpha

solmyrli · 发表于 2025-1-27 01:37

所以给点材料来写一个基本没人看的新闻稿，或者没啥用的工作总结，个人评价，只要求能把话讲明白说的过去，用啥比较推荐呢？谢谢各位坛友了

pf67 · 发表于 2025-1-27 07:22

Veronica0096 发表于 2025-1-26 15:39
如果要用来大批量翻译文本，那个更好用？

—— 来自 Xiaomi 2211133C, Android 14上的 S1Next-鹅版 v2.5.2 ...

翻黄文的话，还是ds，但是建议伪装为海外用户

—— 来自 OPPO PCLM10, Android 12上的 S1Next-鹅版 v2.5.4

pf67 · 发表于 2025-1-27 07:25

本帖最后由 pf67 于 2025-1-27 07:31 编辑

OVTVO 发表于 2025-1-26 20:43
上次阑夕说，字节一年在ai上的投资等于Baidu利润的四倍，Baidu拿头打。

这几个ai对比里，最差的就是文小 ...

字节的投资主要是买卡，国内的卡都买光了
这些卡很多也不是给豆包用的，字节内部部门太多了
百度文心不能打也不是因为投资不够

—— 来自 OPPO PCLM10, Android 12上的 S1Next-鹅版 v2.5.4

pf67 · 发表于 2025-1-27 07:28

GreenBird 发表于 2025-1-26 14:56
我上传PDF然后想要AI总结，DeepSeek经常要解析很久而且百分比卡死在22/38%这些位置。Google系反而顺畅很多 ...

处理各种多模态数据输入格式那还是openai

—— 来自 OPPO PCLM10, Android 12上的 S1Next-鹅版 v2.5.4

假面骑士decade · 发表于 2025-1-27 09:02

big9999 发表于 2025-1-26 21:55
有一说一，党八股用豆包有奇效，用了一年的ai写作了，年初的kimi智普等等就基本是吹牛逼，生成的不大行， ...

太对了。我也是这样。我现在日用就再加一个4o。豆包的文字能力极强，比4o还强，毕竟4o肯定是忽视中文语料训练的。deepseek近期才用，推理确实无敌，有些复杂的问题我都会使用DeepSeek，在这一点上豆包就很差劲，豆包对指令的遵循太差了。你只能给豆包东西让他处理，让他自己发挥就一塌糊涂。
这两个在生成的东西质量上都胜于4o，当然这和我用汉语有不小的关系。不过4o对自然语言指令的遵循和文本输出内容的拟人性都远胜这俩ai。豆包和DeepSeek都很难对输出内容微调，我的指令基本当听不见。而且如果只对话的话也能明显感觉到是ai，没有4o有温度。
总得来说就是各有千秋，没有一个包罗万象的。也是好事情，促进发展。按DeepSeek这个发展趋势就等多模态推出了，那怕啥真的名副其实的世界第一ai了

时空管理局 · 发表于 2025-1-27 11:24

我现在日常就用豆包和deepseek，感觉比别家都强（kimi，文心一言比较下来都不太行）

droople · 发表于 2025-1-27 12:42

可以问下各自行业的专业问题。

lukesweet · 发表于 2025-1-27 13:06

本帖最后由 lukesweet 于 2025-1-27 13:07 编辑

很久就在那边l 发表于 2025-1-26 13:46
ai做得好不如广告打的好

豆包的文字也不弱的，可以说是泛SFT思路的极致体现，不是这次DS异军突起，国内top1肯定是豆包了；外加还有极强的声音和过得去的图像。
你这图里最接近炒作狗的是Kimi

龙骑士尹志平 · 发表于 2025-1-27 13:44

豆包和ds我随手让他们算了下等额本息的利率计算，豆包是瞎说的，ds算的对

		自动登录	找回密码
密码			立即注册

[科技] 放假无聊测了下各ai。

评分

评分