找回密码
 立即注册
搜索
查看: 6151|回复: 18

[求助] 阿里是不是也新发布了一个AI

[复制链接]
发表于 2025-1-29 23:12 | 显示全部楼层 |阅读模式
看网上还说性能超过DeepSeek V3 ?
实际是怎样的?
回复

使用道具 举报

发表于 2025-1-29 23:13 来自手机 | 显示全部楼层
非开源,32k的窗口,我就想问这是想怎样呢

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

     
发表于 2025-1-29 23:31 | 显示全部楼层
Qwen 2.5出来有四个月了,之前开放模型界超越欧美同行的黑马就是它,只是没被西方媒体拿来炒作
刚出的是max版本,可惜是闭源的

现在开放模型大部分都是基于 Llama 3、Qwen 2.5或者Mistral做微调训练和合并的
回复

使用道具 举报

     
发表于 2025-1-29 23:39 | 显示全部楼层
非cot模型基础sft模型,20t语料确实厉害,性能也稳压v3,就是贵了点,如果练成rl驱动的cot模型应该很强
回复

使用道具 举报

     
发表于 2025-1-29 23:55 | 显示全部楼层
Qwen之前就很强,可能是通义千问的App做的太拉了,就是火不过kimi、豆包之类的。从我的使用体验来看,Qwen生成答案的质量还是非常高的。

论坛助手,iPhone
回复

使用道具 举报

     
发表于 2025-1-30 08:26 | 显示全部楼层
去年6月开始就是这样了,DS和Qwen轮流登顶最强中文模型

—— 来自 S1Fun
回复

使用道具 举报

     
发表于 2025-1-30 09:35 来自手机 | 显示全部楼层
qwen的科技路线和deepseek不同的,目标是超长文和长上下文中的注意力这块。更适合b端走大知识库的rag落地应用这块,普通人搜索+正解这块还是走cot比较好。不过qwen(非max就行)的通过工程手段也可以做cot,而且效果很好,就是会慢一点

—— 来自 OnePlus PGP110, Android 14上的 S1Next-鹅版 v2.5.4
回复

使用道具 举报

发表于 2025-1-30 09:58 | 显示全部楼层
bubuyu 发表于 2025-1-29 23:55
Qwen之前就很强,可能是通义千问的App做的太拉了,就是火不过kimi、豆包之类的。从我的使用体验来看,Qwen ...

有没有网页版?
回复

使用道具 举报

     
发表于 2025-1-30 12:25 | 显示全部楼层

https://tongyi.aliyun.com

论坛助手,iPhone
回复

使用道具 举报

     
发表于 2025-1-30 12:50 来自手机 | 显示全部楼层
23年开始的百模大战是不是已经快大结局了
什么 天宫 360智脑 讯飞星火app推出的这么早,现在都没啥声音了,ai四小龙之一的商汤的大模型连个app都没。

—— 来自 OPPO PGFM10, Android 14上的 S1Next-鹅版 v2.5.2
回复

使用道具 举报

     
发表于 2025-1-30 13:38 | 显示全部楼层
deepseek 在32b以下的小模型都是Qwen蒸馏
我觉得这就是一种同行的认可
回复

使用道具 举报

     
发表于 2025-1-30 14:05 | 显示全部楼层
小妻水亚美 发表于 2025-1-30 12:50
23年开始的百模大战是不是已经快大结局了
什么 天宫 360智脑 讯飞星火app推出的这么早,现在都没啥声音了, ...

讯飞星火还可以吧,企业似乎用的不少,而且是现在唯一一个完全用华为方案训练得第三方llm,毕竟是传统企业,技术效率方面跟幻方这种量化出身的精英集团没法比
回复

使用道具 举报

     
发表于 2025-1-30 14:10 | 显示全部楼层

https://chat.qwenlm.ai/
我觉得这里更好,可以选模型
回复

使用道具 举报

发表于 2025-1-30 14:11 来自手机 | 显示全部楼层
我就只知道通义千问很厉害,但是通义千问的app
输出又很抽象,就没搞明白为啥不把app做得好一点,反正完全比不过Kimi和豆包的app,现在更比不过DS了

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

     
发表于 2025-1-30 14:14 | 显示全部楼层
昨天开源的多模态MoE模型,基于qwen2.5。

这一周我愿称为春节技术周。


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

     
发表于 2025-1-30 14:15 来自手机 | 显示全部楼层
已经是通义灵码的形状了

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

     
发表于 2025-1-30 14:26 来自手机 | 显示全部楼层
qqks 发表于 2025-1-30 14:05
讯飞星火还可以吧,企业似乎用的不少,而且是现在唯一一个完全用华为方案训练得第三方llm,毕竟是传统企 ...

电信也有个110B模型,全华为方案

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

     
发表于 2025-1-30 21:04 | 显示全部楼层
通义写代码 质量很高。
回复

使用道具 举报

发表于 2025-1-30 21:09 | 显示全部楼层
主要是贵,没有deepseek那样降本增效的震撼。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2025-1-31 07:10 , Processed in 0.093179 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表