阿里是不是也新发布了一个AI
看网上还说性能超过DeepSeek V3 ?实际是怎样的? 非开源,32k的窗口,我就想问这是想怎样呢
—— 来自 鹅球 v3.3.96 Qwen 2.5出来有四个月了,之前开放模型界超越欧美同行的黑马就是它,只是没被西方媒体拿来炒作
刚出的是max版本,可惜是闭源的
现在开放模型大部分都是基于 Llama 3、Qwen 2.5或者Mistral做微调训练和合并的 非cot模型基础sft模型,20t语料确实厉害,性能也稳压v3,就是贵了点,如果练成rl驱动的cot模型应该很强 Qwen之前就很强,可能是通义千问的App做的太拉了,就是火不过kimi、豆包之类的。从我的使用体验来看,Qwen生成答案的质量还是非常高的。
论坛助手,iPhone 去年6月开始就是这样了,DS和Qwen轮流登顶最强中文模型
—— 来自 S1Fun qwen的科技路线和deepseek不同的,目标是超长文和长上下文中的注意力这块。更适合b端走大知识库的rag落地应用这块,普通人搜索+正解这块还是走cot比较好。不过qwen(非max就行)的通过工程手段也可以做cot,而且效果很好,就是会慢一点
—— 来自 OnePlus PGP110, Android 14上的 S1Next-鹅版 v2.5.4 bubuyu 发表于 2025-1-29 23:55
Qwen之前就很强,可能是通义千问的App做的太拉了,就是火不过kimi、豆包之类的。从我的使用体验来看,Qwen ...
有没有网页版? 懂懂懂? 发表于 2025-1-30 09:58
有没有网页版?
https://tongyi.aliyun.com
论坛助手,iPhone 23年开始的百模大战是不是已经快大结局了
什么 天宫 360智脑 讯飞星火app推出的这么早,现在都没啥声音了,ai四小龙之一的商汤的大模型连个app都没。
—— 来自 OPPO PGFM10, Android 14上的 S1Next-鹅版 v2.5.2 deepseek 在32b以下的小模型都是Qwen蒸馏
我觉得这就是一种同行的认可 小妻水亚美 发表于 2025-1-30 12:50
23年开始的百模大战是不是已经快大结局了
什么 天宫 360智脑 讯飞星火app推出的这么早,现在都没啥声音了, ...
讯飞星火还可以吧,企业似乎用的不少,而且是现在唯一一个完全用华为方案训练得第三方llm,毕竟是传统企业,技术效率方面跟幻方这种量化出身的精英集团没法比 bubuyu 发表于 2025-1-30 12:25
https://tongyi.aliyun.com
论坛助手,iPhone
https://chat.qwenlm.ai/
我觉得这里更好,可以选模型 我就只知道通义千问很厉害,但是通义千问的app
输出又很抽象,就没搞明白为啥不把app做得好一点,反正完全比不过Kimi和豆包的app,现在更比不过DS了
—— 来自 鹅球 v3.3.96 昨天开源的多模态MoE模型,基于qwen2.5。
这一周我愿称为春节技术周。
已经是通义灵码的形状了
—— 来自 鹅球 v3.3.96 qqks 发表于 2025-1-30 14:05
讯飞星火还可以吧,企业似乎用的不少,而且是现在唯一一个完全用华为方案训练得第三方llm,毕竟是传统企 ...
电信也有个110B模型,全华为方案
—— 来自 鹅球 v3.3.96 通义写代码 质量很高。 主要是贵,没有deepseek那样降本增效的震撼。
页:
[1]