阿里也来凑热闹，通义千问发布全新视觉理解模型Qwen2.5-VL

绕指流光 发表于 2025-1-28 11:50

一份给开发者的春节礼物🎁
通义千问发布全新视觉理解模型Qwen2.5-VL，开源3B、7B和72B三个尺寸版本。不仅准确识别万物，还能解析图像的框架结构及文字、图表、图标等复杂内容。
支持超过1小时视频理解，并对视频里发生的事件进行秒级定位。借助强大的模型能力，可轻松创建手机及电脑AI视觉智能体。
👉模型已在魔搭社区、HuggingFace等平台开源，也可以在百炼平台、QwenChat 上体验，动起来吧！
#通义##通义千问# http://t.cn/A63plriC

看热闹不嫌事大，还可以加把火

页: [1]

Stage1st's Archiver

阿里也来凑热闹，通义千问发布全新视觉理解模型Qwen2.5-VL