阿里也来凑热闹,通义千问发布全新视觉理解模型Qwen2.5-VL
一份给开发者的春节礼物🎁通义千问发布全新视觉理解模型Qwen2.5-VL,开源3B、7B和72B三个尺寸版本。不仅准确识别万物,还能解析图像的框架结构及文字、图表、图标等复杂内容。
支持超过1小时视频理解,并对视频里发生的事件进行秒级定位。借助强大的模型能力,可轻松创建手机及电脑AI视觉智能体。
👉模型已在魔搭社区、HuggingFace等平台开源,也可以在百炼平台、QwenChat 上体验,动起来吧!
#通义##通义千问# http://t.cn/A63plriC
看热闹不嫌事大,还可以加把火
页:
[1]