阿波罗7B - 大型多模态模型中视频理解能力的探索
阿波罗3B - 大型多模态模型中视频理解能力的探索
用于视频聊天的SOTA开源模型及Qwen家族最新成员
Qwen家族最新模型,支持视频与图像模型的对话交互
视频预处理工具,用于使用GPT、Claude或Gemini为多个视频添加字幕