按类型寻找AI
按照不同类型和场景,找到最适合您的AI模型
unival
图像、视频、音频及语言任务的统一模型
294次/$1
未知
3.9K+
unidiffuser
一个Transformer适配多模态扩散中的所有分布
71次/$1
未知
4.7K+
llava-v1.6-mistral-7b
LLaVA v1.6:大型语言与视觉助手(Mistral-7B版)
40次/$1
未知
19.6M+
minigpt-4
一种根据输入图像和提示生成文本的模型。
178次/$1
未知
6.4M+
internlm-xcomposer
基于InternLM的高级图文理解与创作
769次/$1
未知
657.6K+
uform-gen
超高速15亿参数图像描述/视觉问答多模态大语言模型(图生文)
11次/$1
未知
9.2K+
qwen-vl-chat
基于多模态大语言模型的人工智能助手,采用对齐技术训练而成。Qwen-VL-Chat支持更灵活的交互方式,包括多轮问答及创意生成能力。
370次/$1
未知
3.2M+
owlvit-base-patch32
零样本/开放词汇目标检测
4545次/$1
未知
94.9K+
llava-v1.6-vicuna-13b
LLaVA v1.6:大型语言与视觉助手(基于Vicuna-13B)
31次/$1
未知
13.6M+
moondream1
(仅限研究用途)Moondream1是一款视觉语言模型,其性能可与体积是其两倍的模型相媲美
769次/$1
未知
45.6K+
moondream2
moondream2是一款专为在边缘设备上高效运行而设计的小型视觉语言模型
1020次/$1
未知
1.5M+
llava-13b
面向具备GPT-4级别能力的大型语言与视觉模型的视觉指令调优
1020次/$1
未知
101.8M+
已加载全部模型