按类型寻找AI
按照不同类型和场景,找到最适合您的AI模型
img2prompt
获取与图像风格匹配的近似文本提示。(针对稳定扩散(CLIP ViT-L/14)优化)
27次/$1
未知
18.2M+
blip
生成图片说明
3703次/$1
未知
1144.8M+
batch-image-captioning
一个用于使用GPT、Claude或Gemini为多张图片生成说明的封装模型,适用于LoRA训练
价格未知
未知
8.0K+
molmo-7b
艾伦AI/Molmo-7B-D-0924,回答关于图像的问题和描述
322次/$1
未知
650.8K+
blip-2
回答关于图像的问题
714次/$1
未知
208.3M+
clip-interrogator
CLIP Interrogator是一款提示词工程工具,它结合了OpenAI的CLIP与Salesforce的BLIP技术,能够优化文本提示词以匹配给定图像。将生成的提示词用于Stable Diffusion等文生图模型,即可创作出惊艳的艺术作品!
1333次/$1
未知
23.6M+
wd-image-tagger
基于WaifuDiffusion微调的图像标签器(采用SwinV2、SwinV2、ConvNext和ViT架构)
2000次/$1
未知
7.0K+
blip-3
Blip 3 / XGen-MM,回答关于图像的问题({blip3,xgen-mm}-phi3-mini-base-r-v1)
500次/$1
未知
8.4M+
image-captioning-with-visual-attention
数据集:Flickr8k
4545次/$1
未知
78.4K+
clip_prefix_caption
使用CLIP和GPT-2的简易图像描述生成模型
4545次/$1
未知
11.9M+
clip-caption-reward
基于CLIP奖励的细粒度图像描述生成
714次/$1
未知
2.1M+
已加载全部模型