按类型寻找AI

按照不同类型和场景，找到最适合您的AI模型

排序：价格更新时间使用量

img2prompt

获取与图像风格匹配的近似文本提示。（针对稳定扩散（CLIP ViT-L/14）优化）

27次/$1

未知

18.2M+

blip

生成图片说明

3703次/$1

未知

1144.8M+

batch-image-captioning

一个用于使用GPT、Claude或Gemini为多张图片生成说明的封装模型，适用于LoRA训练

价格未知

未知

8.0K+

molmo-7b

艾伦AI/Molmo-7B-D-0924，回答关于图像的问题和描述

322次/$1

未知

650.8K+

blip-2

回答关于图像的问题

714次/$1

未知

208.3M+

clip-interrogator

CLIP Interrogator是一款提示词工程工具，它结合了OpenAI的CLIP与Salesforce的BLIP技术，能够优化文本提示词以匹配给定图像。将生成的提示词用于Stable Diffusion等文生图模型，即可创作出惊艳的艺术作品！

1333次/$1

未知

23.6M+

wd-image-tagger

基于WaifuDiffusion微调的图像标签器（采用SwinV2、SwinV2、ConvNext和ViT架构）

2000次/$1

未知

7.0K+

blip-3

Blip 3 / XGen-MM，回答关于图像的问题（{blip3,xgen-mm}-phi3-mini-base-r-v1）

500次/$1

未知

8.4M+

image-captioning-with-visual-attention

数据集：Flickr8k

4545次/$1

未知

78.4K+

clip_prefix_caption

使用CLIP和GPT-2的简易图像描述生成模型