TOP AI APITOP AI API

blip

稳定版本

replicate 生成图片说明

体验模型
replicate图像描述API

价格

3703次/1$

商业使用

允许

API文档资料

BLIP:通过语言-图像联合预训练实现统一视觉语言理解与生成

本仓库为BLIP论文的PyTorch实现代码。

引用声明

若您认为本代码对研究有所帮助,请考虑引用:

@misc{li2022blip,
      title={BLIP: Bootstrapping Language-Image Pre-training for Unified Vision-Language Understanding and Generation}, 
      author={Junnan Li and Dongxu Li and Caiming Xiong and Steven Hoi},
      year={2022},
      eprint={2201.12086},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}

致谢

BLIP的实现基于ALBEFHuggingface Transformerstimm的开源资源,特此向原作者致谢。

使用量分析

总调用次数:163,400,000
平均响应时间:1.2s

blip 使用统计

replicate - 调用数据分析

更新时间: 4/25/2025

同类模型推荐

img2prompt

获取与图像风格匹配的近似文本提示。(针对稳定扩散(CLIP ViT-L/14)优化)

图像描述
查看详情 →

blip

生成图片说明

图像描述
查看详情 →

batch-image-captioning

一个用于使用GPT、Claude或Gemini为多张图片生成说明的封装模型,适用于LoRA训练

图像描述
查看详情 →