blip

稳定版本

replicate 生成图片说明

体验模型

replicate图像描述API

价格

3703次/1$

商业使用

允许

API文档资料

BLIP：通过语言-图像联合预训练实现统一视觉语言理解与生成

本仓库为BLIP论文的PyTorch实现代码。

引用声明

若您认为本代码对研究有所帮助，请考虑引用：

@misc{li2022blip,
      title={BLIP: Bootstrapping Language-Image Pre-training for Unified Vision-Language Understanding and Generation}, 
      author={Junnan Li and Dongxu Li and Caiming Xiong and Steven Hoi},
      year={2022},
      eprint={2201.12086},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}

致谢

BLIP的实现基于ALBEF、Huggingface Transformers和timm的开源资源，特此向原作者致谢。

使用量分析

总调用次数：163,400,000

平均响应时间：1.2s

blip 使用统计

replicate - 调用数据分析

更新时间: 4/25/2025

blip

价格

商业使用

API文档资料

BLIP：通过语言-图像联合预训练实现统一视觉语言理解与生成

引用声明

致谢

使用量分析

blip 使用统计

同类模型推荐

img2prompt

blip

batch-image-captioning