价格
3703次/1$
商业使用
允许
API文档资料
BLIP:通过语言-图像联合预训练实现统一视觉语言理解与生成
本仓库为BLIP论文的PyTorch实现代码。
引用声明
若您认为本代码对研究有所帮助,请考虑引用:
@misc{li2022blip, title={BLIP: Bootstrapping Language-Image Pre-training for Unified Vision-Language Understanding and Generation}, author={Junnan Li and Dongxu Li and Caiming Xiong and Steven Hoi}, year={2022}, eprint={2201.12086}, archivePrefix={arXiv}, primaryClass={cs.CV} }
致谢
BLIP的实现基于ALBEF、Huggingface Transformers和timm的开源资源,特此向原作者致谢。
使用量分析
总调用次数:163,400,000
平均响应时间:1.2s
blip 使用统计
replicate - 调用数据分析
更新时间: 4/25/2025