按类型寻找AI

56.8K+

disco-diffusion

使用多种技术生成图像 - 由Discoart驱动

0次/$1

452.3K+

high-resolution-controlnet-tile

更新：采用全新升级算法，显著提升画质表现。Fermat.app开源实现高效ControlNet 1.1分块处理技术，实现高品质图像放大。增强创造性以激发算法想象力。

20次/$1

4.3M+

audio-to-waveform

从音频创建波形视频

1000次/$1

2.7M+

flux-redux-schnell

快速高效的图像变体模型，用于快速迭代和实验。

198.0K+

multilingual-e5-large

multilingual-e5-large：一种多语言文本嵌入模型

129.0M+

elleo/uk-petition-generator

生成适合提交给英国政府的请愿书

16次/$1

432+

camenduru/zephyr-orpo-141b-a35b-v0.1

Mixtral 8x22b v0.1 Zephyr Orpo 141b A35b v0.1

548+

cudanexus/debvc

基于示例的深度视频着色技术简而言之，该项目旨在为老照片和胶片素材进行着色修复。我们稍后将深入细节，但首先让我们欣赏一些精美的图片和视频！

9次/$1

1.6K+

crdbello/cblabs

1.3K+

meta-nougat

Nougat：面向学术文档的神经光学理解系统

32次/$1

29.4K+

birefnet

高分辨率二分图像分割的双边参考（CAAI AIR 2024）

416次/$1

15.2M+

flux-fill-pro

专业级图像修复与扩展模型，具备顶尖性能表现。可实现自然无缝的图像编辑与延展效果。

7.4M+

granite-3.2-8b-instruct

暂无描述

1.6M+

nomagick/qwen-14b-chat

Qwen-14B-Chat 是一个基于 Transformer 架构的大语言模型，通过海量数据（包括网络文本、书籍、代码等）进行预训练而成。

37次/$1

21.6K+

tomasmcm/anima-phi-neptune-mistral-7b

来源：Severian/ANIMA-Phi-Neptune-Mistral-7B ✦ 量化版本：TheBloke/ANIMA-Phi-Neptune-Mistral-7B-AWQ ✦ 仿生增强型大语言模型

333次/$1

86+

tomasmcm/llama-2-7b-chat-hf

来源：meta-llama/Llama-2-7b-chat-hf ✦ 量化版本：TheBloke/Llama-2-7B-Chat-AWQ ✦ 适用于助手式对话场景

526次/$1

300+

google-deepmind/gemma-2-2b

Google 的 Gemma2 2B

1754次/$1

136.0K+

tomasmcm/dans-adventurouswinds-mk2-7b

来源：PocketDoc/Dans-AdventurousWinds-Mk2-7b ✦ 量化版本：TheBloke/Dans-AdventurousWinds-Mk2-7B-AWQ ✦ 该模型擅长创作基于文本的冒险游戏

524+

lucataco/prompt-guard-86m

由大型语言模型驱动的应用程序容易受到提示攻击，这类攻击通过精心设计的提示词蓄意破坏开发者对模型行为的预期控制。

108+

camb-ai/mars5-tts

MARS5，一款完全开源（可商用）的语音克隆/文本转语音工具，具有突破性的韵律表现和真实感。

2.6K+

lucataco/qwen2-57b-a14b-instruct

阿里巴巴云推出的Qwen2 570亿参数语言模型，专为对话补全任务优化

71次/$1

5.2K+

lucataco/hermes-2-pro-llama-3-70b

Hermes 2 Pro是OpenHermes 2.5数据集的升级净化版本，同时也是我们内部开发的全新功能调用与JSON模式数据集。

1.4K+

google-deepmind/gemma2-27b-it

谷歌的Gemma2 27b指导模型

0次/$1

51.2K+

google-deepmind/gemma2-9b-it

Google的Gemma2 9b指导模型

322次/$1

85.1K+

lucataco/hunyuandit-v1.1

一款强大的多分辨率扩散变换器，具备精细的中文理解能力

6次/$1

4.4K+

lucataco/florence-2-base

Florence-2：推进多样化视觉任务的统一表征

1000次/$1

217.8K+

zsxkib/qwen2-7b-instruct

Qwen 2：阿里巴巴云推出的70亿参数语言模型，专为聊天补全任务优化

476次/$1

6.8K+

tomasmcm/starling-lm-7b-alpha

来源：berkeley-nest/Starling-LM-7B-alpha ✦ 量化版本：TheBloke/Starling-LM-7B-alpha-AWQ ✦ 一个通过人工智能反馈强化学习（RLAIF）训练的开源大语言模型（LLM）

239.4K+

leclem/seine-transition

使用SEINE模型生成从一张图像过渡到另一张图像的视频

5次/$1

9.2K+

tomasmcm/prometheus-13b-v1.0

来源：kaist-ai/prometheus-13b-v1.0 ✦ 量化版本：TheBloke/prometheus-13B-v1.0-AWQ ✦ 在评估LLMs和RLHF奖励模型时可作为GPT-4的替代方案

204次/$1

216.0K+

wglint/4_sdxl

稳定扩散XL - 精炼器

16次/$1

502+

tomasmcm/whiterabbitneo-13b

来源：WhiteRabbitNeo/WhiteRabbitNeo-13B-v1 ✦ TheBloke/WhiteRabbitNeo-13B-AWQ ✦ WhiteRabbitNeo是一个可用于攻防网络安全的模型系列

7次/$1

467+

wglint/3_rv

稳定扩散2.1 - 真实视觉5.1 - 变分自编码器

58次/$1

9.5K+

lucataco/bge-m3

BGE-M3是首个支持多检索模式、多语言和多粒度检索的嵌入模型。

25次/$1

1.0K+

wglint/2_sdv2-1

稳定扩散2.1 - 不适合工作场所内容 - Supabase

10次/$1

2.2K+

sakemin/musicgen-fine-tuner

微调MusicGen的小型、中型和旋律模型。同时提供立体声模型。

12次/$1

30.6K+

cjwbw/animagine-xl-3.1

动漫主题的文本到图像稳定扩散模型

256次/$1

18.4M+

meta/meta-llama-guard-2-8b

基于Llama-3的审核与安全防护语言模型

2.9M+

tomasmcm/juanako-7b-una

来源：fblgit/juanako-7b-UNA ✦ 量化版本：TheBloke/juanako-7B-UNA-AWQ ✦ juanako采用UNA（Uniform Neural Alignment）技术。这是一种尚未发表的训练技术，可简化Transformer层之间的对齐过程。

344次/$1

156+

lucataco/paligemma-3b-pt-224

PaliGemma 3B是谷歌推出的开源视觉语言模型(VLM)，预训练阶段采用224*224输入图像尺寸及128个令牌的输入/输出文本序列。

5.4K+

mikeei/dolphin-2.9-llama3-70b-gguf

海豚是无审查的。我已过滤数据集以去除对齐和偏见。这使得模型更加合规。

23次/$1

296.8K+

mikeei/dolphin-2.9-llama3-8b-gguf

海豚是无审查的。我已过滤数据集以去除对齐和偏见。这使得模型更加合规。

416次/$1

24.4K+

lucataco/idefics-8b

Idefics2 是一个开源的多模态模型，能够接收任意序列的图像和文本输入，并生成文本输出。

400次/$1

4.4K+

bytedance/res-adapter

扩散模型的域一致性分辨率适配器：生成训练域外分辨率的连贯图像

14次/$1