按类型寻找AI
按照不同类型和场景,找到最适合您的AI模型
daanelson/motion_diffusion_model
基于文本提示生成人体运动视频的扩散模型
disco-diffusion
使用多种技术生成图像 - 由Discoart驱动
high-resolution-controlnet-tile
更新:采用全新升级算法,显著提升画质表现。Fermat.app开源实现高效ControlNet 1.1分块处理技术,实现高品质图像放大。增强创造性以激发算法想象力。
audio-to-waveform
从音频创建波形视频
flux-redux-schnell
快速高效的图像变体模型,用于快速迭代和实验。
multilingual-e5-large
multilingual-e5-large:一种多语言文本嵌入模型
elleo/uk-petition-generator
生成适合提交给英国政府的请愿书
camenduru/zephyr-orpo-141b-a35b-v0.1
Mixtral 8x22b v0.1 Zephyr Orpo 141b A35b v0.1
cudanexus/debvc
基于示例的深度视频着色技术 简而言之,该项目旨在为老照片和胶片素材进行着色修复。我们稍后将深入细节,但首先让我们欣赏一些精美的图片和视频!
crdbello/cblabs
xl
meta-nougat
Nougat:面向学术文档的神经光学理解系统
birefnet
高分辨率二分图像分割的双边参考(CAAI AIR 2024)
flux-fill-pro
专业级图像修复与扩展模型,具备顶尖性能表现。可实现自然无缝的图像编辑与延展效果。
granite-3.2-8b-instruct
暂无描述
nomagick/qwen-14b-chat
Qwen-14B-Chat 是一个基于 Transformer 架构的大语言模型,通过海量数据(包括网络文本、书籍、代码等)进行预训练而成。
tomasmcm/anima-phi-neptune-mistral-7b
来源:Severian/ANIMA-Phi-Neptune-Mistral-7B ✦ 量化版本:TheBloke/ANIMA-Phi-Neptune-Mistral-7B-AWQ ✦ 仿生增强型大语言模型
tomasmcm/llama-2-7b-chat-hf
来源:meta-llama/Llama-2-7b-chat-hf ✦ 量化版本:TheBloke/Llama-2-7B-Chat-AWQ ✦ 适用于助手式对话场景
google-deepmind/gemma-2-2b
Google 的 Gemma2 2B
tomasmcm/dans-adventurouswinds-mk2-7b
来源:PocketDoc/Dans-AdventurousWinds-Mk2-7b ✦ 量化版本:TheBloke/Dans-AdventurousWinds-Mk2-7B-AWQ ✦ 该模型擅长创作基于文本的冒险游戏
lucataco/prompt-guard-86m
由大型语言模型驱动的应用程序容易受到提示攻击,这类攻击通过精心设计的提示词蓄意破坏开发者对模型行为的预期控制。
camb-ai/mars5-tts
MARS5,一款完全开源(可商用)的语音克隆/文本转语音工具,具有突破性的韵律表现和真实感。
lucataco/qwen2-57b-a14b-instruct
阿里巴巴云推出的Qwen2 570亿参数语言模型,专为对话补全任务优化
lucataco/hermes-2-pro-llama-3-70b
Hermes 2 Pro是OpenHermes 2.5数据集的升级净化版本,同时也是我们内部开发的全新功能调用与JSON模式数据集。
google-deepmind/gemma2-27b-it
谷歌的Gemma2 27b指导模型
google-deepmind/gemma2-9b-it
Google的Gemma2 9b指导模型
lucataco/hunyuandit-v1.1
一款强大的多分辨率扩散变换器,具备精细的中文理解能力
lucataco/florence-2-base
Florence-2:推进多样化视觉任务的统一表征
zsxkib/qwen2-7b-instruct
Qwen 2:阿里巴巴云推出的70亿参数语言模型,专为聊天补全任务优化
tomasmcm/starling-lm-7b-alpha
来源:berkeley-nest/Starling-LM-7B-alpha ✦ 量化版本:TheBloke/Starling-LM-7B-alpha-AWQ ✦ 一个通过人工智能反馈强化学习(RLAIF)训练的开源大语言模型(LLM)
leclem/seine-transition
使用SEINE模型生成从一张图像过渡到另一张图像的视频
tomasmcm/prometheus-13b-v1.0
来源:kaist-ai/prometheus-13b-v1.0 ✦ 量化版本:TheBloke/prometheus-13B-v1.0-AWQ ✦ 在评估LLMs和RLHF奖励模型时可作为GPT-4的替代方案
wglint/4_sdxl
稳定扩散XL - 精炼器
tomasmcm/whiterabbitneo-13b
来源:WhiteRabbitNeo/WhiteRabbitNeo-13B-v1 ✦ TheBloke/WhiteRabbitNeo-13B-AWQ ✦ WhiteRabbitNeo是一个可用于攻防网络安全的模型系列
wglint/3_rv
稳定扩散2.1 - 真实视觉5.1 - 变分自编码器
lucataco/bge-m3
BGE-M3是首个支持多检索模式、多语言和多粒度检索的嵌入模型。
wglint/2_sdv2-1
稳定扩散2.1 - 不适合工作场所内容 - Supabase
sakemin/musicgen-fine-tuner
微调MusicGen的小型、中型和旋律模型。同时提供立体声模型。
cjwbw/animagine-xl-3.1
动漫主题的文本到图像稳定扩散模型
meta/meta-llama-guard-2-8b
基于Llama-3的审核与安全防护语言模型
tomasmcm/juanako-7b-una
来源:fblgit/juanako-7b-UNA ✦ 量化版本:TheBloke/juanako-7B-UNA-AWQ ✦ juanako采用UNA(Uniform Neural Alignment)技术。这是一种尚未发表的训练技术,可简化Transformer层之间的对齐过程。
lucataco/paligemma-3b-pt-224
PaliGemma 3B是谷歌推出的开源视觉语言模型(VLM),预训练阶段采用224*224输入图像尺寸及128个令牌的输入/输出文本序列。
mikeei/dolphin-2.9-llama3-70b-gguf
海豚是无审查的。我已过滤数据集以去除对齐和偏见。这使得模型更加合规。
mikeei/dolphin-2.9-llama3-8b-gguf
海豚是无审查的。我已过滤数据集以去除对齐和偏见。这使得模型更加合规。
lucataco/idefics-8b
Idefics2 是一个开源的多模态模型,能够接收任意序列的图像和文本输入,并生成文本输出。
bytedance/res-adapter
扩散模型的域一致性分辨率适配器:生成训练域外分辨率的连贯图像