AI 资源中心

返回 AI 资源中心

AI图像语音网站大全

绘画视频

AI图像 AI Images、AI语音 AI Voice

常用的AI人工智能“绘画制作、音频复制” 等工具和使用方法网站链接信息。

AI绘画制作 (AI Images)

Stable Diffusion 3 Medium：Stability AI 开源其Stable Diffusion 3 Medium 模型，该模型是其迄今为止最先进的文本到图像开放模型，包含 20 亿个参数。该模型的尺寸较小，这使得它能够在消费级 PC 和笔记本电脑以及企业级 GPU 上良好运行。同时，它的这种尺寸特点也使其有潜力成为文本到图像模型的下一个标准。官方介绍链接；模型下载链接；GitHub资源
DALL·E (OpenAI )：生成各种物体和场景的图像，包括动物、人物、食品和风景。它还可以在其图像中结合不同的概念，DALL·E 3 原生构建于 ChatGPT 之上，只需使用简单的句子或详细的段落向 ChatGPT 提出你想看到的内容即可。DALL·E 2 版本
OpenArt: AI 创作数字艺术，专为 AI 艺术爱好者打造的平台。一家由前谷歌员工创立的位于旧金山的初创公司。
Pexels: 提供高质量且完全免费的素材图片，免费素材视频, 这些图片均在 Pexels 许可下授权。Providing free stock photos & videos to easily create beautiful products and designs.
Fooocus：一款图像生成软件（基于Gradio）。该软件是离线的，开源的，免费的，包含并自动化了许多内部优化和质量改进。功能包括：支持api接口调用，支持换脸操作，进行局部重绘，可以结合lora来用，目前项目只支持sdxl模型和对应的lora。GitHub Doc.
LCM-LoRA：绘图模型加速模块，它不仅加速能力强、泛化性能好，适配的模型也很广泛，SD系和LoRA模型都能用它来加速。Latent Consistency Models，Synthesizing High-Resolution Images with Few-Step Inference. GitHub Doc.
SUPIR: Developing Practical Algorithms for Photo-Realistic Image Restoration In the Wild. 野外照片级图像修复的实用算法. GitHub Doc.
Shutterstock: Powering creativity all on one platform. Access all the images, videos, music, and tools you need to turn ideas into achievements.

AI 语音复制（AI Vioce）

GPT-SoVITS: 强大的少样本语音转换与语音合成，仅需 1 分钟的训练数据即可微调模型。(使用方法).1 min voice data train a good TTS model! (few shot voice cloning). GitHub文档.
OpenVoice: 开源的声音克隆工具，能精确克隆声音并提供音色控制。用户提供 30 秒音频样本，即可生成自然语音。GitHub文档
MockingBird (AI拟声): 5秒内克隆您的声音并生成任意语音内容。GitHub文档

AI 资源中心

AI图像语音 网站大全

AI图像语音网站大全