AI 资源中心

AI图像语音 网站大全

00128 3320344062 

 

AI图像 AI Images、AI语音 AI Voice

常用的AI人工智能“绘画制作、音频复制” 等工具和使用方法网站链接信息。

AI绘画制作 (AI Images)

  • Stable Diffusion 3 Medium:Stability AI 开源其Stable Diffusion 3 Medium 模型,该模型是其迄今为止最先进的文本到图像开放模型,包含 20 亿个参数。该模型的尺寸较小,这使得它能够在消费级 PC 和笔记本电脑以及企业级 GPU 上良好运行。同时,它的这种尺寸特点也使其有潜力成为文本到图像模型的下一个标准。官方介绍链接模型下载链接GitHub资源
  • DALL·E (OpenAI ):生成各种物体和场景的图像,包括动物、人物、食品和风景。它还可以在其图像中结合不同的概念,DALL·E 3 原生构建于 ChatGPT 之上,只需使用简单的句子或详细的段落向 ChatGPT 提出你想看到的内容即可。DALL·E 2 版本
  • OpenArt: AI 创作数字艺术,专为 AI 艺术爱好者打造的平台。一家由前谷歌员工创立的位于旧金山的初创公司。
  • Prompt Tool词图 (国内): 追踪并使用Stable Diffusion技术,帮助文本生成能真正用于游戏开发的2D素材,专注游戏美术AIGC生成,提供统一的云端算力。在线出图,在线素材归档,随时复刻修改图片。且支持独立部署。
  • Pexels: 提供高质量且完全免费的素材图片,免费素材视频, 这些图片均在 Pexels 许可下授权。Providing free stock photos & videos to easily create beautiful products and designs.
  • Fooocus:一款图像生成软件(基于Gradio)。该软件是离线的,开源的,免费的,包含并自动化了许多内部优化和质量改进。功能包括:支持api接口调用,支持换脸操作,进行局部重绘,可以结合lora来用,目前项目只支持sdxl模型和对应的lora。GitHub Doc.
  • LCM-LoRA:绘图模型加速模块,它不仅加速能力强、泛化性能好,适配的模型也很广泛,SD系和LoRA模型都能用它来加速。Latent Consistency Models,Synthesizing High-Resolution Images with Few-Step Inference. GitHub Doc.
  • SUPIR: Developing Practical Algorithms for Photo-Realistic Image Restoration In the Wild. 野外照片级图像修复的实用算法. GitHub Doc.
  • Shutterstock: Powering creativity all on one platform. Access all the images, videos, music, and tools you need to turn ideas into achievements.

AI 语音复制 (AI Vioce)

  • GPT-SoVITS: 强大的少样本语音转换与语音合成,仅需 1 分钟的训练数据即可微调模型。(使用方法).1 min voice data train a good TTS model! (few shot voice cloning). GitHub文档.
  • OpenVoice: 开源的声音克隆工具,能精确克隆声音并提供音色控制。用户提供 30 秒音频样本,即可生成自然语音。GitHub文档
  • MockingBird (AI拟声): 5秒内克隆您的声音并生成任意语音内容。GitHub文档