Audio et IA
Ressources et outils pour générer musique, voix, effets sonores, ou entraîner ses propres modèles (en ligne ou en local).
Musique
- Suno – Génération de chansons complètes (musique + voix).
- Stable Audio – Génération musique + SFX haute qualité.
- Udio – Génération musicale avancée.
- Sonauto – Outil IA simple pour création rapide.
- Ace Step (ComfyUI) – Modèle local très rapide (workflow audio).
- Riffusion – Modèle open-source (diffusion sur spectrogramme).
Voix
- ElevenLabs – Synthèse vocale réaliste + clonage.
- OpenVoice (MyShell) – Clonage vocal open-source.
https://github.com/myshell-ai/OpenVoice
- Bark (Suno) – Modèle TTS open-source.
https://github.com/suno-ai/bark
- Coqui TTS (VITS) – Synthèse vocale locale, entraînable.
Sound FX, Ambiances & Instruments
- AudioLDM – Text-to-audio open-source (SFX, ambiances, musique).
- RAVE (IRCAM) – Modèle neuronal rapide, compatible Max/MSP.
https://github.com/acids-ircam/RAVE
- Stable Audio – Génération d’effets sonores et ambiances.
- Diff-Foley – Foley génératif réaliste.
Entraînement
- RAVE – Entraînement simple sur ses propres datasets (instruments, voix, textures).
- AudioLDM – Fine-tuning via scripts Python.
- VITS / Coqui TTS – Entraînement voix personnalisées en local.