# Echo Studio + ESPHome : Libérer Alexa de son cloud ! 🎙️🚀

Salut Ă  tous !

Ce matin, fort de mon énième café, une idée à la con a lentement germé (une de plus diront certains) :
Et si je pouvais brancher un ESP32 configuré pour faire Voice Assistant et Media Player à une de mes enceintes Echo ???
Ça pourrait me permettre de résoudre deux petites frustrations auxquelles je fais face :

  1. L’environnement Alexa : pour écouter la musique en multiroom c’est plutôt sympa, avec de bonnes enceintes comme l’Echo Studio on a une bonne expérience globale. Mais la limite arrive quand on veut commander sa domotique en vocal : ce n’est pas super précis, il y a forcément du cloud, et les divers changements d’Amazon ont déjà bien plombé l’utilisation d’Alexa Media Player…

  2. Les satellites Voice Assistant : pour commander sa domotique en local, c’est vraiment génial ! À la limite, pour recevoir du TTS ça passe, mais pour la musique… on oublie tout de suite ! Sauf si on le branche directement sur une enceinte

L’idĂ©e : Utiliser un kit ReSpeaker Lite (ESP32-S3 + XMOS) comme un « pont Â» intelligent, connectĂ© en Jack 3.5mm directement sur l’Echo Studio. On bĂ©nĂ©ficie ainsi du son de l’enceinte tout en ayant un assistant 100% local.

:hammer_and_wrench: Le Setup technique (Phase 1)

  • Hardware : Kit ReSpeaker Lite (environ 30€). Pourquoi lui ? Pour sa puce XMOS XU316 qui gère l’annulation d’écho, et parce qu’en plus je m’en suis procurĂ© un et que ça marche plutĂ´t bien. C’est le meilleur moyen pour que l’assistant vous entende alors que l’Echo Studio crache du son Ă  cĂ´tĂ©.
  • Software : ESPHome (2026.1.2)
  • Features :
    • Wake Word local (Okay Nabu / Hey Jarvis).
    • Pipeline vocale complète sur Home Assistant.
    • Media Player synchronisĂ© avec Music Assistant.
    • Ducking auto (le son baisse quand on parle).
    • Feedback visuel sur la LED du kit (clignotement lors de l’écoute).

:rocket: Une approche alternative

Ici, on a cherché la fidélité. Le flux audio est traité en 32-bit/48kHz et les buffers sont optimisés pour éviter les craquements.

:test_tube: Retours de tests (Phase 1)

Voici ce que ça donne pour l’instant :

  • Musique (FLAC local / Spotify via Music Assistant) : Le son est plutĂ´t bon, on en profite bien.
  • TTS (Piper) : Ça fonctionne, mĂŞme si le son crachouille encore un tout petit peu sur la synthèse vocale pour l’instant.
  • Volume : Pour un bon rendu, je monte le volume du mĂ©dia player (ESPHome) entre 80% et 90%, alors que mon Echo Studio reste très bas (environ 13%). Il faudra que je teste dans l’autre sens pour voir si ça amĂ©liore la clartĂ©.

:handshake: Crédits & Base technique

Ce projet est une adaptation du travail de formatBCE : Respeaker-Lite-ESPHome-integration. Un grand merci à lui pour cette base solide qui m’a bien aidé à démarrer !

Pour l’instant, je suis toujours en phase de tests et je vais commander un DAC PCM5102A pour voir si ça peut améliorer la qualité audio. L’idée de ce post est surtout d’ouvrir une discussion :

  • Est-ce que d’autres ont tentĂ© des montages hybrides similaires ?
  • Est-ce que le sujet du Multi-room « libĂ©rĂ© Â» sur Echo vous intĂ©resse ?
  • Ou est-ce finalement qu’une idĂ©e Ă  la con de plus ?

Bref, j’aimerais beaucoup avoir vos avis et vos retours d’expérience sur ce genre d’approche !

Qu’en pensez-vous ?

ps : Oui, l’IA m’a aidé à structurer et mettre en forme ce post. Mais le projet est bien de moi (et de mon abus de caféine au petit matin !).

2 « J'aime »

Bonjour @Gael
Après plusieurs (beaucoup) de test sur diffĂ©rent ESP32, avec micro INMP441 et Ampli MAX 98357A, qui fonctionnait assez bien, c’est devenu « laborieux Â» au fil des maj ESPHome, sur le très bon conseil d’un ami (RTFM :wink: ) je suis passĂ© au Respeaker Lite et j’en suis très content.
Je viens de faire ce midi la mise sa mise à jour à partir du repo formatBCE qui suit parfaitement les évolutions HA / ESPHome, tout fonctionne nickel.
Je ne l’utilise que pour la commande vocale et des annonces simples, assistant vocaux locaux et aussi avec OpenAI/Azure.
Pour la musique j’ai un DENON [7.1 ] piloté via HA (on va encore rire), donc pour la musique hors de question de passer par un ESP32, il n’y a qu’en cas de détection de fuite d’eau ou de fumée que j’active la puissance DENON pour diffuser des messages qui réveilleraient les voisins :rofl:.
Je suis de ceux qui sont nés avec la HI-FI, je ne peux donc me satisfaire de moins de qualité dans l’écoute.
Mais bon choix le Respeaker et top que formatBCE garde Ă  jour son git.
J’ai pas mal de FLAC Hi-Res, Qobuz, je ne sais pas comment il est traité par le Respeaker lite mais ta solution me semble sympa pour ceux qui ne souhaitent pas de vrai materiel HI-Fi.

J’ai vu un article aussi sur le couplage de Respeaker Lite avec un écran, je ne sais plus où !

Bob

Oui je suis comme toi à la recherche d’une façon pour modifier mes enceintes alexa.
Je vais regarder avec soin l’évolution de ton topic

Salut @Bob,
C’est une solution abordable pour faire évoluer mon infrastructure. Mon but etant un maximum de local. Les denons 150 me font de l’œil pour les pièces, et une petite barre de son pour le home cinéma. Mais c’est un budget beaucoup plus conséquent que quelques respeaker

2 « J'aime »

Bonsoir,

Aprés quelques recherche suplémentaire, je ne vois pas comment integrer un autre DAC, trop galère.
J’ai un cable jack de meilleur qualité qui arrive, test à suivre

Bonjour,

Quelques test et réglages plus loin.
Je suis passer a un volume a 50% aussi bien sur l’echo studio que sur le media player du respeaker.
Du coup ça tire moins sur le son et il y a moins l’effet de « crachouillis Â» pendant le TTS.
Pour la musique, toujours un bon son bonne qualité, mais du coup un peu plat. Forcément, dans music assistant je n’ai rien de régler.
Un petit réglage DSP equalizer plus loin, les basses sont bien présentes, les aigües pas trop strident.
Bilan, avec le DAC embarqué sur le respeaker, un câble jack bas de gamme, je me retrouve avec une enceinte plus que correct pour mon voice assistant.
Une enceinte Hybride, qui peux aussi bien passer par le cloud amazon, que tout faire en local.
La question que je me pose maintenant, pourquoi personne ne l’as jamais fait ???

ps : je viens de voir que formatBCE avait rajouté kenobi en wakeword :smiley:

1 « J'aime »

Fin de partie.
Apres avoir bien tester dans tout les sens, je n’ai finalement reussi qu’avec l’echo studio. Donc c’est sympa, j’ai fait joujou quelques jour, je me suis bien amusé, mais on fini toujours par se retrouver bloquer quelques part par amazon.
Tester avec echoshow5 1ere gen et echo dot (galet).
Je garde de coté l’idée de connecté le respeaker a une enceinte en Jack, mais juste pour mettre des bons voice assistant partout.
Pour la musique… il va vraiment falloir budgetiser un bon multiroom pour pouvoir dire adieu a mon ec(h)osystem alexa :frowning:

1 « J'aime »