Bonjour,
Mon souci concerne Rhasspy que je souhaite relié mon home-assistant.
J’ai vu qu’il y avait de sutilisateurs de cette assistant voacla sur ce forum.
Je viens d’installer la version 2.5.11 en docker -compose sur un RPi stand-alone.
C’est configuré et fonctionnel jusqu’à la reconnaissance des intents mais je n’arrive pas à avoir une lecture avec une voix correcte de texte.
Que j’utilise Espeak, NanoTTS ou autre dans la configuration Text to speak, la voix me prononce le texte trop rapidement. J’ai pu réduire le débit pour Espeak en ajoutant ces paramètre dans le profile.json:
"espeak": {
"arguments": [
"-s",
"30"
],
"voice": "fr-fr",
"volume": "0.2"
},
Ca fonctionne mieux, mais la voix est vraiment trop « robotique »
J’ai tenté la même chose pour NanoTTS avec:
"nanotts": {
"volume": "0.5",
"arguments": [
"--speed",
"0.8"
]
},
Mais il ne le prends pas en compte.
En fouillant la log, j’ai vu la commande utilisée par RhassPy:
rhasspy | [DEBUG:2022-01-24 18:13:50,436] rhasspytts_cli_hermes: ['nanotts', '-v', 'fr-FR', '-o', '/tmp/tmpdqoraj12.wav']
rhasspy | Using Lingware directory: /usr/lib/rhasspy/.venv/lib/nanotts/pico/lang
rhasspy | read: 14 bytes from stdin
rhasspy | using lang: fr-FR
rhasspy | wrote "/tmp/tmpdqoraj12.wav" (51500 bytes)
Je l’ai testé directement dans le container:
root@68f50f2078c5:/# echo "bonjour mon maitre" | /usr/lib/rhasspy/.venv/bin/nanotts -v fr-FR -o test3.wav
Et relu le fichier wav dans le container, même voix trop rapide:
root@68f50f2078c5:/# aplay -D 'hw:CARD=Z205,DEV=0' test3.wav
Playing WAVE 'test3.wav' : Signed 16 bit Little Endian, Rate 16000 Hz, Mono
Warning: rate is not accurate (requested = 16000Hz, got = 32000Hz)
please, try the plug plugin
Par contre le même fichier wav lu directement sur le RPi, la voix et nickel
$ docker cp rhasspy:/test3.wav .
$ aplay test3.wav # Bonne prononciation
Je ne comprends pourquoi quand c’est lu dans le container la sortie ne soit pas la même alors qu’il utilise aussi la commande aplay
Il y a bien le warning concernant le souci de accurate qui pourrait etre une piste, mais comment changer cela dans Rhasspy ?