2023.5 assist: pas de micro

Bonjour a tous,

j’attendais avec impatience la nouvelle version de ce mois ci, mais pour ma part c’est un peu un petard mouillé, puree ya rien qui marche

J’ai bien installé piper et whisher. piper dans les services me lit bien un texte, mais pas la reponse dans assist. Et surtout le micro ne fonctionne pas, que ce soit sur l’app de mon portable, ou bien, sur le micro de mon ordi.

Je me demande si ca viendrai pas en autre du https, qd je clique sur le micro de assist. chrome me demande si je veux autoriser le micro, mais une fois fait, rien ne se passe dans assist

Et vous quels sont vos retours, ca marche chez vous?

Salut,

Sans avoir testé, il y a peu de chances que le HTTPS soit en cause, derrière, HA Core ne sait même pas quel est le protocole utilisé… HTTPS : c’est purement réseau, pas applicatif

Et chez vous, cela marche. Je suis étonné du peu d’infos sur le forum concernant la derniere maj. Personne a tester?
Ce que je comprend pas, c’est que même sur mon tel ca ne marche pas, que je passe par le reseau local ou via duckdns. Chez vous ca marche?, il reconnait le micro?, les réponses sont lues?

Hello

Je ne l’ai pas installé, ni testé.
Après avoir installé piper et whisher, as-tu rajouté les intégrations ?
As-tu quelque chose dans les logs ?

Regarde cette vidéo, ça peut éventuellement t’aider:

déja regardé, vais attendre le retour de la commu

Je ne l’utilise pas non plus… Donc j’ai pas spécialement d’idée. Malgré tout et comme le reste il devrait y avoir des indices dans les logs

Hello

La connexion en https est effectivement obligatoire pour accéder au micro.
Sur rpi 4 avec tiny-int8 pour whisper la reconnaissance vocale STT prends entre 6 et 10 secondes est n’est malheureusement pas juste (en fr)
Pas utilisable en l’état mais ce n’est que le commencement des dev.
Wait and see later

1 « J'aime »

Pour info synesthesiam qui a rejoint nabu casa ppur la partie voice développe aussi une nouvelle version de Rhasspy très prometteuse.
Si on y ajoute la dernière version de l’app Android Rhasspy qui intègre très bien le wake word , on aura très prochainement un panel applicatif intéressant pour de la reconnaissance vocale locale :grin:

1 « J'aime »

Hello,

S’il a choisi l’assistant cloud si :slight_smile:
image

Après ça peut être une question de droit d’accès au micro ?

Perso, j’ai le cas sur l’ordinateur, je n’ai pas le micro, mais sur le probable, je l’ai, mais j’ai du autorisé le micro.

1 « J'aime »

Bonjour,

Connaissez vous ou avez vous un tuto pour utiliser Alexa en tant que speech to text dans 'l’assistant vocal ?

Il est dit dans la vidéo que ce serait afficher mais les Alexa ne sont pas reconnue visiblement en STT …

Merci

J’ai vu qu’avec Siri on pouvait en disante « Dit Siri, Assist, »
Il y a peut être un equivalent avec Alexa ?

Hello

Pas de STT local avec google ou alexa, ce serait trop simple et ne demanderait donc pas les efforts de dev actuellement effectués pour du pur local.

La solution non locale la plus simple pour Google home/ Alexa nécessite un abonnement à Nabu Casa ( ou de suivre un des nombreux tutos disponibles à cet effet depuis quelques années maintenant)

@+

Bonjour,

Merci pour votre réponse.

C’est bien ce qu’il me semblait. J’ai déjà l’écosystème qui fonctionne « bien » avec Alexa et HomeAssistant joignable en HTTPS,…

C’est simplement que je trouvais l’idée des « alias » génial et que j’aurais voulu pouvoir en profiter…

Whisper et Piper fonctionnent bien également mais Whisper n’est pas du tout précis, voir inutilisable avec le model « Tiny-Int8 », je dois au minimum passer à « Small-Int8 » pour avoir un résultat satisfaisant…

Malheureusement, avec mon NUC N5101, ça part en timeout car le query met beaucoup trop de temps et j’ai essayé avec un vieux portable en I5 Gen4, ça met 8-10 sec pour interpréter…

J’ai alors essayer avec ma tour qui possède un I5 12600K et là c’est vrai que c’est hyper rapide "1-2 sec pour la traduction et la réception de Piper, ca fonctionne presque comme Alexa…

Au vu du prix de l’électricité, ce serait plus que contre productif de laisser une tour ou portable allumé h24 pour du STT, en tout dans l’état actuel.

Pour revenir au point de départ, mon idée aurait été de demander à Alexa de continuer le STT mais ensuite que ce soit HA qui réceptionne le texte afin de jongler avec ses « intents » …

Vous me confirmez que ceci n’est pas réalisable ?

Merci

Bonjour,

Après avoir installé Piper et Whisper, rajouté les intégrations et configuré, créé mon assistant local, j’ai testé dans Whisper tiny-int8, tiny, base, même constat 6 à 8 secondes pour allumer une lampe, pour l’éteindre, impossible il ne comprends pas du tout ce que je dis.

Peu d’intentions aussi pour l’instant :

Il me semblait avoir vu que l’on pouvait ajouter des intentions en local mais je ne trouve plus !

Ma configuration: trop faible sans doute !

System Information

version core-2023.5.2
installation_type Home Assistant OS
dev false
hassio true
docker true
user root
virtualenv false
python_version 3.10.11
os_name Linux
os_version 6.1.21-v8
arch aarch64
timezone Europe/Paris
config_dir /config
Home Assistant Community Store
GitHub API ok
GitHub Content ok
GitHub Web ok
GitHub API Calls Remaining 5000
Installed Version 1.32.1
Stage running
Available Repositories 1288
Downloaded Repositories 23
Home Assistant Cloud
logged_in false
can_reach_cert_server ok
can_reach_cloud_auth ok
can_reach_cloud ok
Home Assistant Supervisor
host_os Home Assistant OS 10.1
update_channel stable
supervisor_version supervisor-2023.04.1
agent_version 1.5.1
docker_version 23.0.3
disk_total 457.7 GB
disk_used 32.7 GB
healthy true
supported true
board rpi4-64
supervisor_api ok
version_api ok
installed_addons deCONZ (6.19.0), Let’s Encrypt (4.12.8), File editor (5.6.0), Samba share (10.0.1), Network UPS Tools (0.11.2), Spotify Connect (0.12.3), Terminal & SSH (9.7.0), Portainer (2.0.0), InfluxDB (4.6.0), Grafana (8.2.2), Node-RED (14.1.5), ESPHome (2023.4.4), Studio Code Server (5.5.7), Piper (0.1.2), Whisper (0.1.1)
Dashboards
dashboards 2
resources 15
views 13
mode storage
Recorder
oldest_recorder_run 6 mai 2023 à 15:07
current_recorder_run 8 mai 2023 à 17:52
estimated_db_size 222.38 MiB
database_engine sqlite
database_version 3.40.1
Spotify
api_endpoint_reachable failed to load: timeout

Hello,

C’est plutôt les sentences qui sont customisables ?

Tu peux aussi essayer de jouer sur les alias de tes entités