Actuellement, je m’amuse à créer des commandes vocales. Mais je suis tombé sur un os quand j’ai voulu commander un minuteur. Quand par exemple je prononce :
Et là mon automatisation tombe à l’eau, car la variable que je récupère est censée contenir un nombre … Donc pour résumer tout fonctionne bien, que ça soit le satellite, le déclenchement de l’automatisation, même changer la valeur du minuteur (quand faster-whisper écrit les nombres avec des chiffres). Là où ça coince c’est vraiment cette conversion STT qui parfois m’écrit le nombre en toutes lettres …
It is not possible to use Python imports with this integration
Donc je ne pourrai pas importer ce module.
Si quelqu’un a une idée, soit pour forcer faster-whisper à écrire les nombre avec des chiffres, ou un moyen dans HA pour transformer les nombres écrit en toutes lettres.
Quel matériel utilise tu pour assist ?
Les sentences « minuteur » sont natives dans HA, pas la peine de creer des automatisations.
La seule contrainte, avoir un équipement compatible : ESP intégrant le bon code, Wyoming satellite, application companion.
Tu peux par exemple dire : « Démarre un minuteur pizza de 10 minutes », ou " allume la télévision dans 5 minutes"…etc
Mon serveur risque d’être sur les rotules pour les mêmes résultats. À l’occasion je testerai quand même ça sur mon pc de bureau histoire de voir les résultats et combien ce modèle consomme en ressource.
Faster Whisper est optimal qu’en anglais, par contre pour les autres langues…no comment .
Donc normal que les retours sur un forum anglophone,pour des anglophones , ne soient pas très bon.
Mais sur ce même forum anglophone, sur lequel j’ai conseillé vosk pour de l’espagnol, de l’Allemand, du Suédois,…etc tous les retours sont plus que positifs comparés à Whisper.
Plusieurs d’entre nous ici utilisent vosk ( même sur RPI) et en sont plus que satisfait comparé à Whisper.
Et pas la peine d’utiliser un modèle différent que celui chargé par défaut par l’addon. Il est largement suffisant pour les sentences natives HA ou autres
Exemple concret du comportement que je souhaite :
Quand je suis dans la cuisine, je veux pouvoir dire à mon téléphone :
Démarre le minuteur pour dix minutes
Puis dix minutes plus tard, mon téléphone m’avertira que le temps est écoulé.
En utilisant le modèle « medium-int8 », je suis très satisfait, le seul problème qui persiste est cette fameuse retranscription de certains nombres en toutes lettres.
Ok, comme je l’ai déjà mentionné : à l’occasion je testerai.
Pour l’instant je suis satisfait, quand je cuisine je ne suis pas à 4s près, et on dévie du problème posé : comment s’assurer qu’un nombre sera bien transcrit en numérique plutôt qu’en toutes lettres ?
Et comme je l’ai dis dans mon premier post, toute la chaîne wyoming fonctionne très bien, le seul truc qui foire c’est que, parfois, certains nombres sont écrit en toutes lettres par faster-whisper.
Et je suis prêt à parier que si tu prononce : « 2 minutes », n’importe quel STT pourrait te sortir :
« de minutes »
« deux minutes »
« d’eux minutes »
ou encore d’autres trucs qui sont bien des mots français, mais pas des nombres. Or pour démarrer un minuteur il faut une valeur numérique, là est tout le problème.
Tu as mis à jour ton Wyoming Satellite ?
Dans le github tu as bien les fonctions de timer d’implementées.
Ce que j’essaie de te faire comprendre c’est qu’avec ces fonctions timer natives pas de pb de conversion texte vers nombre et pas besoin de s’embêter avec des auto