Update 2024.10.3 - Instabilité et state_class manquante?

Salut la communauté !

Mon problème

J’ai fait la mise à jour 2024.10.3, ainsi que la mise à jour de 1 add-on. (ZwaveJS), et peut être un autre mais j’ai un doute.

J’ai eu une erreur :
image

Comme son nom l’indique, ce sensor contient ma conso d’électricité en heure pleine. Etant abonné tempo, j’ai 3 autres sensor que je dois cumuler pour distinguer les conso des jours rouges, blancs et bleus. Ce sensor était fonctionnel pendant 1 an…

Voici le ici de mon sensor.yaml :

    teleinfo_hchp_total :
        friendly_name: "Conso électricité HP"
        unit_of_measurement: 'kWh'
        value_template: '{{ states("sensor.teleinfo_hchp") |float(0) + states("sensor.teleinfo_hchpjb") | float(0) + states("sensor.teleinfo_hchpjw") | float(0) + states("sensor.teleinfo_hchpjr") | float(0) }}'

Mais ce n’est pas le seul défaut… Mon HA s’est mis à planter, et impossible d’accéder au système malgré les reboot.

Hier, j’ai fait une réinstallation complète grâce à un backup. Et sans surprise, l’erreur est là, et 1h après la fin de mes tests, HA était de nouveau inaccessible.

Et à minuit, quelques heures après le, HA était online et ce matin j’ai pu ouvrir les volets et allumer une lumière par exemple.

Maintenant, j’attends que ça plante…

Je n’ai pas encore trouvé comment faire disparaitre ce message d’erreur, mon tableau de bord « Energy » est HS, et surtout, je ne sais pas si l’instabilité de mon système est dû à ça.

Auriez-vous une idée ?

Ma configuration

En synthèse : RPI 3 / NVME sur port USB / dongle ZWave


System Information

version core-2024.10.3
installation_type Home Assistant OS
dev false
hassio true
docker true
user root
virtualenv false
python_version 3.12.4
os_name Linux
os_version 6.6.31-haos-raspi
arch aarch64
timezone Europe/Paris
config_dir /config
Home Assistant Community Store
GitHub API ok
GitHub Content ok
GitHub Web ok
HACS Data ok
GitHub API Calls Remaining 5000
Installed Version 2.0.1
Stage running
Available Repositories 1513
Downloaded Repositories 6
Home Assistant Cloud
logged_in false
can_reach_cert_server ok
can_reach_cloud_auth ok
can_reach_cloud ok
Home Assistant Supervisor
host_os Home Assistant OS 13.2
update_channel stable
supervisor_version supervisor-2024.10.2
agent_version 1.6.0
docker_version 27.2.0
disk_total 234.0 GB
disk_used 4.6 GB
healthy true
supported true
host_connectivity true
supervisor_connectivity true
ntp_synchronized true
virtualization
board rpi3-64
supervisor_api ok
version_api ok
installed_addons Z-Wave JS (0.8.0), File editor (5.8.0)
Dashboards
dashboards 4
resources 5
views 6
mode storage
Recorder
oldest_recorder_run October 20, 2024 at 12:55 PM
current_recorder_run October 20, 2024 at 11:41 PM
estimated_db_size 693.00 MiB
database_engine sqlite
database_version 3.45.3
___

Bonjour,
il faudrait ajouter un state_class à l’entité.

Le souci, c’est que tu utilises un template sensor avec l’ancien format, qui ne supporte pas le state_class.
Et qui n’est pas recommandé !

Il faut passer sur le nouveau format de template qui supporte le stat_class.

Regarde la doc, pour convertir sur le nouveau format, car il y a du changement dans la façon de le faire :

PS:
@Herbs , ça y est tu vas voir que l’ancien format de template, va plus être supporté.
J’en parlais depuis un moment.

1 « J'aime »

Visiblement la compatibilité n’est plus assurée…

Je tente une 1ère migration pour voir.

1 « J'aime »

Salut,
J’ai fait le changement sans difficulté à priori, sauf que quelques minutes plus tard, HA est devenu inaccessible. Pris par le travail, je n’ai pas regardé. Et après reboot sauvage à 20h, tout fonctionne bien et le message d’erreur semble avoir disparu.

L’instabilité m’inquiète et je dois trouver d’où ça vient. RPI3 trop vieux, SSD trop vieux… Je ne trouve pas d’info dans les log. Je ne sais pas si je regarde au bon endroit.

Le rpi 3 commence a être trop juste pour ha en effet. Après est ce que c’était ça ?

1 « J'aime »

Sais tu si on peut faire une recherche dans les logs en ciblant l’heure de plantage ou en ciblant des sources de crash ?
Il y a pas mal d’erreurs dans les logs, mais elles ne sont pas forcément de nature à faire planter le système.

Tu peux récupérer le fichier log et faire une recherche classique dans notepad par exemple

Salut,
Je ne vois aucune erreur critique dans les logs. J’ai fait la nouvelle mise jour ce week-end, et c’est pire que tout. J’ai rarement plus que 30 min d’accès à l’UI. Par contre mes rares automatisations fonctionnent !

J’ai tenté d’alimenter mon rpi avec une alim officielle, et de mettre un hub USB auto alimenté pour mes 2 dongles, mais ça n’a rien changé.

Salut

Il y a forcement des infos dans les logs (journaux complets, le reste c’est beaucoup trop léger)
C’est le seul moyen de comprendre ce qu’il se passe.

Est ce possible de les récupérer en ssh ? Je n’arrive que trop rarement à voir l’UI.

Les logs sont des fichiers donc oui

Je dois chercher la procédure pour me connecter. Tu sais quel fichier je dois récupérer ? Sinon je vais également chercher ça.

Je viens de retrouver un accès à mon UI. Tu me conseilles quels logs ?

Tu prends les logs complets, pas les résultats filtrés par addons Donc récupère les fichiers home-assistant.log et home-assistant.log.1

Je n’ai pas encore cherché comment me connecter en ssh, mais j’ai commencé à regardé les logs.

Pour HOST, j’ai le bluetooth qui semble posé problème mais ça ne devrait pas être critique…

2024-11-06 06:35:06.548 homeassistant kernel: Bluetooth: hci0: Frame reassembly failed (-84)
2024-11-06 06:35:06.549 homeassistant kernel: Bluetooth: hci0: Frame reassembly failed (-84)
2024-11-06 06:35:06.550 homeassistant kernel: Bluetooth: hci0: Frame reassembly failed (-84)
2024-11-06 06:35:08.771 homeassistant kernel: Bluetooth: hci0: command 0x200c tx timeout
2024-11-06 06:35:08.772 homeassistant kernel: Bluetooth: hci0: Opcode 0x200c failed: -110
2024-11-06 06:35:08.772 homeassistant kernel: Bluetooth: hci0: Opcode 0x200c failed: -110
2024-11-06 06:35:08.774 homeassistant kernel: Bluetooth: hci0: failed to restart LE scan: status -110
2024-11-06 06:35:08.910 homeassistant kernel: Bluetooth: hci0: Frame reassembly failed (-84)
2024-11-06 06:35:08.911 homeassistant kernel: Bluetooth: hci0: Received unexpected HCI Event 0x00
2024-11-06 06:35:08.911 homeassistant kernel: Bluetooth: hci0: Frame reassembly failed (-84)
2024-11-06 06:35:08.911 homeassistant kernel: Bluetooth: hci0: Frame reassembly failed (-84)
2024-11-06 06:35:08.955 homeassistant kernel: Bluetooth: hci0: Frame reassembly failed (-84)
2024-11-06 06:35:08.956 homeassistant kernel: Bluetooth: hci0: Received unexpected HCI Event 0x00
2024-11-06 06:35:08.956 homeassistant kernel: Bluetooth: hci0: Frame reassembly failed (-84)
2024-11-06 06:35:10.820 homeassistant kernel: Bluetooth: hci0: Opcode 0x200c failed: -110
2024-11-06 06:35:10.821 homeassistant kernel: Bluetooth: hci0: command 0x200c tx timeout
2024-11-06 06:35:10.821 homeassistant kernel: Bluetooth: hci0: Unable to disable scanning: -110
2024-11-06 06:35:10.824 homeassistant kernel: Bluetooth: hci0: Opcode 0x2005 failed: -16
2024-11-06 06:35:54.723 homeassistant kernel: Bluetooth: hci0: command 0x200c tx timeout
2024-11-06 06:35:54.724 homeassistant kernel: Bluetooth: hci0: Opcode 0x200c failed: -110
2024-11-06 06:35:54.725 homeassistant kernel: Bluetooth: hci0: Opcode 0x200c failed: -110
2024-11-06 06:35:54.726 homeassistant kernel: Bluetooth: hci0: failed to restart LE scan: status -110
2024-11-06 06:36:45.915 homeassistant kernel: Bluetooth: hci0: Frame reassembly failed (-84)
2024-11-06 06:36:45.916 homeassistant kernel: Bluetooth: hci0: Frame reassembly failed (-84)
2024-11-06 06:36:45.916 homeassistant kernel: Bluetooth: hci0: Frame reassembly failed (-84)
2024-11-06 06:37:00.024 homeassistant kernel: Bluetooth: hci0: Frame reassembly failed (-84)
2024-11-06 06:37:00.025 homeassistant kernel: Bluetooth: hci0: Frame reassembly failed (-84)
2024-11-06 06:40:09.187 homeassistant kernel: audit: type=1334 audit(1730875209.180:228): prog-id=59 op=LOAD
2024-11-06 06:40:09.193 homeassistant systemd[1]: Started Journal Gateway Service.
2024-11-06 06:40:09.323 homeassistant systemd-timesyncd[519]: Network configuration changed, trying to establish connection.
2024-11-06 06:40:09.331 homeassistant systemd-timesyncd[519]: Contacted time server 162.159.200.123:123 (time.cloudflare.com).
2024-11-06 06:41:00.712 homeassistant kernel: Bluetooth: hci0: Frame reassembly failed (-84)
2024-11-06 06:41:00.753 homeassistant kernel: Bluetooth: hci0: Frame reassembly failed (-84)
2024-11-06 06:41:00.787 homeassistant kernel: Bluetooth: hci0: Frame reassembly failed (-84)
2024-11-06 06:41:00.797 homeassistant kernel: Bluetooth: hci0: Frame reassembly failed (-84)
2024-11-06 06:41:00.798 homeassistant kernel: Bluetooth: hci0: Frame reassembly failed (-84)
2024-11-06 06:41:02.948 homeassistant kernel: Bluetooth: hci0: command 0x200c tx timeout
2024-11-06 06:41:02.958 homeassistant kernel: Bluetooth: hci0: Opcode 0x200c failed: -110
2024-11-06 06:41:02.958 homeassistant kernel: Bluetooth: hci0: Opcode 0x200c failed: -110
2024-11-06 06:41:02.958 homeassistant kernel: Bluetooth: hci0: failed to restart LE scan: status -110
2024-11-06 06:41:03.015 homeassistant kernel: Bluetooth: hci0: Frame reassembly failed (-84)
2024-11-06 06:41:03.016 homeassistant kernel: Bluetooth: hci0: Received unexpected HCI Event 0x00

Côté Supervisor, 1 seule erreur pour l’instant :

2024-11-06 07:07:37.221 ERROR (MainThread) [supervisor.backups.backup] Can't read backup tarfile /data/backup/395f2650.tar: "filename './backup.json' not found"
2024-11-06 07:07:38.784 INFO (MainThread) [supervisor.discovery] Loaded 1 messages
2024-11-06 07:07:38.785 INFO (MainThread) [supervisor.ingress] Loaded 0 ingress sessions
2024-11-06 07:07:38.785 INFO (MainThread) [supervisor.resolution.check] Starting system checks with state setup
2024-11-06 07:07:38.786 INFO (MainThread) [supervisor.resolution.checks.base] Run check for detached_addon_missing/addon
2024-11-06 07:07:38.786 INFO (MainThread) [supervisor.resolution.checks.base] Run check for multiple_data_disks/system
2024-11-06 07:07:38.787 INFO (MainThread) [supervisor.resolution.checks.base] Run check for detached_addon_removed/addon
2024-11-06 07:07:38.788 INFO (MainThread) [supervisor.resolution.checks.base] Run check for disabled_data_disk/system
2024-11-06 07:07:38.788 INFO (MainThread) [supervisor.resolution.check] System checks complete
2024-11-06 07:07:38.788 INFO (MainThread) [supervisor.resolution.evaluate] Starting system evaluation with state setup
2024-11-06 07:07:38.789 INFO (MainThread) [supervisor.resolution.evaluate] System evaluation complete
2024-11-06 07:07:38.790 INFO (MainThread) [supervisor.jobs] 'ResolutionFixup.run_autofix' blocked from execution, system is not running - setup
2024-11-06 07:07:38.791 INFO (MainThread) [supervisor.resolution.evaluate] Starting system evaluation with state setup
2024-11-06 07:07:38.792 INFO (MainThread) [supervisor.resolution.evaluate] System evaluation complete
...

Je viens d’installer le plugin SSH, je fais un ha core check puis je regarde où trouver les fichiers que tu indiques.

Edit : je me suis connecté via le terminal en ligne et j’ai lancé lacommande ha core check et boum, encore…

Tu peux commencer par désactiver le Bluetooth.
Ça retirera un peu de charge sur ton pi.
Bien évidemment le check est long à faire… Donc processing, c’est pas une erreur

J’ai pu me connecter en ssh, et récupérer les logs que tu cites, mais elles n’ont pas plus de lignes que ce que j’ai vu à l’écran.

L’erreur sur ma capture, c’est que l’UI a été de nouveau indisponible à 8h26. Elle est réapparue toute seule à 8h44. Je n’ai pas de log pour 8h26 :thinking:

Sais tu s’il est possible de désactiver une intégration temporairement pour les tester une par une ?

J’ai par une grosse erreur sur du rendu front dans la log à cause d’un message mqtt qui a un payload qui lui déplait dans certaines circonstances. Je l’ai désactivé, l’erreur doit donc disparaitre.

Tu peux toujours désactiver des intégrations, en allant dessus puis menu à droite.
Par contre, si ça coupe et que ça revient tout seul, ça veut sans doute dire que ça ne plante pas mais que tu as un truc qui surcharge ton système.

HS toute la journée malgré 3 reboot, et là c’est revenu après reboot pendant 30 min environ.

J’ai pu désactiver plusieurs intégrations (bluetooth et device Xiaomi). J’étais en train de regarder mes scénarios et boom, HS.

La commande ha core check est correcte ??

[core-ssh config]$ ha core check
Processing... Done.

Post "http://supervisor/core/check": context deadline exceeded (Client.Timeout exceeded while awaiting headers)

oui le check se termine bien
Jette un oeil au dernier message context deadline exceeded (Client.Timeout exceeded while awaiting headers) with HAOS 5.6+ · Issue #1108 · home-assistant/operating-system · GitHub