Perte d'accès à HA après un certain temps

Elmout · Octobre 22, 2023, 4:49

Bonjour à tous,

J’ai depuis quelques jours (3/4) une perte d’accessibilité de ma box domotique sous Home Assistant sans que je comprenne pourquoi … Après chaque redémarre tout refonctionne parfaitement mais au bout d’un certains temps (12h voire moins) je reperds l’accès.

Hier j’ai pourtant trouvé des erreurs dans mes logs et en cherchant sur le net j’ai trouvé qu’il fallait faire un « ha supervisor repair » mais visiblement ça n’a pas suffit. Je n’ai pas de saturation quelconque (mémoire, cpu, disque) et je ne viens pas d’installer un nouveau add-on ou intégration. Je n’ai pas non plus créé des nouvelles automatisations.

Hier après le « repair » j’ai dû désinstaller et réinstaller frigate et node-red qui ne voulait plus démarrer pour des raisons assez obscures.

Ce matin j’étais donc confiant puisqu’après plus de 12h tout semblait ok mais ce soir rebelotte … perte de connexion.

Est-ce qu’il y a une news que j’aurais pas vu/lu avec la dernière version de Home Assistant qui poserait soucis ?

J’ai récupéré des logs mais à chaque fois ça reste des logs de démarrage pas de l’historique au moment où ça plante … comment faire pour les avoir ?
Je crois que je viens de trouver et j’ai ceci dans les logs :

2023-10-22 16:01:06.094 INFO (MainThread) [homeassistant.components.recorder] Backup start notification, locking database for writes
2023-10-22 16:02:17.923 INFO (MainThread) [homeassistant.components.recorder] Backup end notification, releasing write lock
2023-10-22 16:02:17.924 INFO (Recorder) [homeassistant.components.recorder.core] Database queue backlog reached 23 entries during backup

Ce sont les dernières logs du fichiers

Merci beaucoup pour votre aide.

Ma configuration

[center]## System Information

version	core-2023.10.3
installation_type	Home Assistant OS
dev	false
hassio	true
docker	true
user	root
virtualenv	false
python_version	3.11.5
os_name	Linux
os_version	6.1.56
arch	x86_64
timezone	Europe/Paris
config_dir	/config

Home Assistant Community Store

GitHub API	ok
GitHub Content	ok
GitHub Web	ok
GitHub API Calls Remaining	4798
Installed Version	1.33.0
Stage	running
Available Repositories	1319
Downloaded Repositories	32

Home Assistant Cloud

logged_in	false
can_reach_cert_server	ok
can_reach_cloud_auth	ok
can_reach_cloud	ok

Home Assistant Supervisor

host_os	Home Assistant OS 11.0
update_channel	stable
supervisor_version	supervisor-2023.10.0
agent_version	1.6.0
docker_version	24.0.6
disk_total	109.3 GB
disk_used	36.8 GB
healthy	true
supported	true
board	generic-x86-64
supervisor_api	ok
version_api	ok
installed_addons	Terminal & SSH (9.7.1), Samba Backup (5.2.0), File editor (5.6.0), Mosquitto broker (6.3.1), Zigbee2MQTT (1.33.1-1), Z-Wave JS UI (2.2.3), ESPHome (2023.10.1), Whisper (1.0.0), Piper (1.4.0), Let’s Encrypt (4.12.9), PSA Car Controller (v3.0.12), Frigate (0.12.1), Node-RED (14.6.3)

Dashboards

dashboards	2
resources	21
views	15
mode	storage

Recorder

oldest_recorder_run	October 20, 2023 at 13:38
current_recorder_run	October 22, 2023 at 18:35
estimated_db_size	102.99 MiB
database_engine	sqlite
database_version	3.41.2

[/center] points en haut a droite > `Informations Système` puis une fois en bas `Copier` ___

Giga77 · Octobre 22, 2023, 5:00

Salut

Quand HA redémarre, les anciens logs sont stockés dans le fichier : « home-assistant.log.1 ».

Elmout:

Je crois que je viens de trouver et j’ai ceci dans les logs :

2023-10-22 16:01:06.094 INFO (MainThread) [homeassistant.components.recorder] Backup start notification, locking database for writes
2023-10-22 16:02:17.923 INFO (MainThread) [homeassistant.components.recorder] Backup end notification, releasing write lock
2023-10-22 16:02:17.924 INFO (Recorder) [homeassistant.components.recorder.core

Ici, il n’y a rien d’anormal.

Oles67 · Octobre 22, 2023, 7:02

Et sur le port 4357 quand c’est planté ?

Elmout · Octobre 22, 2023, 8:36

je ne connais pas ce port mais je testerai si ça resurvient. C’est quoi un port « sans échec » ?

J’ai trouvé une erreur dans mes logs qui revient à de multiples reprises :

Logger: homeassistant.helpers.event
Source: helpers/template.py:570
First occurred: 22:28:06 (26 occurrences)
Last logged: 22:28:07

Error while processing template: Template<template=({{ states('sensor.sun_next_setting') | as_timestamp | timestamp_custom(' %I:%M %p', default=0) }}) renders=6>
Error while processing template: Template<template=({{ states('sensor.sun_next_rising') | as_timestamp | timestamp_custom(' %I:%M %p', default=0) }}) renders=10>
Error while processing template: Template<template=({{ states('sensor.sun_next_setting') | as_timestamp | timestamp_custom(' %I:%M %p', default=0) }}) renders=8>
Error while processing template: Template<template=({{ states('sensor.sun_next_rising') | as_timestamp | timestamp_custom(' %I:%M %p', default=0) }}) renders=22>
Error while processing template: Template<template=({{ states('sensor.sun_next_setting') | as_timestamp | timestamp_custom(' %I:%M %p', default=0) }}) renders=18>
Traceback (most recent call last):
  File "/usr/src/homeassistant/homeassistant/helpers/template.py", line 568, in async_render
    render_result = _render_with_context(self.template, compiled, **kwargs)
                    ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
  File "/usr/src/homeassistant/homeassistant/helpers/template.py", line 2196, in _render_with_context
    return template.render(**kwargs)
           ^^^^^^^^^^^^^^^^^^^^^^^^^
  File "/usr/local/lib/python3.11/site-packages/jinja2/environment.py", line 1301, in render
    self.environment.handle_exception()
  File "/usr/local/lib/python3.11/site-packages/jinja2/environment.py", line 936, in handle_exception
    raise rewrite_traceback_stack(source=source)
  File "<template>", line 1, in top-level template code
  File "/usr/local/lib/python3.11/site-packages/jinja2/sandbox.py", line 393, in call
    return __context.call(__obj, *args, **kwargs)
           ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
TypeError: AllStates.__call__() got an unexpected keyword argument 'default'

The above exception was the direct cause of the following exception:

Traceback (most recent call last):
  File "/usr/src/homeassistant/homeassistant/helpers/template.py", line 694, in async_render_to_info
    render_info._result = self.async_render(
                          ^^^^^^^^^^^^^^^^^^
  File "/usr/src/homeassistant/homeassistant/helpers/template.py", line 570, in async_render
    raise TemplateError(err) from err
homeassistant.exceptions.TemplateError: TypeError: AllStates.__call__() got an unexpected keyword argument 'default'

Mais je ne vois pas trop en quoi cela causera un arrêt de l’instance Home Assistant et sa non accessibilité. Surtout que l’affichage est totalement correcte sur mon dashboard

Information complémentaire, j’ai HA qui me propose une mise à jour de Home Assistante Core Update mais que je n’arrive pas à appliquer ça tourne en rond mais pas de message d’erreur ou autre

WarC0zes · Octobre 23, 2023, 1:34

Bonjour,
c’est un accès a Home assistant observer, qui te donne le statut de HA.

Elmout:

J’ai trouvé une erreur dans mes logs qui revient à de multiples reprises :

Logger: homeassistant.helpers.event
Source: helpers/template.py:570
First occurred: 22:28:06 (26 occurrences)
Last logged: 22:28:07

Error while processing template: Template<template=({{ states('sensor.sun_next_setting') | as_timestamp | timestamp_custom(' %I:%M %p', default=0) }}) renders=6>
Error while processing template: Template<template=({{ states('sensor.sun_next_rising') | as_timestamp | timestamp_custom(' %I:%M %p', default=0) }}) renders=10>
Error while processing template: Template<template=({{ states('sensor.sun_next_setting') | as_timestamp | timestamp_custom(' %I:%M %p', default=0) }}) renders=8>
Error while processing template: Template<template=({{ states('sensor.sun_next_rising') | as_timestamp | timestamp_custom(' %I:%M %p', default=0) }}) renders=22>
Error while processing template: Template<template=({{ states('sensor.sun_next_setting') | as_timestamp | timestamp_custom(' %I:%M %p', default=0) }}) renders=18>
Traceback (most recent call last):
  File "/usr/src/homeassistant/homeassistant/helpers/template.py", line 568, in async_render
    render_result = _render_with_context(self.template, compiled, **kwargs)
                    ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
  File "/usr/src/homeassistant/homeassistant/helpers/template.py", line 2196, in _render_with_context
    return template.render(**kwargs)
           ^^^^^^^^^^^^^^^^^^^^^^^^^
  File "/usr/local/lib/python3.11/site-packages/jinja2/environment.py", line 1301, in render
    self.environment.handle_exception()
  File "/usr/local/lib/python3.11/site-packages/jinja2/environment.py", line 936, in handle_exception
    raise rewrite_traceback_stack(source=source)
  File "<template>", line 1, in top-level template code
  File "/usr/local/lib/python3.11/site-packages/jinja2/sandbox.py", line 393, in call
    return __context.call(__obj, *args, **kwargs)
           ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
TypeError: AllStates.__call__() got an unexpected keyword argument 'default'

The above exception was the direct cause of the following exception:

Traceback (most recent call last):
  File "/usr/src/homeassistant/homeassistant/helpers/template.py", line 694, in async_render_to_info
    render_info._result = self.async_render(
                          ^^^^^^^^^^^^^^^^^^
  File "/usr/src/homeassistant/homeassistant/helpers/template.py", line 570, in async_render
    raise TemplateError(err) from err
homeassistant.exceptions.TemplateError: TypeError: AllStates.__call__() got an unexpected keyword argument 'default'

Mais je ne vois pas trop en quoi cela causera un arrêt de l’instance Home Assistant et sa non accessibilité. Surtout que l’affichage est totalement correcte sur mon dashboard

Pour être sur que ca soit pas le template qui pose problème, tu le supprime et test. Ca coute rien .

Oles67 · Octobre 23, 2023, 4:48

Il t’affiche le status de ha et quelques log il me semble quand ça merde

Elmout · Octobre 23, 2023, 5:32

Cette après-midi replantage (je n’avais pas vu votre réponse je n’ai pas pu tester le port 4357).

Vu l’heure approximative du plantage je penche pour un soucis avec Samba Backup (plantage entre 15h et 17h, sauvegarde programmée à 16h), car je n’ai pas de sauvegarde de faite.

Par contre dans le fichier log.1 aucune trace inhabituelle, rien sur les logs de samba backup, …

Je viens de « forcer » une sauvegarde en étant sur mon interface et en indiquant de faire une sauvegarder dans 10 minutes (vue capacité CPU et RAM, terminal répertoire backup, add-on log samba, log supervisor, …)

Tout semblait OK puisqu’il a m’a bien généré un backup en local :
HA_backup_repo

Sauf que 2 minutes après plus accès à rien ! Même le port 4357 me renvoi une erreur « Ce site est inaccessible », et bien sûr rien sur mon NAS qui est la destination « à distance » du backup. Je crois donc avoir trouvé mon fauteur de trouble

Reste à comprendre pourquoi d’un coup il se met à me poser des problèmes …

Elmout · Octobre 24, 2023, 7:16

Je pense avoir vraiment trouvé la cause puisqu’aujourd’hui aucun plantage ! Samba Backup étant désactivé (seul changement) a priori ça confirme bien.

Question bête sur ce plugin pour ceux qui maitrise : est-ce qu’avoir un problème d’avoir un chemin de sauvegarde sur un NAS avec des espaces ?

Elmout · Octobre 25, 2023, 4:11

Puisque je n’ai pas eu de plantage suite à l’arrêt de l’add-on Samba Backup, j’ai voulu tenter la mise à jour qui m’était proposé sur Home Assistant Core 2023.10.5 (à partir de 2023.10.3) mais voilà c’était trop beau.

J’ai bien sûr décoché la case demandant de faire un backup au préalable puisque je savais que c’était un peu bancal de ce côté là. Par contre la mise à jour ne s’est pas faite et j’ai même perdu l’accès à Home Assistant, l’observer ne répondait pas non plus donc plantage total a priori.

Après un redémarrage forcé donc, aucune trace d’erreur dans les logs historique (log.1) ni dans Système → Logs → Home Assistant Core / Supervisor …

Où est-ce que je pourrais trouver une log qui m e dirait pourquoi ça a planté : manque d’espace disque, problème CPU, problème RAM, problème lock sur un fichier, n’importe quoi qui me mettrait sur la piste.

J’ai regardé du côté de Système → Correction mais visiblement tout est OK (mouais …)

Merci pour votre aide !

EDIT : Ce soir plantage à nouveau
Dans le fichier log.1 toujours pas d’erreur, les derniers messages sont :

2023-10-25 21:11:15.594 INFO (MainThread) [homeassistant.components.recorder] Backup start notification, locking database for writes
2023-10-25 21:12:26.118 INFO (MainThread) [homeassistant.components.recorder] Backup end notification, releasing write lock
2023-10-25 21:12:26.120 INFO (Recorder) [homeassistant.components.recorder.core] Database queue backlog reached 11 entries during backup

Que je ne comprends pas bien puisque j’ai désactivé l’add-on de backup …

Elmout · Octobre 27, 2023, 12:39

Salut salut, toujours avec le même soucis de mon côté …

J’ai déporté frigate sur mon nas synology via docker au cas où ça pouvait poser soucis en terme de charge cpu/ram mais visiblement ça ne change pas grand chose.

J’ai également fait manuellement un backup via Système → Sauvegarde. Le fichier a bien été généré (suivi faite via terminal dans le répertoire backup) et était même visiblement depuis l’interface ! J’ai commencé à le télécharger et hop perte de connexion '-_-

Et bien sûr aucune information dans les logs qui me permettent de trouver la cause …

golfvert · Octobre 27, 2023, 12:50

Ca tourne sur quelle machine ?
Ca ressemble à un problème de port Ethernet qui se met en vrac.
Si c’est du realtek, il ne faudra pas chercher plus loin…

Elmout · Octobre 27, 2023, 1:50

Home Assistant tourne sur un Intel NUC modèle NUC6CAY

Visiblement c’est un port ethernet « realtek » de ce que je vois sur la doc. Ca serait un soucis connu ? Il est apparu avec la dernière version de Home Assistant ? Ya un contournement ou un correctif ?

golfvert · Octobre 27, 2023, 2:02

Si tu cherches sur google issue realtek ethernet linux tu verras de nombreuses réponses.
Ce n’est pas nouveau.
C’est assez aléatoire, ça peut marcher pour certains, dans certaines versions, pas pour d’autres…
En résumé, c’est pas fiable.

A ma connaissance, pas vraiment. Parfois, une nouvelle version d’un driver améliore les choses. Parfois non.
En gros, dès que tu as un trafic important sur l’interface ça peut arriver.

Je ne sais pas si un port Ethernet via l’usb3 pourrait améliorer les choses, ni si HAOS le supporte.

Elmout · Octobre 27, 2023, 2:14

Du coup le mieux serait de changer de mini-pc pour un qui n’a pas de port ethernet « realtek » ?

Au delà du fait de devoir racheter un mini-pc n’ayant plus de sauvegarde depuis plusieurs jours/semaines je vais devoir tout reconfigurer du coup …

J’ai dû mal quand même à comprendre pourquoi cela m’arrive maintenant alors que tout fonctionnait nickel il y a encore quelques jours/semaines … Il me semblait que l’aléatoire n’existait pas en informatique
D’ailleurs c’est quoi le rapport du plantage avec le port ethernet lors d’une sauvegarde en local ? A priori il n’est pas utilisé et ne devrait pas poser de soucis à ce moment là non ?

TyTroll · Octobre 27, 2023, 2:18

Bonjour, as tu essayé d’envoyer un ping via la CLI vers une autre adresse présente sur ton réseau quand c’est planté? tu as installé HAOS directement sur le NUC ou tu passes par un hyperviseur?

Elmout · Octobre 27, 2023, 2:46

Oui j’ai installé Home Assistant OS sur le SSD de mon Intel NUC directement.

Quand tu dis « envoyer un ping via la CLI » tu parles depuis le NUC vers un autre équipement de mon réseau genre mon NAS ? Si c’est bien ça je n’ai jamais essayé car je n’ai pas d’écran ni de clavier sur mon nuc d’installer du coup j’ai pas vraiment la main dessus et je n’ai pas mis en place un système de connexion à distance dessus

TyTroll · Octobre 27, 2023, 2:51

Oui

ça c’est pas bien
Si c’est réellement un problème de compatibilité entre la carte réseau et HAOS, l’idée serai d’installer un hyperviseur comme Proxmox et faire une VM pour ton HAOS comme ça plus de problème puisque c’est l’hyperviseur qui va gérer la carte. Celle reliée à HAOS sera générée par l’hyperviseur.

Bobleponge · Octobre 27, 2023, 2:59

Hello,

j’avais un souci similaire mais qui venait de proxmox lui meme suite à la version 8.
Perte de connexion à HA et autres VM dû à la carte réseau non reconnue par Proxmox.
Je ne sais pas si tu tournes avec proxmox sur ton NUC. Normalement le souci a été réglé par proxmox mais on sait jamais ca peut etre une piste.

TyTroll · Octobre 27, 2023, 3:04

Je ne sais si c’est pour moi… mais perso je suis avec Proxmox et je n’ai pas de problème. Mon NUC est un vieux ThinkCentre I5 4ème génération avec 16Go de RAM. IL fait tourner 4VM. Mon HA est stable, rien à voir avec mon RPI3 .

golfvert · Octobre 27, 2023, 3:17

et

Ce n’est plus « local »…

Si, si. Ca arrive.