Perte d'accès total à HA tous les 2 jours

Hello la commu,

J’ai un problème qui arrive à peu près tous les 2 jours, mon HA devient inaccessible et plus rien ne fonctionne.
La seule solution que j’ai trouvé (pour le moment) est d’éteindre mon raspberry et de le redémarrer. vraiment pas cool en terme de stabilité …
A chaque fois dans le log system quand je pers ma connexion, il y a ce message qui apparait un bon nombre de fois dans le log system
WARNING (MainThread) [supervisor.host.network] Can’t update connectivity information: Error: Timeout was reached
J’ai fait des recherches sur le net sur la base de ce message, un bon nombre de personne ont ce message mais je n’ai trouvé aucun post ou quelqu’un avait finalement trouvé une solution pour y remédier.
Le message en soit ne me dérange pas tan que ça, c’est surtout la perte d’accès à HA qui est problématique.
Si quelqu’un a une idée sur l’origine du pb ou comment y remédier même juste une piste à creuser, je prends :wink:

Ma configuration


[center]## System Health

version core-2021.5.1
installation_type Home Assistant OS
dev false
hassio true
docker true
virtualenv false
python_version 3.8.9
os_name Linux
os_version 5.4.83-v8
arch aarch64
timezone Europe/Paris
Home Assistant Community Store
GitHub API ok
Github API Calls Remaining 4716
Installed Version 1.12.3
Stage running
Available Repositories 776
Installed Repositories 44
Home Assistant Cloud
logged_in true
subscription_expiration May 27, 2021, 2:00 AM
relayer_connected true
remote_enabled false
remote_connected false
alexa_enabled true
google_enabled true
can_reach_cert_server ok
can_reach_cloud_auth ok
can_reach_cloud ok
Home Assistant Supervisor
host_os Home Assistant OS 5.13
update_channel stable
supervisor_version supervisor-2021.04.3
docker_version 19.03.15
disk_total 109.3 GB
disk_used 5.4 GB
healthy true
supported true
board rpi4-64
supervisor_api ok
version_api ok
installed_addons Samba share (9.3.1), deCONZ (6.8.0), OpenZWave (0.9.1), Visual Studio Code (3.3.1), Grafana (6.3.3), NGINX Home Assistant SSL proxy (3.0.1), Terminal & SSH (9.1.1), Node-RED (9.0.1)
Lovelace
dashboards 1
resources 31
views 1
mode storage
[/center]

Tu es en Wifi ? Ethernet ?

Salut,

Oui désolé je n’avais pas précisé je suis en Ethernet.

Aruthaaah

as tu essayer de laisser brancher un ecran jusqu’au bug, il faut savoir si le bug viens du hardware ou de l’os…

nope je n’ai pas essayé cela, je vais le faire

Ça peut aussi venir de la mémoire ou du disque (fichier de log qui se rempli) qui saturent.
1ère chose à faire, désactiver tous les custom_components et retirer tout module lovelace

Pour la place sur le disk ssd je doute que ce soit cela 100 go de libre ca devrait le faire:

Sinon j’ai 4go de mémoire sur le raspberry ca devrait le faire aussi non ?

Oui c’est pas mal du temps mais dans le temps ça donne quoi ? Avec l’intégration system monitor tu peux suivre la charge mémoire et disque.
Tu peux avoir une intégration qui déconne avec une fuite de mémoire, ça sature la ram et ton pi ne répond plus

@Makai : je ne vois rien qui se nomme system monitor à intégrer.
Je peux voir l’utilisation de la ram et du cpu dans le core ou dans le supervisor mais pas quand mon ha est HS

T’as la doc ici :

Le tout c’est de surveiller voir si ça augmente dans le temps jusqu’au crash.
Niveau alimentation tout est OK ? Sachant que t’as un ssd il faut une bonne alimentation, 3A mini. Pas d’alerte de l’intégration suivante ?

Ok merci pour le lien de la doc je vais regarder cela.
Pour l’alimentation j’ai une 3.5A

Voilà c’est dans mon lovelace, je vais suivre l’évolution de tout cela merci encore :slight_smile:

Lorsque ça se reproduit essaie de déconnecter le câble Ethernet et de le rebrancher pour voir si tu retrouves l’accès…

Je me rappelle avoir eu le souci dans mes débuts avec la méthode supervised qui dispose elle aussi du superviseur sur mon pi4.

Je n’ai jamais très bien compris pourquoi cela me le faisait, et entre temps je suis passé sous un environnement docker (donc sans superviseur et sans les addons) et je n’ai jamais eu le soucis…

@Clemalex je ne l’avais pas précisé mais j’ai déjà essayé de débrancher le câble pour voir si je retrouve l’accès :slight_smile:

Hello,

J’avais un comportement similaire (cf: https://forum.hacf.fr/t/ha-indisponible-aleatoirement/3318), et depuis le « ha supervisor repair », je n’ai quasiment plus constaté de problèmes.

Bonne journée!

@Dapolux merci pour ton retour.
J’ai donc fait un ha supervisor repair aprés un processing done j’ai dans ma console le message suivant :
context deadline exceeded (client.timeout exceeded while awaiting headers)
Une piste de plus à suivre je vais voir ce que ça donne

Hello @Aruthaaah

J’ai exactement le même problème que toi. Je vais suivre l’aide de la communauté.
Par contre comment fais-tu pour récupérer les logs après le restart?
Chez moi le fichier est écrasé à chaque démarrage.

Merci,

Salut @Guillaume_Desmidt,
Pour le log je vais dans supervisor/system.
La je suis en train de changer de FAI (starklink est arrivé :slight_smile: Du coup mon HA est sur mon ancien réseau, je vais bientôt le basculer voir si le pb ne provenait pas de perte d’internet intempestif (p… de réseau 4g en campagne.

A+

Aruthaaah

1 « J'aime »

Bonsoir,

je me permets de répondre à ce message car je rencontre le même type de souci. Cependant, après avoir branché un écran, je constate à l’écran ce type de message d’erreur durant le freeze:

rcu: INFO: rcu_sched detected stalls on CPUs/tasks

Auriez-vous une idée de la cause ?

Merci

Thierry

PS>Je suis sur la dernière version stable de HA et j’utilise un Raspberry Pi 4B 4Go

Hello,

Je fais un retour sur ce post que j’ai initié.
Je n’ai plus du tout le problème. Ce qui a changé chez moi c’est que je n’ai plus le même FAI (j’avais bouygues télécom en 4G) et j’ai maintenant starlink avec un routeur Asus. Mon adresse mac n’est plus liée à une ipo fixe aussi.
Le problème venait il de la 4g parfois capricieuse ? ou du changement de routeur. Je ne sais pas mais maintenant c’est stable.
A+

Aruthaah

1 « J'aime »