HA Crash mon réseau toute les heures?

Bonjour à tous,

Pour les passionné de debug, j’ai un problème … intéressant

Depuis quelques temps mon réseau crash toute les 60 minutes exactement [Netflix / Canal+ / Réunion Teams / …] |Edit : Je précise => Mon réseau"Tombe" pendant 15 à 20 secondes, Netflix ou mon Sonos se fige pendant ce laps de temps| sur tous mes appareils connectés [TV / SmartPhone / Ordi Pro ou perso …]
Après pas mal d’invest, il semble que le problème viennent de mon instance HA sur Raspberry PI4

Ma config me permet d’affirmer que ce n’est pas mon lien réseau qui est en cause

  • Tout ce qui est après mon routeur se plante : c’est le sous-réseau ou se trouve mon HA
  • Pour isoler le pb j’ai reboot tous mes actifs avec 10mn d’écart jusqu’à trouver un indice de la culpabilité de HA !

J’ai fais beaucoup de MAJ ces derniers temps [Z2MQTT / HA Core / …] et je ne sais pas identifier à quel moment ça a commencer à planter
J’ai aussi tenté de désinstaller des add-on qui touchent au réseau [Telegram / Music Assistant Server], sans succés

Je suis en train d’installer un PFSense en coupure pour voir si je vois passer des trames louches …

En fait mon réseau se comporte comme si il prenait un broadcast storm

Dans les logs « Supervisor » j’ai ça, EXACTEMENT TOUTE LES HEURES, et au moment ou ça crash [Ça fait beaucoup d’indices !]

2025-05-05 15:12:16.487 INFO (MainThread) [supervisor.resolution.check] Starting system checks with state running
2025-05-05 15:12:16.488 INFO (MainThread) [supervisor.resolution.checks.base] Run check for pwned/addon
2025-05-05 15:12:16.653 INFO (MainThread) [supervisor.resolution.checks.base] Run check for disabled_data_disk/system
2025-05-05 15:12:16.654 INFO (MainThread) [supervisor.resolution.checks.base] Run check for dns_server_ipv6_error/dns_server
2025-05-05 15:12:16.655 INFO (MainThread) [supervisor.resolution.checks.base] Run check for ipv4_connection_problem/system
2025-05-05 15:12:16.655 INFO (MainThread) [supervisor.resolution.checks.base] Run check for trust/supervisor
2025-05-05 15:12:16.671 INFO (MainThread) [supervisor.resolution.checks.base] Run check for free_space/system
2025-05-05 15:12:16.674 INFO (MainThread) [supervisor.resolution.checks.base] Run check for docker_config/system
2025-05-05 15:12:16.675 INFO (MainThread) [supervisor.resolution.checks.base] Run check for multiple_data_disks/system
2025-05-05 15:12:16.675 INFO (MainThread) [supervisor.resolution.checks.base] Run check for security/core
2025-05-05 15:12:16.676 INFO (MainThread) [supervisor.resolution.checks.base] Run check for dns_server_failed/dns_server
2025-05-05 15:12:16.677 INFO (MainThread) [supervisor.resolution.check] System checks complete
2025-05-05 15:12:16.677 INFO (MainThread) [supervisor.resolution.evaluate] Starting system evaluation with state running
2025-05-05 15:12:16.881 INFO (MainThread) [supervisor.resolution.evaluate] System evaluation complete
2025-05-05 15:12:16.882 INFO (MainThread) [supervisor.resolution.fixup] Starting system autofix at state running
2025-05-05 15:12:16.882 INFO (MainThread) [supervisor.resolution.fixup] System autofix complete
2025-05-05 15:14:11.211 INFO (MainThread) [supervisor.homeassistant.api] Updated Home Assistant API token

Je suis bien évidemment dispo si vous désirez m’aider et avez besoin de log en +

Merci à tous de votre aide,

Ma configuration


[center]## System Information

version core-2025.4.4
installation_type Home Assistant OS
dev false
hassio true
docker true
user root
virtualenv false
python_version 3.13.2
os_name Linux
os_version 6.6.74-haos-raspi
arch aarch64
timezone Europe/Paris
config_dir /config
Home Assistant Community Store
GitHub API ok
GitHub Content ok
GitHub Web ok
HACS Data ok
GitHub API Calls Remaining 5000
Installed Version 2.0.5
Stage running
Available Repositories 1697
Downloaded Repositories 5
Home Assistant Cloud
logged_in false
can_reach_cert_server ok
can_reach_cloud_auth ok
can_reach_cloud ok
Home Assistant Supervisor
host_os Home Assistant OS 15.2
update_channel stable
supervisor_version supervisor-2025.04.1
agent_version 1.7.2
docker_version 28.0.4
disk_total 56.4 GB
disk_used 9.1 GB
healthy true
supported true
host_connectivity true
supervisor_connectivity true
ntp_synchronized true
virtualization
board rpi4-64
supervisor_api ok
version_api ok
installed_addons Node-RED (19.0.2), Mosquitto broker (6.5.0), Zigbee2MQTT (2.2.1-1), File editor (5.8.0), Terminal & SSH (9.16.0), Log Viewer (0.17.1)
Dashboards
dashboards 3
resources 4
views 6
mode storage
Network Configuration
adapters lo (disabled), end0 (enabled, default, auto), docker0 (disabled), hassio (disabled), veth59ad838 (disabled), veth04e1fdf (disabled), vethdc8804d (disabled), vethde9c3cc (disabled), vethd0046f6 (disabled), vethf3a6b4d (disabled), veth54f4432 (disabled), veth8a20bb6 (disabled)
ipv4_addresses lo (127.0.0.1/8), end0 (192.168.1.80/24), docker0 (172.30.232.1/23), hassio (172.30.32.1/23), veth59ad838 (), veth04e1fdf (), vethdc8804d (), vethde9c3cc (), vethd0046f6 (), vethf3a6b4d (), veth54f4432 (), veth8a20bb6 ()
ipv6_addresses lo (::1/128), end0 (fe80::94f3:7dab:bcb8:8053/64), docker0 (fe80::841c:b1ff:fef3:4263/64), hassio (fe80::7c65:f5ff:fe24:b37a/64), veth59ad838 (fe80::64e3:d8ff:fe80:f2fe/64), veth04e1fdf (fe80::87e:34ff:fe5e:efab/64), vethdc8804d (fe80::30ed:86ff:fee8:ed4a/64), vethde9c3cc (fe80::41:45ff:fe8d:ba11/64), vethd0046f6 (fe80::c27:39ff:fe94:4835/64), vethf3a6b4d (fe80::c60:a5ff:fe6b:d378/64), veth54f4432 (fe80::c8d7:3bff:feed:1e88/64), veth8a20bb6 (fe80::f07b:a9ff:fe8a:b503/64)
announce_addresses 192.168.1.80, fe80::94f3:7dab:bcb8:8053
Recorder
oldest_recorder_run April 23, 2025 at 21:34
current_recorder_run May 4, 2025 at 23:12
estimated_db_size 493.26 MiB
database_engine sqlite
database_version 3.48.0
[/center]

DHCP, IP fixe ?
Renouvellement de bail (à cette fréquence je serai étonné)
Réveil de connexion ?

DHCP avec adresse réservée coté serveur DHCP, et bail à 24h
Tu entends quoi par réveil de connexion ?
Si c’est un « Wake Up Lan », non il n’y a pas ce type d’action sur mon réseau (à priori …)

Tu peux installer wireshark, et sniffer les trames sur ce créneau horaire, pour voir ce qui se passe ?

Ça fait effectivement parti de mes tests à suivre, mais je suis assez mauvais en analyse détaillé !

Je vais essayer cette semaine

Les logs du Supervisor toute les 60 minutes ne sont pas parlant ?
Est-ce que j’ai moyen de désactiver provisoirement ces processus ?

Et le rôle du supervisor de surveiller alors non pas étonnant

Précisément, c’est quoi « crash » ?
Et pour être 100% sur, que le PI est le coupable, l’arrêter (off électrique) pendant X heures et voir à ce moment là si ça se maintient…

1 « J'aime »

J’ai édité le post original pour préciser « crash »
=> Tout mes accès réseaux se fige pendant 30 seconde environs, si je suis en réunion Teams, je perd la réunion, si je regarde Netflix, ça fige pendant 30 secondes, puis ça repart,

Et oui, j’ai débranché l’Ethernet pendant 1 journée, plus de problèmes

Je soupçonne un problème de résolution DNS
J’ai désactivé IPV6, sans succès [ce qui n’a pas grand chose à voir …]
J’ai ces logs qui remontent au moment du freeze

Vous sauriez me dire comment je vérifie la config DNS ?
C’est quoi 172.30.32.3 ?
Merci

[core-ssh ~]$ cat /etc/resolv.conf 
# Generated by Docker Engine.
# This file can be edited; Docker Engine will not make further changes once it
# has been modified.

nameserver 127.0.0.11
search local.hass.io
options timeout:10 ndots:0

# Based on host file: '/etc/resolv.conf' (internal resolver)
# ExtServers: [172.30.32.3]
# Overrides: [nameservers search options]
# Option ndots from: internal
[INFO] 127.0.0.1:42800 - 34456 "NS IN . udp 17 false 512" REFUSED qr,aa,rd 17 0.000405715s
[INFO] 127.0.0.1:39253 - 9428 "NS IN . udp 17 false 512" REFUSED qr,aa,rd 17 0.000293181s
[INFO] 127.0.0.1:35763 - 7150 "NS IN . udp 17 false 512" REFUSED qr,aa,rd 17 0.000605509s
[INFO] 127.0.0.1:60172 - 39198 "NS IN . udp 17 false 512" REFUSED qr,aa,rd 17 0.000386031s
[INFO] 127.0.0.1:45109 - 4513 "NS IN . udp 17 false 512" REFUSED qr,aa,rd 17 0.00028581s
[INFO] 127.0.0.1:54365 - 22224 "NS IN . udp 17 false 512" REFUSED qr,aa,rd 17 0.000276403s
[INFO] 127.0.0.1:54432 - 56533 "NS IN . udp 17 false 512" REFUSED qr,aa,rd 17 0.002303998s
[INFO] 127.0.0.1:58736 - 48981 "NS IN . udp 17 false 512" REFUSED qr,aa,rd 17 0.000570954s
[INFO] 127.0.0.1:42958 - 54419 "NS IN . udp 17 false 512" REFUSED qr,aa,rd 17 0.000240699s
[INFO] 127.0.0.1:36107 - 29427 "NS IN . udp 17 false 512" REFUSED qr,aa,rd 17 0.000361013s
[INFO] 127.0.0.1:56767 - 52324 "NS IN . udp 17 false 512" REFUSED qr,aa,rd 17 0.000405197s
[INFO] 127.0.0.1:35024 - 42185 "NS IN . udp 17 false 512" REFUSED qr,aa,rd 17 0.000345975s
[INFO] 127.0.0.1:34603 - 26432 "NS IN . udp 17 false 512" REFUSED qr,aa,rd 17 0.000444974s
[INFO] 127.0.0.1:41458 - 33616 "NS IN . udp 17 false 512" REFUSED qr,aa,rd 17 0.000307643s
[INFO] 127.0.0.1:44639 - 43817 "NS IN . udp 17 false 512" REFUSED qr,aa,rd 17 0.000488177s
[INFO] 127.0.0.1:33594 - 58509 "NS IN . udp 17 false 512" REFUSED qr,aa,rd 17 0.000330421s
[INFO] 127.0.0.1:55240 - 33745 "NS IN . udp 17 false 512" REFUSED qr,aa,rd 17 0.000273884s
[INFO] 127.0.0.1:35778 - 63949 "NS IN . udp 17 false 512" REFUSED qr,aa,rd 17 0.002881877s
[INFO] 127.0.0.1:32992 - 31730 "NS IN . udp 17 false 512" REFUSED qr,aa,rd 17 0.000204237s
[INFO] 127.0.0.1:56396 - 9315 "NS IN . udp 17 false 512" REFUSED qr,aa,rd 17 0.000318772s
[INFO] 127.0.0.1:59598 - 50025 "NS IN . udp 17 false 512" REFUSED qr,aa,rd 17 0.000237071s
[INFO] 127.0.0.1:39019 - 47531 "NS IN . udp 17 false 512" REFUSED qr,aa,rd 17 0.000269292s
[INFO] 172.30.32.1:47393 - 33847 "PTR IN 15.1.168.192.in-addr.arpa. udp 43 false 512" - - 0 6.484886304s
[ERROR] plugin/errors: 2 15.1.168.192.in-addr.arpa. PTR: read udp 127.0.0.1:40963->127.0.0.1:5553: i/o timeout
[INFO] 172.30.32.1:47393 - 8645 "PTR IN 5.1.168.192.in-addr.arpa. udp 42 false 512" - - 0 6.486707477s
[ERROR] plugin/errors: 2 5.1.168.192.in-addr.arpa. PTR: read udp 127.0.0.1:50546->127.0.0.1:5553: i/o timeout
[INFO] 172.30.32.1:47393 - 10625 "PTR IN 6.1.168.192.in-addr.arpa. udp 42 false 512" - - 0 6.486092988s
[ERROR] plugin/errors: 2 6.1.168.192.in-addr.arpa. PTR: read udp 127.0.0.1:52663->127.0.0.1:5553: i/o timeout
[INFO] 172.30.32.1:47393 - 49768 "PTR IN 1.1.168.192.in-addr.arpa. udp 42 false 512" - - 0 6.487542426s
[ERROR] plugin/errors: 2 1.1.168.192.in-addr.arpa. PTR: read udp 127.0.0.1:44603->127.0.0.1:5553: i/o timeout
[INFO] 172.30.32.1:47393 - 60067 "PTR IN 2.1.168.192.in-addr.arpa. udp 42 false 512" - - 0 6.48789279s
[INFO] 127.0.0.1:54694 - 9363 "NS IN . udp 17 false 512" REFUSED qr,aa,rd 17 0.000278329s
[ERROR] plugin/errors: 2 2.1.168.192.in-addr.arpa. PTR: read udp 127.0.0.1:52258->127.0.0.1:5553: i/o timeout
[INFO] 172.30.32.1:47393 - 60362 "PTR IN 4.1.168.192.in-addr.arpa. udp 42 false 512" - - 0 6.487527038s

Salut,

Alors comment dire …
Je comprends bien que quand ça ne fonctionne pas bien, c’est chiant mais commencer à bidouiller dans la config de HAOS c’est surement pas un moyen d’améliorer les choses, bien au contraire.
Le premier commentaire de ton fichier est clair : ton système est géré par HA, si tu remplaces ce qui est fait, tu as toutes les chances de casser autre chose.

Quant à 172.30.32.1 c’est une ip docker, donc HA ou un des addons

2 « J'aime »

Pour bloquer comme ça le flux des autres PC / équipements de ton réeau, je vois deux hypothèses :

  • duplication d’adresse IP / routage. Typiquement HAOS qui devient la gateway de ton réseau
  • flux « extrême » qui sature ton lien Internet

Le premier semble le plus probable…

Quelle est la config de ton LAN ? Plan d’adressage IP ? du classique en 192.168.x.y ?

Pas de truc « spéciaux » genre adguard, serveur DHCP ailleurs que sur la box ?

Et je suis d’accord avec @Pulpy-Luke , ne pas jouer avec les fichiers de config de HAOS. Toujours une mauvaise idée.