Madagascar / projects / pve-net-hang-watchdog /
README

pve-net-hang-watchdog

pve-net-hang-watchdog este un serviciu simplu care urmareste jurnalul kernel pentru hang-uri de NIC si incearca recuperarea uplink-ului prin ifdown si ifup.

Rol

Util pentru noduri Proxmox unde interfata fizica din spatele unui bridge WAN poate intra in stare de hang hardware, iar recovery-ul cel mai pragmatic este ciclarea link-ului.

Componente

Locatii instalate pe host

  • comanda/daemon script: /usr/local/sbin/pve-net-hang-watchdog.sh
  • uninstall canonic: /usr/local/lib/xdev/pve-net-hang-watchdog/uninstall.sh
  • wrapper optional pentru uninstall: /usr/local/sbin/xdev-pve-net-hang-watchdog-uninstall
  • defaults: /etc/default/xdev-pve-net-hang-watchdog
  • unitate systemd: /etc/systemd/system/pve-net-hang-watchdog.service
  • documentatie instalata: /usr/local/share/doc/xdev/pve-net-hang-watchdog

Configurare

Parametri suportati prin defaults:

  • WATCH_BRIDGE
  • WATCH_IFACE
  • COOLDOWN_SECONDS
  • HANG_PATTERN

Daca WATCH_IFACE este gol, scriptul incearca sa descopere automat interfata fizica din bridge-ports.

Flux rapid

sudo ./setup.sh --local
sudo systemctl status pve-net-hang-watchdog.service

Operare

Loguri:

journalctl -u pve-net-hang-watchdog.service -f

Configurare:

sudo editor /etc/default/xdev-pve-net-hang-watchdog
sudo systemctl restart pve-net-hang-watchdog.service

Installerul face si enable --now, deci dupa instalare serviciul este deja pornit.

Uninstall

sudo ./setup.sh --local --uninstall

Sau direct:

sudo /usr/local/lib/xdev/pve-net-hang-watchdog/uninstall.sh