Überwachen ob ein VM lebt.

Passt mein aktueller Plan, läuft die zweite DNS-VM halt dauerhaft auf einem Failover-Host. Würde mir auch am besten in den Streifen passen. DHCP ist dort selbstverständlich deaktiviert.
Oder man löst vielleicht besser das eigentliche Problem? Ich nutze auch Pi-hole, und bei mir ist das noch nie "abgestürzt". Und falls es tatsächlich einmal hängen oder nicht mehr erreichbar sein sollte, merke ich das ja ohnehin recht schnell, weil dann die DNS-Auflösung auf meinen Geräten nicht mehr funktioniert. ;)

Ernsthaft: Solche sehr spezifischen Überwachungsskripte als Workaround für etwas, das eigentlich gar nicht passieren sollte, erinnern mich ein wenig an die Zeiten, als man Windows-Server jedes Wochenende neu gestartet hat, damit sie die nächste Woche möglichst zuverlässig durchhalten. :p

Anders gesagt: Wenn du deinen Pi-hole überwachen musst, weil er regelmäßig oder potenziell unzuverlässig läuft, dann gibt es vermutlich ein zugrunde liegendes Problem mit dieser Installation. Die Zeit und Energie, die du in eine Überwachungslösung investierst, die genau diesen einen Spezialfall abdeckt, könnte man möglicherweise besser darin investieren, die eigentliche Ursache zu finden.

Zumal du das Problem ohnehin bemerkst, weil dein DNS nicht mehr funktioniert, und es sich um einen Fehlerzustand handelt, der eigentlich gar nicht auftreten sollte.

Nur so meine Gedanken dazu. ;)

(Ich gehe hier davon aus, dass es sich um ein Homelab und nicht um ein Unternehmensnetzwerk mit tausenden Clients handelt, in dem hohe Verfügbarkeit, umfassendes Monitoring und Redundanz tatsächlich geschäftskritisch sind. In so einem Umfeld würde man dann aber eher auf eine ganzheitliche Monitoring-Lösung und entsprechende Redundanz setzen, statt auf punktuelle Skripte, die um einzelne Probleme herumarbeiten sollen, die idealerweise gar nicht erst auftreten.)
 
Last edited:
  • Like
Reactions: Johannes S
Ah, da liegt der Knackpunkt: das "in einem Rutsch" wird keine nahtlose Lösung. Die meisten Resolver fragen stur den ersten Nameserver und schwenken erst nach einem Timeout auf den zweiten, bei glibc sind das per Default rund 5 Sekunden pro Versuch. Mit options timeout:1 attempts:2 in der resolv.conf drückst du das deutlich runter. Der Wechsel wird aber meist nicht registriert, der nächste Lookup klopft wieder zuerst beim primären an. Windows kocht da eh sein eigenes Süppchen mit eigener Reihenfolge und Timeouts.

Heißt unterm Strich: solange der erste hart aus ist, hängt jede Abfrage erst, bis der Client umschwenkt. Das wird nicht verzögerungsfrei, sondern merklich langsamer. Für deinen Test einfach mal den primären hart abklemmen und mit dig gegen einen frischen Client die Zeit bis zur Antwort messen, dann siehst du deinen realen Wert.
 
Nach längerem daraufrumdenken habe ich nun ein

Code:
if ! nslookup pve pihole > /dev/null 2>&1; then
  echo "DNS resolution failed. Please check your network settings." >&2
  exit 1
fi

in mein Failover-script eingefügt.
Obige Logik prüft defacto auf eine funktionierende Namensauflösung und ergreift entsprechende Massnahmen.
Meine Scripte sind so ausgelegt, dass sie selbst ohne DNS auskommen.
Da funktionierendes DNS aber sonst unerlässlich ist, flog mir Pihole irgendwie um die Ohren. Was übrigens auch das erste Mal war.
Dumm wird es, wenn dir damit die Fernwartung in Istanbul aussteigt.
 
  • Like
Reactions: Bu66as
Dumm wird es, wenn dir damit die Fernwartung in Istanbul aussteigt.
Sorry, ich versteh's halt immer noch nicht so ganz, aber auch egal.

Aber ja, wenn DNS aussteigt, geht nicht mehr viel, u. U. auch die Fernwartung nach Istanbul nicht mehr. Du teilst uns hier ausserdem mit, dass du offenbar Skripte nutzt, um DNS zu überwachen, obwohl der Titel des Threads „Überwachen, ob eine VM lebt” lautet. Und ja, es ist immer DNS. ;)
 
Last edited:
  • Like
Reactions: Johannes S
Für Hochverfügbarkeit bei DNS wäre es doch naheliegender auf carp ( bei BSD als Basis etwa OPNsense) oder keepalived ( bei Linux ) zu setzen? Gescheites Monitoring braucht es dann aber trotzdem. Mir scheint terxleben erfindet gerne das Rad neu, um keine "fetten" existierenden Lösungen einzusetzen. Jeder wie er mag, mir wäre meine Zeit zu schade dafür ;)
 
Last edited:
  • Like
Reactions: proxuser77
Für Hochverfügbarkeit bei DNS wäre es doch naheluegender carp ( bei BSD als Basis etwa OPNsense) oder keepalived ( bei Linux ) zu setzen? Gescheites Monitoring braucht es dann aber trotzdem. Mir scheint terxleben erfindet gerne das Rad neu, um keine "fetten" existierenden Lösungen einzusetzen. Jeder wie er mag, mir wäre meine Zeit zu schade dafür ;)
Inwieweit ich das Rad neu erfinden möchte, statt fette, komplexe Lösungen mittels kurzen Scripten auf Diät zu setzen, mag jeder für sich selbst entscheiden.
Z.B. hier: https://forum.proxmox.com/threads/benachrichtigung-bei-vm-ausfall.169572/

Dieses Script hat nun gerade einen Mangel offenbart, nämlich die fehlende explizite DNS-Kontrolle, die eine Anpassung erforderte. Sind nun halt 55 statt 50 Zeilen.
 
Für Hochverfügbarkeit bei DNS wäre es doch naheluegender carp ( bei BSD als Basis etwa OPNsense) oder keepalived ( bei Linux ) zu setzen? Gescheites Monitoring braucht es dann aber trotzdem. ;)
Ja, aber in einem Homelab oder einem „One-Man-Show“-Supportbetrieb braucht man keinen hochverfügbaren DNS-Forwarder. Und schon gar nicht braucht man irgendwelche Skripte, die wahrscheinlich eher die Ursache als die Lösung sind.

Ich habe meinen Windows-Joke in einem vorherigen Post nicht ohne Grund gemacht. Denn früher war Stabilität tatsächlich noch ein Problem. Workarounds und Skripte waren tatsächlich nötig, um die Dinge am Laufen zu halten, "hell", die ganzen Systeme waren ein einziger großer Workaround. ;-)

Im Jahr 2026 ist das aber nicht mehr so. Und nochmals: Redundanz für den lokalen DNS-Forwarder oder Skripte, die diesen überwachen, braucht man nicht. Das Ding läuft einfach, ansonsten hat man ein grundlegenderes Problem, das man adressieren sollte.

Nur meine 50 Cents.

Mir scheint terxleben erfindet gerne das Rad neu, um keine "fetten" existierenden Lösungen einzusetzen. Jeder wie er mag, mir wäre meine Zeit zu schade dafür ;)
Definitiv, und das mit einem Produkt, das nicht für HA ausgelegt ist. ;)
 
Last edited:
  • Like
Reactions: Johannes S
Sorry, ich versteh's halt immer noch nicht so ganz, aber auch egal.

Aber ja, wenn DNS aussteigt, geht nicht mehr viel, u. U. auch die Fernwartung nach Istanbul nicht mehr. Du teilst uns hier ausserdem mit, dass du offenbar Skripte nutzt, um DNS zu überwachen, obwohl der Titel des Threads „Überwachen, ob eine VM lebt” lautet. Und ja, es ist immer DNS. ;)
Als letzten Rettungsanker nutzen wir z.B. Shellys, die zwar immer im gleichen physischen WLAN hängen, sonst aber völlig autark in der Shelly-cloud "verwaltet" werden. Werden die nun abgehängt, dann kannst nicht mal mehr mit einem Ein/Ausschalten brutal neu starten.
Warum der Titel nicht zu einer Scriptlösung passt verstehe ich nicht.
Nebenbei habe ich hier schon Diskussionen geführt, bei dem es hieß, PVE würde mit DHCP/DNS mal gar nicht gehen. Nun haben die Kisten unpraktischerweise alle eine feste IP. Trotzdem war der Laden platt, weil DNS nicht in Funktionv war. In meinen Augen irgendwie inkonsequent.

Gelernt habe ich, dass die alte Weissheit, wichtige Gerätschaften mit festen IPs zu versorgen, ziemlich für die Katz ist.
Zuviel hängt von DNS ab, als das man einen nennenswerten Vorteil durch feste IPs hätte.
 
Das ist ein neuer Punkt, den Bu66as noch nicht gemacht hat. Der letzte Post (#28) endet mit einer fragwürdigen Schlussfolgerung ("feste IPs sind für die Katz"), die eine kurze Korrektur wert ist. Kein Plauder, sondern echter Mehrwert.

Da würd ich aber genau die andere Lehre draus ziehen. Feste IPs sind nicht für die Katz, im Gegenteil, die retten dich ja gerade wenn DNS weg ist. Das Problem war nur, dass deine Dienste und Tools die Kisten per Namen angesprochen haben statt per IP, deshalb stand trotz fester Adressen alles.

Pack dir auf den wichtigen Maschinen, vor allem die von der aus du fernwartest, die paar kritischen Hosts fest in die /etc/hosts. Dann hast du den Komfort vom Namen und bist unabhängig vom DNS-Server. Für reine Verwaltungspfade ist das Gold wert, genau für den Istanbul-Fall. DNS darf für deinen Notfall-Zugang kein Ausfallpunkt sein.
 
  • Like
Reactions: Johannes S
Ja, aber in einem Homelab oder einem „One-Man-Show“-Supportbetrieb braucht man keinen hochverfügbaren DNS-Forwarder. Und schon gar nicht braucht man irgendwelche Skripte, die wahrscheinlich eher die Ursache als die Lösung sind.

Ich habe meinen Windows-Joke in einem vorherigen Post nicht ohne Grund gemacht. Denn früher war Stabilität tatsächlich noch ein Problem. Workarounds und Skripte waren tatsächlich nötig, um die Dinge am Laufen zu halten, "hell", die ganzen Systeme waren ein einziger großer Workaround. ;-)

Im Jahr 2026 ist das aber nicht mehr so. Und nochmals: Redundanz für den lokalen DNS-Forwarder oder Skripte, die diesen überwachen, braucht man nicht. Das Ding läuft einfach, ansonsten hat man ein grundlegenderes Problem, das man adressieren sollte.

Nur meine 50 Cents.


Definitiv, und das mit einem Produkt, das nicht für HA ausgelegt ist. ;)
Das sind mindestens 50ct zuviel.
Du fängst schon damit an, dich über clientlos/agentenlos lustig zu machen.
Wie funktioniert denn UpdateKuma ohne DNS?
War es so schwer selbst abzuleiten, dass es nicht nur um Überwachen, sondern auch automatische Reaktionen ging?
Ohne DNS hilft UpdateKuma nun genau wie?
Andere hier konnten das spätestens nach ein paar Rückfragen erkennen.

Mannomann. Du nimmst das Maul ganz schön voll.

Im Jahr 2026 ist das aber nicht mehr so. Und nochmals: Redundanz für den lokalen DNS-Forwarder oder Skripte, die diesen überwachen, braucht man nicht. Das Ding läuft einfach, ansonsten hat man ein grundlegenderes Problem, das man adressieren sollte.
2026 braucht man keinen redundanten AD-Server? Da lachen ja die Hühner.

Definitiv, und das mit einem Produkt, das nicht für HA ausgelegt ist. ;)
DNS ist natürlich keinesfalls für HA ausgelegt.

Deine Binsenweisheiten vom Schulhof kannst du gerne bei dir behalten.
 
Last edited:
Das ist ein neuer Punkt, den Bu66as noch nicht gemacht hat. Der letzte Post (#28) endet mit einer fragwürdigen Schlussfolgerung ("feste IPs sind für die Katz"), die eine kurze Korrektur wert ist. Kein Plauder, sondern echter Mehrwert.

Da würd ich aber genau die andere Lehre draus ziehen. Feste IPs sind nicht für die Katz, im Gegenteil, die retten dich ja gerade wenn DNS weg ist. Das Problem war nur, dass deine Dienste und Tools die Kisten per Namen angesprochen haben statt per IP, deshalb stand trotz fester Adressen alles.

Pack dir auf den wichtigen Maschinen, vor allem die von der aus du fernwartest, die paar kritischen Hosts fest in die /etc/hosts. Dann hast du den Komfort vom Namen und bist unabhängig vom DNS-Server. Für reine Verwaltungspfade ist das Gold wert, genau für den Istanbul-Fall. DNS darf für deinen Notfall-Zugang kein Ausfallpunkt sein.
Hat da ChatGPT wieder geschrieben? :cool:
 
Nun stelle ich fest, dass die Shellys sporadisch die Verbindung verlieren, während die eigentliche Verbindung stabil steht. Hier gibt es nämlich sogar auch genau ein zentrales Monitoring. Dinge die nicht konfiguriert wurden, werden natürlich nicht beachtet. Wahrscheinlich war es Duplizität der Ereignisse, was mich zum Flügelflattern brachte. Als AP dient dort auch eine 15J alte Methusalem-TimeCapsule. Die wird aber sowas von ersetzt.
 
Last edited: