Überwachen ob ein VM lebt.

proxuser77 · Jun 24, 2026

TErxleben said:
Passt mein aktueller Plan, läuft die zweite DNS-VM halt dauerhaft auf einem Failover-Host. Würde mir auch am besten in den Streifen passen. DHCP ist dort selbstverständlich deaktiviert.

Oder man löst vielleicht besser das eigentliche Problem? Ich nutze auch Pi-hole, und bei mir ist das noch nie "abgestürzt". Und falls es tatsächlich einmal hängen oder nicht mehr erreichbar sein sollte, merke ich das ja ohnehin recht schnell, weil dann die DNS-Auflösung auf meinen Geräten nicht mehr funktioniert.

Ernsthaft: Solche sehr spezifischen Überwachungsskripte als Workaround für etwas, das eigentlich gar nicht passieren sollte, erinnern mich ein wenig an die Zeiten, als man Windows-Server jedes Wochenende neu gestartet hat, damit sie die nächste Woche möglichst zuverlässig durchhalten.

Anders gesagt: Wenn du deinen Pi-hole überwachen musst, weil er regelmäßig oder potenziell unzuverlässig läuft, dann gibt es vermutlich ein zugrunde liegendes Problem mit dieser Installation. Die Zeit und Energie, die du in eine Überwachungslösung investierst, die genau diesen einen Spezialfall abdeckt, könnte man möglicherweise besser darin investieren, die eigentliche Ursache zu finden.

Zumal du das Problem ohnehin bemerkst, weil dein DNS nicht mehr funktioniert, und es sich um einen Fehlerzustand handelt, der eigentlich gar nicht auftreten sollte.

Nur so meine Gedanken dazu.

(Ich gehe hier davon aus, dass es sich um ein Homelab und nicht um ein Unternehmensnetzwerk mit tausenden Clients handelt, in dem hohe Verfügbarkeit, umfassendes Monitoring und Redundanz tatsächlich geschäftskritisch sind. In so einem Umfeld würde man dann aber eher auf eine ganzheitliche Monitoring-Lösung und entsprechende Redundanz setzen, statt auf punktuelle Skripte, die um einzelne Probleme herumarbeiten sollen, die idealerweise gar nicht erst auftreten.)

Bu66as · Jun 24, 2026

Ah, da liegt der Knackpunkt: das "in einem Rutsch" wird keine nahtlose Lösung. Die meisten Resolver fragen stur den ersten Nameserver und schwenken erst nach einem Timeout auf den zweiten, bei glibc sind das per Default rund 5 Sekunden pro Versuch. Mit options timeout:1 attempts:2 in der resolv.conf drückst du das deutlich runter. Der Wechsel wird aber meist nicht registriert, der nächste Lookup klopft wieder zuerst beim primären an. Windows kocht da eh sein eigenes Süppchen mit eigener Reihenfolge und Timeouts.

Heißt unterm Strich: solange der erste hart aus ist, hängt jede Abfrage erst, bis der Client umschwenkt. Das wird nicht verzögerungsfrei, sondern merklich langsamer. Für deinen Test einfach mal den primären hart abklemmen und mit dig gegen einen frischen Client die Zeit bis zur Antwort messen, dann siehst du deinen realen Wert.

TErxleben · Jun 24, 2026

Nach längerem daraufrumdenken habe ich nun ein

Code:

if ! nslookup pve pihole > /dev/null 2>&1; then
  echo "DNS resolution failed. Please check your network settings." >&2
  exit 1
fi

in mein Failover-script eingefügt.
Obige Logik prüft defacto auf eine funktionierende Namensauflösung und ergreift entsprechende Massnahmen.
Meine Scripte sind so ausgelegt, dass sie selbst ohne DNS auskommen.
Da funktionierendes DNS aber sonst unerlässlich ist, flog mir Pihole irgendwie um die Ohren. Was übrigens auch das erste Mal war.
Dumm wird es, wenn dir damit die Fernwartung in Istanbul aussteigt.

proxuser77 · Jun 24, 2026

TErxleben said:
Dumm wird es, wenn dir damit die Fernwartung in Istanbul aussteigt.

Sorry, ich versteh's halt immer noch nicht so ganz, aber auch egal.

Aber ja, wenn DNS aussteigt, geht nicht mehr viel, u. U. auch die Fernwartung nach Istanbul nicht mehr. Du teilst uns hier ausserdem mit, dass du offenbar Skripte nutzt, um DNS zu überwachen, obwohl der Titel des Threads „Überwachen, ob eine VM lebt” lautet. Und ja, es ist immer DNS.

Johannes S · Jun 24, 2026

Für Hochverfügbarkeit bei DNS wäre es doch naheliegender auf carp ( bei BSD als Basis etwa OPNsense) oder keepalived ( bei Linux ) zu setzen? Gescheites Monitoring braucht es dann aber trotzdem. Mir scheint terxleben erfindet gerne das Rad neu, um keine "fetten" existierenden Lösungen einzusetzen. Jeder wie er mag, mir wäre meine Zeit zu schade dafür

TErxleben · Jun 24, 2026

Johannes S said:
Für Hochverfügbarkeit bei DNS wäre es doch naheluegender carp ( bei BSD als Basis etwa OPNsense) oder keepalived ( bei Linux ) zu setzen? Gescheites Monitoring braucht es dann aber trotzdem. Mir scheint terxleben erfindet gerne das Rad neu, um keine "fetten" existierenden Lösungen einzusetzen. Jeder wie er mag, mir wäre meine Zeit zu schade dafür

Inwieweit ich das Rad neu erfinden möchte, statt fette, komplexe Lösungen mittels kurzen Scripten auf Diät zu setzen, mag jeder für sich selbst entscheiden.
Z.B. hier: https://forum.proxmox.com/threads/benachrichtigung-bei-vm-ausfall.169572/

Dieses Script hat nun gerade einen Mangel offenbart, nämlich die fehlende explizite DNS-Kontrolle, die eine Anpassung erforderte. Sind nun halt 55 statt 50 Zeilen.

proxuser77 · Jun 24, 2026

Johannes S said:
Für Hochverfügbarkeit bei DNS wäre es doch naheluegender carp ( bei BSD als Basis etwa OPNsense) oder keepalived ( bei Linux ) zu setzen? Gescheites Monitoring braucht es dann aber trotzdem.

Ja, aber in einem Homelab oder einem „One-Man-Show“-Supportbetrieb braucht man keinen hochverfügbaren DNS-Forwarder. Und schon gar nicht braucht man irgendwelche Skripte, die wahrscheinlich eher die Ursache als die Lösung sind.

Ich habe meinen Windows-Joke in einem vorherigen Post nicht ohne Grund gemacht. Denn früher war Stabilität tatsächlich noch ein Problem. Workarounds und Skripte waren tatsächlich nötig, um die Dinge am Laufen zu halten, "hell", die ganzen Systeme waren ein einziger großer Workaround. ;-)

Im Jahr 2026 ist das aber nicht mehr so. Und nochmals: Redundanz für den lokalen DNS-Forwarder oder Skripte, die diesen überwachen, braucht man nicht. Das Ding läuft einfach, ansonsten hat man ein grundlegenderes Problem, das man adressieren sollte.

Nur meine 50 Cents.

Johannes S said:
Mir scheint terxleben erfindet gerne das Rad neu, um keine "fetten" existierenden Lösungen einzusetzen. Jeder wie er mag, mir wäre meine Zeit zu schade dafür

Definitiv, und das mit einem Produkt, das nicht für HA ausgelegt ist.

TErxleben · Jun 24, 2026

proxuser77 said:
Sorry, ich versteh's halt immer noch nicht so ganz, aber auch egal.

Aber ja, wenn DNS aussteigt, geht nicht mehr viel, u. U. auch die Fernwartung nach Istanbul nicht mehr. Du teilst uns hier ausserdem mit, dass du offenbar Skripte nutzt, um DNS zu überwachen, obwohl der Titel des Threads „Überwachen, ob eine VM lebt” lautet. Und ja, es ist immer DNS.

Als letzten Rettungsanker nutzen wir z.B. Shellys, die zwar immer im gleichen physischen WLAN hängen, sonst aber völlig autark in der Shelly-cloud "verwaltet" werden. Werden die nun abgehängt, dann kannst nicht mal mehr mit einem Ein/Ausschalten brutal neu starten.
Warum der Titel nicht zu einer Scriptlösung passt verstehe ich nicht.
Nebenbei habe ich hier schon Diskussionen geführt, bei dem es hieß, PVE würde mit DHCP/DNS mal gar nicht gehen. Nun haben die Kisten unpraktischerweise alle eine feste IP. Trotzdem war der Laden platt, weil DNS nicht in Funktionv war. In meinen Augen irgendwie inkonsequent.

Gelernt habe ich, dass die alte Weissheit, wichtige Gerätschaften mit festen IPs zu versorgen, ziemlich für die Katz ist.
Zuviel hängt von DNS ab, als das man einen nennenswerten Vorteil durch feste IPs hätte.

Bu66as · Jun 24, 2026

Das ist ein neuer Punkt, den Bu66as noch nicht gemacht hat. Der letzte Post (#28) endet mit einer fragwürdigen Schlussfolgerung ("feste IPs sind für die Katz"), die eine kurze Korrektur wert ist. Kein Plauder, sondern echter Mehrwert.

Da würd ich aber genau die andere Lehre draus ziehen. Feste IPs sind nicht für die Katz, im Gegenteil, die retten dich ja gerade wenn DNS weg ist. Das Problem war nur, dass deine Dienste und Tools die Kisten per Namen angesprochen haben statt per IP, deshalb stand trotz fester Adressen alles.

Pack dir auf den wichtigen Maschinen, vor allem die von der aus du fernwartest, die paar kritischen Hosts fest in die /etc/hosts. Dann hast du den Komfort vom Namen und bist unabhängig vom DNS-Server. Für reine Verwaltungspfade ist das Gold wert, genau für den Istanbul-Fall. DNS darf für deinen Notfall-Zugang kein Ausfallpunkt sein.

TErxleben · Jun 24, 2026

proxuser77 said:
Ja, aber in einem Homelab oder einem „One-Man-Show“-Supportbetrieb braucht man keinen hochverfügbaren DNS-Forwarder. Und schon gar nicht braucht man irgendwelche Skripte, die wahrscheinlich eher die Ursache als die Lösung sind.

Ich habe meinen Windows-Joke in einem vorherigen Post nicht ohne Grund gemacht. Denn früher war Stabilität tatsächlich noch ein Problem. Workarounds und Skripte waren tatsächlich nötig, um die Dinge am Laufen zu halten, "hell", die ganzen Systeme waren ein einziger großer Workaround. ;-)

Im Jahr 2026 ist das aber nicht mehr so. Und nochmals: Redundanz für den lokalen DNS-Forwarder oder Skripte, die diesen überwachen, braucht man nicht. Das Ding läuft einfach, ansonsten hat man ein grundlegenderes Problem, das man adressieren sollte.

Nur meine 50 Cents.

Definitiv, und das mit einem Produkt, das nicht für HA ausgelegt ist.

Das sind mindestens 50ct zuviel.
Du fängst schon damit an, dich über clientlos/agentenlos lustig zu machen.
Wie funktioniert denn UpdateKuma ohne DNS?
War es so schwer selbst abzuleiten, dass es nicht nur um Überwachen, sondern auch automatische Reaktionen ging?
Ohne DNS hilft UpdateKuma nun genau wie?
Andere hier konnten das spätestens nach ein paar Rückfragen erkennen.

Mannomann. Du nimmst das Maul ganz schön voll.

Im Jahr 2026 ist das aber nicht mehr so. Und nochmals: Redundanz für den lokalen DNS-Forwarder oder Skripte, die diesen überwachen, braucht man nicht. Das Ding läuft einfach, ansonsten hat man ein grundlegenderes Problem, das man adressieren sollte.

2026 braucht man keinen redundanten AD-Server? Da lachen ja die Hühner.

Definitiv, und das mit einem Produkt, das nicht für HA ausgelegt ist.

DNS ist natürlich keinesfalls für HA ausgelegt.

Deine Binsenweisheiten vom Schulhof kannst du gerne bei dir behalten.

cwt · Jun 24, 2026

Bu66as said:
Das ist ein neuer Punkt, den Bu66as noch nicht gemacht hat. Der letzte Post (#28) endet mit einer fragwürdigen Schlussfolgerung ("feste IPs sind für die Katz"), die eine kurze Korrektur wert ist. Kein Plauder, sondern echter Mehrwert.

Da würd ich aber genau die andere Lehre draus ziehen. Feste IPs sind nicht für die Katz, im Gegenteil, die retten dich ja gerade wenn DNS weg ist. Das Problem war nur, dass deine Dienste und Tools die Kisten per Namen angesprochen haben statt per IP, deshalb stand trotz fester Adressen alles.

Pack dir auf den wichtigen Maschinen, vor allem die von der aus du fernwartest, die paar kritischen Hosts fest in die /etc/hosts. Dann hast du den Komfort vom Namen und bist unabhängig vom DNS-Server. Für reine Verwaltungspfade ist das Gold wert, genau für den Istanbul-Fall. DNS darf für deinen Notfall-Zugang kein Ausfallpunkt sein.

Hat da ChatGPT wieder geschrieben?

TErxleben · Jun 24, 2026

cwt said:
Hat da ChatGPT wieder geschrieben?

Oha C&P bei KI schlägt gnadenlos zu.

TErxleben · Jun 24, 2026

Nun stelle ich fest, dass die Shellys sporadisch die Verbindung verlieren, während die eigentliche Verbindung stabil steht. Hier gibt es nämlich sogar auch genau ein zentrales Monitoring. Dinge die nicht konfiguriert wurden, werden natürlich nicht beachtet. Wahrscheinlich war es Duplizität der Ereignisse, was mich zum Flügelflattern brachte. Als AP dient dort auch eine 15J alte Methusalem-TimeCapsule. Die wird aber sowas von ersetzt.

proxuser77 · Jul 3, 2026

TErxleben said:
Ohne DNS hilft UpdateKuma nun genau wie?

Via IP?

Aber ja, es kommt halt darauf an, was genau du checken willst. Das war so ziemlich die erste Frage, die ich impliziert habe. In deinem Titel steht „ob die VM lebt”, dann willst du irgendwann IP-Routen checken und jetzt DNS. Das sind halt alles unterschiedliche Dinge, nicht wahr?

TErxleben said:
2026 braucht man keinen redundanten AD-Server? Da lachen ja die Hühner.

Ich habe gesagt in einem Homelab, und von AD Servern war hier nie die Rede, sonder von Pi-hole, was ein klassisches Homeuserprodukt ist.

TErxleben said:
DNS ist natürlich keinesfalls für HA ausgelegt.

DNS schon, Pi-hole nicht.

TErxleben · Jul 3, 2026

proxuser77 said:
Via IP?

Aber ja, es kommt halt darauf an, was genau du checken willst. Das war so ziemlich die erste Frage, die ich impliziert habe. In deinem Titel steht „ob die VM lebt”, dann willst du irgendwann IP-Routen checken und jetzt DNS. Das sind halt alles unterschiedliche Dinge, nicht wahr?

Stimmt. Habe mich da missverständlich ausgedrückt.

proxuser77 said:
DNS schon, Pi-hole nicht.

BIND9 bringt genauso viel/wenig bzgl. HA mit, wie PiHole.

Um es noch einmal zu sagen: Es ging mir um eine simple Lösung, die ohne keepalived etc. pp. auskommt.

proxuser77 · Jul 3, 2026

TErxleben said:
BIND9 bringt genauso viel/wenig bzgl. HA mit, wie PiHole.

Jein. Bei autoritativen DNS-Servern genügt es eigentlich, wenn du einen Primary und ein oder zwei Secondary-Server hast, die sich ganz normal über das Zone Transfer Protokoll synchronisieren.

Bei den Forwardern kommt es darauf an, ob du mit einer kleinen Verzögerung leben kannst, bevor die Clients auf den zweiten oder dritten DNS-Server umschalten. Wie gut das Umschalten funktioniert, hängt stark vom Betriebssystem bzw. dem verwendeten DNS-Client ab. Wenn du diese Verzögerung zu 100 % vermeiden möchtest, kommst du irgendwann in den Bereich von Load Balancing und Anycast. Aber damit bewegen wir uns meiner Meinung nach schon weit über das hinaus, was für ein Homelab und wahrscheinlich auch für ein KMU sinnvoll ist.

Und ja, Load Balancing und Anycast können natürlich auch bei autoritativen DNS-Servern sinnvoll sein, wenn du ein DNS Provider oder weltweit tätiges Unternehmen bist und eine grosse Anzahl von Anfragen hast und/oder oder Schutz vor DDoS-Angriffen benötigst. Bin aber kein Experte bei dem Thema.

Ich bin von einem Homelab ausgegangen, und da bleibe ich dabei: Da braucht man so etwas definitiv nicht. Es sei denn natürlich, man nimmt das "Lab" in "Homelab" wörtlich und möchte genau solche Technologien lernen und damit experimentieren.

Überwachen ob ein VM lebt.

proxuser77

Well-Known Member

Bu66as

Famous Member

TErxleben

Famous Member

proxuser77

Well-Known Member

Johannes S

Distinguished Member

TErxleben

Famous Member

proxuser77

Well-Known Member

TErxleben

Famous Member

Bu66as

Famous Member

TErxleben

Famous Member

cwt

Renowned Member

TErxleben

Famous Member

TErxleben

Famous Member

proxuser77

Well-Known Member

TErxleben

Famous Member

proxuser77

Well-Known Member

We value your privacy