DNS Server Ausfall

crmspezi

Well-Known Member
Sep 5, 2019
384
28
48
44
Germany/Thueringen
Hallo,
ich habe folgendes Problem mit PVE 6.2 - kleines Cluster
Wenn der Master DNS (VM auf einem PVE) abgeschalten wird oder ausfällt, steht bei allen PVE im Cluster ein Fragenzeichen bei den Storages. Trotzdem kann ich von jedem PVE jede Internetadresse anpingen (eben über den Fall Back auf den 2. und 3. DNS Server - auch VM's aber auf jeweils anderen PVE's). Boote ich dann den 1. DNS ist kurze Zeit später wieder alles OK. Scheinbar findet proxmox hier die Storages nicht mehr obwohl die Namensauflösung über den Fall Back funktioniert.

Wie kann ich das ändern?
VG crmspezi


Umgebung:

1. DNS Ubuntu mit Bind9 als DHCPDNS (1. DNS Server)
2. DNS Ubuntu mit Bind9 als DHCPDNSBCK (2. DNS Server)
3. DNS Windows Server (3. DNS Server)

in /etc/resolv.conf

search crm.intern
nameserver 192.168.190.9
nameserver 192.168.190.7
nameserver 192.168.190.10
 
hmm - ein nicht erreichbarer erster DNS-server in der resolv.conf führt im Allgemeinen zu einigen Problemen (Namensauflösung dauert recht lange und manche Programme laufen damit in einen timeout)

3 Vorschläge:
* mal im journal nachsehen, was pve (speziell der pvestatd) zum Zeitpunkt wo der primäre DNS-server nicht erreichbar ist so mitteilt
* falls leicht möglich für die Storages einfach Einträge in /etc/hosts anlegen, damit diese unabhängig von DNS gehen (wenn die IPs sich nicht ständig ändern ist das einfach robuster).
* falls das alles nicht hilft/möglich ist - versuchen mit den options in der resolv.conf (man resolv.conf ) - speziell timeout und rotate den server dazuzubringen schneller einen anderen DNS zu fragen

Ich hoffe das hilft!
 
Hallo Stoiko,
ich habe /etc/resolv.conf ergänzt mit einer weiteren Zeile

options timeout:1 attempts:1

Das Problem tritt nun scheinbar nicht mehr auf. Ich habe den prim. DNS 2h offline geschaltet. Ohne die Parameter wurde laut Standardeinstellungen 2x a 5s versucht den Namen der Storages aufzulösen, was dann mit "service pvestad status" zu OFFLINE Meldungen führte. Dadurch konnten wiederum neue VM's nicht gestartet werden, auch wenn deren HDDs nichts mit dem Storage zu tun hatte.

Liebes Proxmox Team:
Ergänzt doch den Hinweis mit der resolv.conf auf den pve's oder noch viel besser, setzt das Timeout beim pvestatd hoch, vor allem bei CIFSs Storages (ISO/RAW/COW2 Speicher). Hier hatte ich schon manuell in /usr/share/perl5/PVE/Storage/CIFSPlugin.pm rumgebastelt.

Danke für die Hilfe!

VG
 
Ergänzt doch den Hinweis mit der resolv.conf auf den pve's oder noch viel besser, setzt das Timeout beim pvestatd hoch, vor allem bei CIFSs Storages (ISO/RAW/COW2 Speicher). Hier hatte ich schon manuell in /usr/share/perl5/PVE/Storage/CIFSPlugin.pm rumgebastelt.
Das mit dem timeout beim pvestatd ist uns durchaus bewusst - allerdings ist es leider nicht mit einem einfachen raufsetzen des timeouts erledigt - pvestatd macht sehr viele Sachen, und ist derzeit eine single-threaded Anwendung, sprich wenn eine der Abfragen länger dauert laufen andere Sachen dahinter in ihre timeouts (was u.A. dazu führt, dass z.b. andere Clusternodes und storages als offline angezeigt werden)

Allerdings steht ein rework von pvestatd schon auf unserer internen Roadmap (wie üblich - keine Prognose wann es soweit ist :))

Freut mich dass das mit der resolv.conf funktioniert hat!
 
  • Like
Reactions: crmspezi
Das mit dem timeout beim pvestatd ist uns durchaus bewusst - allerdings ist es leider nicht mit einem einfachen raufsetzen des timeouts erledigt - pvestatd macht sehr viele Sachen, und ist derzeit eine single-threaded Anwendung, sprich wenn eine der Abfragen länger dauert laufen andere Sachen dahinter in ihre timeouts (was u.A. dazu führt, dass z.b. andere Clusternodes und storages als offline angezeigt werden)

Allerdings steht ein rework von pvestatd schon auf unserer internen Roadmap (wie üblich - keine Prognose wann es soweit ist :))

Freut mich dass das mit der resolv.conf funktioniert hat!
Ok, verstehe ich. Danke für die kompetente Hilfe! VG
 
Cluster und externe DNS ist aber auch Schwachsinn das macht VMware Netapp und andere auch nicht anderst einfach in die resolv Config und fertig da nutzt man auch keinen DNS.
 
Wer redet denn von externen DNS?
Die DNS Server sind verteilt über 3 VM's und 3 PVE's. Ist eben über Jahre gewachsen. Erst nativ, dann Hyper-V, dann Proxmox. Klar, feste IP geht immer, ist aber viel zu statisch bei Netzwerkänderungen.
 
Ne extern war falsch ausgedrückt, DNS nutzt man trotzdem für so einen scheiss nicht !
 
Da bin ich anderer Meinungen. Ich rede nicht von dynamischen IPs, feste zugewiesene IPs und Nutzung der FQDN. Das ist sehr wohl professionell. Oder benutzt Du 8.8.8.8 zur Google Suche? Ich glaube nicht!
 
Last edited:
Ich rede vom reinen Cluster Netz. Aber mach deine Erfahrung die Erkenntnis das DNS in manchen Sachen nicht sinnvoll ist machst du ja gerade hier.
 
Das artet jetzt fast persönlich aus. Deine ziemlich freche Antwort verdient eine Gegenreaktion.

Du gehst den einfachen Weg und versuchst Deine Meinung auf die billige Art zu etablieren. Hier abwertend auf Standards zu reagieren zeugt nicht von Deiner hoher Kompetenz. Ich glaube, da bin ich mit über 40 Jahren Berufserfahrung im IT-Segment sicher nicht ganz unwissend.

Für Deine Meinung danke ich Dir wirklich, für Deine arrogante Art schäme ich mich.

Das Thema werde ich hier mit Dir nicht weiterverfolgen wollen.
VG crmspezi
 
Last edited:

About

The Proxmox community has been around for many years and offers help and support for Proxmox VE, Proxmox Backup Server, and Proxmox Mail Gateway.
We think our community is one of the best thanks to people like you!

Get your subscription!

The Proxmox team works very hard to make sure you are running the best software and getting stable updates and security enhancements, as well as quick enterprise support. Tens of thousands of happy customers have a Proxmox subscription. Get yours easily in our online shop.

Buy now!