Bezüglich Spam Learning, also das lässt sich in deutsch durchaus etwas besser ausdrücken, daher hier die Langfassung: Ich habe zunächst mal untroubled.org mir angeschaut, aber diese "Datenbank" ist wohl mehr im englischsprachigen Raum verdrahtet, so dass es für "deutschen Spam" wohl weniger passt, zudem wurde ja angekündigt, dass im April 2018 die primäre Spam Source abgeschaltet werden würde und die Archive wohl weniger zu gebrauchen seien. Daher habe ich mich auf artinvoice.hu gestürzt, mit dem Hintergedanken, europäisch und in Ungarn landen ggf. ja auch ein paar deutschsprachige Spams. Leider musste ich aber feststellen, das hatte ich zuvor auch schon woanders gelesen, aber erst mal fürs erste verworfen, dass damit die bayesschen Ergebnisse sehr schlecht waren. Warum, naja, weil "mein Spam" und "deren Spam" halt nun mal ein anderer ist und damit "mein Spam" teilweise mit BAYES_00 oder kaum härter klassifiziert wurde, weil "deren Spam" ja viel spammiger ist. Ja, ich habe mich schon erst mal gefreut, dass auch endlich BAYES_ im Tagging auftauchte, aber gebracht hat es mir nichts. Daher habe ich nach der Erkenntnis die Datenbank "gecleared" und das automatische Einlesen von Fremdspam rausgenommen. Damit wird es wohl leider bei meiner für privat gedachten Installation noch einige Zeit dauern, bis ich wirklich über die autolearns (ham schon öfter, aber quasi kaum spam) mal endlich bayessche Ergebnisse sehen werde, aber dann sind sie wenigstens brauchbar, im kommerziellen Test könnte es schon schneller passieren, ggf. kann man sogar die Datenbank "rüberkopieren", wobei mein Geschäftsspam und mein privater Spam eigentlich auch schon wieder ganz anders sind. Insoweit würde auch der Vorschlag vermutlich wenig bringen, wenn es für alle Proxmox-Subscriber eine zentrale Spamdatenbank gäbe, ja, ein wenig hilfreich vielleicht, aber eben trotzdem wieder "anderer Spam" als der "eigene Spam".
Insoweit würde ich einfach in einem produktiven Setup etwas Geduld beweisen und auf eigenes Tagging warten, ehe ich mir was fremdes einladen würde. Wenn die Quarantäne genutzt wird (ich bin da kein Fan von, ich tagge lieber) kann durch ein- und aussortieren von Spam sicherlich sogar die Qualität erhöht und die Erkennung beschleunigt werden, leider habe ich hier derzeit keine Integration zwischen dem Ziel bzw. den Zielsystemen und PMG, wäre aber eine Option, das später mal per API zu programmieren, dass man falscherkannte Mails selbst wieder "einkippen" und entsprechend anlernen kann.
Apropos kommerzielle Nutzung, bitte dran denken, dass ich in meinen Anleitungen davon ausgehe, dass ich den Gateway wohl auch ohne PMG-Subscription rein privat nutzen werde und mit PMG-Subscription kommerziell (wobei ich ihn dazu neu aufsetzen werde, da ich keine Downgrades der Pakete jetzt von den Tests ohne Subscription machen möchte), jedoch in beiden Fällen nur "für mich" bzw. für die Firma mit entsprechend niedrigen Quotas. Die diversen Blacklists (für Barracuda muss man sich ja eh registrieren), Signaturerweiterungen wie auch beispielsweise DCC erfordern bei kommerzieller Nutzung jenseits der üblichen Quotas (meist so um die 100.000 Mails pro Tag) oder im Rahmen eines (kommerziell) angebotenen Antispam-Dienstes eine Lizenz. Das kann recht schnell teuer werden, kann aber auch die Erkennungsquoten verbessern, ich hatte das mal angeboten, der Feed von Zen war da flotter, bei URIBL hatte man weitere Zones (die Gold Zone bspw.), durch eigene Datafeeds bzw. rsyncs der Datafeeds hatte man weniger Aussetzer, wenn mal die DNS-Auflösung muckt, man muss nur darauf achten, irgendwo sind da Open Source auch die Grenzen gesetzt.