Solved

Veeam Windows Repo SSD Cache


Hallo, wir bauen gerade ein Windows Repo Server mit 40 HDD auf. Die Platten hängen über SAS an einem Expander. Leider ist der Speed beim schreiben über 2x10G Netzwerk nur bei 100MB's. Ist das normal oder kann ich über 2X SSD Platten einen Cache dafür bauen auf dem Server? 

icon

Best answer by David Bewernick 28 June 2022, 09:01

View original

16 comments

Userlevel 7
Badge +8

Hallo @mathschut.

Prinzipiell sollte SAS ja 6G oder 12G liefern. Also ~600MB/s oder ~1.200MB/s. Immer noch ein Bottleneck, bei 40 Spindeln, aber mehr als 100MB/s.

Einen SSD Cache für ein Repo kennt VBR selbst nicht. Manche RAID-Controller können das. Aus meiner Sicht aber der falsche Weg. Spätestens wenn beim Schreiben der Cache voll ist, ist wieder alles langsam.

Welchen RAID-Level verwendest Du? R6 hat ja durch doppelte Parity eine Schreibhemmung. Ich verwende daher für Repos eher mal auch ein R5 (natürlich dann nicht mit so vielen Disks auf einmal) mit Hot-Spare. Versuch doch mal die 40 Disks in ein paar R5 mit max. 6-7 Spindeln und eine gemeinsame Hot-Spare aufzuteilen. Das ganze in Veeam dann als ein großes SOBR sichtbar machen. Das sollte zumindest aus Sicht des RAID die Sache optimieren.

 

Userlevel 7
Badge +17

Hallo @mathschut ,
scheint für ein 10Gbit Netz recht wenig zu sein.

Hängt der Repo Server im gleichen IP Netz wie der VBR Server und die zu sichernden Systeme oder stehen da Router, Firewalls, etc. dazwischen?

Welche RAID Version hat dein Repo?

Welches Filesystem hat dein Repo?

 

 

Userlevel 7
Badge +13

Welche Server Hardware mit welchem Controller und welchen Festplatten setzt ihr ein?

Ist der Write Cache aktiv?

Und habt ihr auch die Performance lokal auf dem Server per DISKSPD oder ähnlichem getestet?

Badge +3

Ich empfehle zunächst mal 2 Tests zu machen:

  1. mit iperf zu testen was an Bandbreite vom Proxy/Agent zum Repository möglich ist. Hierbei auch mal mit unterschiedlicher Anzahl paralleler Threads testen.
  2. Mittels diskspd testen was auf das Storage geschrieben werden kann. Informationen über die unterschiedlichen Veeam-Prozesse und deren Parameter hierfür sind im Veeam KB2014 beschrieben.

Kann am Proxy liegen, der die Daten ranschaufelt oder am Repository. 

Ersterer kann in Sachen Task (je Task wird eine vDisk gleichzeitig abgearbeitet werden), zweiteres sowohl in Sachen Tasks als auch Datendurchsatz limitiert werden. 

Pruef mal, ob Du beim Repo die per-machine option aktiviert hast, denn wenn da nur ein einziger Write stream (falls per per job option beim Repo aktiv ist und Du nur einen einzigen Backup Job mit vlt. nur einem einzigen Proxy Task hast) reinkommt, dann sind 100MB/s fuer ein active full backup nicht ungewoehnlich. 

Sonst Raidcontroller pruefen, was Cache und write back betrifft (write through ist sehr langsam), statt Raid 6 ev 60 verwenden. 

Ev. KB1999 pruefen, dass da nicht irgendwelches Anti-X bremst. 

Bei Performanxe gibts leider a million ways to die

Hi, auf dem System selber schaffe ich auch nur 102MB`s . Das System hat keinen Raid Controller. Die Platten haben per SAS an einem Shelf, wo sich die Disk befinden. Deswegen ja die Frage, ob es was bringt, wenn ich einen SSD Cache an den Storage Pool hinzufüge?

Userlevel 7
Badge +17

Wie sind die Platten denn im Windows konfiguriert? Die 100MB/sec solltest du ja schon fast mit einer einzelnen Platte erreichen.

Hast du ein Stripeset über die Platten gelegt und die Platten als ein großes Volume im Windows bereit gestellt? Oder ein Software RAID?

Oder wie hast du das ohne RAID Controller gemacht?

Userlevel 2
Badge +2

Ich glaube nicht das es am Repo liegt.

Was für einen Proxy verwendet ihr? Benutzt ihr NBD? Evtl. liegt am ESX Interface nur 1Gbit an.

Badge

Hi, auf dem System selber schaffe ich auch nur 102MB`s . Das System hat keinen Raid Controller. Die Platten haben per SAS an einem Shelf, wo sich die Disk befinden. Deswegen ja die Frage, ob es was bringt, wenn ich einen SSD Cache an den Storage Pool hinzufüge?

Auf dem System selbst nur 100 MB/s unabhängig vom veeam? Da scheint aber grundlegend was schief zu laufen… wie oben bereits beschrieben: wie hast du denn dann die Platten und raid konfiguriert wenn kein Controller verbaut ist?

Gesichert wird über NFS direkt von einer Netapp. Über ein anderes Repo schaffe ich bis zu 4G. Die Platten laufen als Jbod und werden über Windows Storage Server zu einem Software RAID zusammen gefasst. 

Userlevel 2
Badge +2

Kannst du die Geschwindigkeit reproduzieren wenn du einfach mal ein File von irgendwoher dorthin kopierst übers Netz?

 

Userlevel 7
Badge +17

Und was für ein Filesystem mit welcher Blockgröße?

Was sagt denn die Prozessorauslastung bei einem Software RAID mit 40 Platten?

Die CPU langweilt sich. Wenn ich Daten von der lokalen Ssd auf das RAID kopiere, ist es leider auch nicht schneller. 

Userlevel 7
Badge +13

Gesichert wird über NFS direkt von einer Netapp. Über ein anderes Repo schaffe ich bis zu 4G. Die Platten laufen als Jbod und werden über Windows Storage Server zu einem Software RAID zusammen gefasst. 

Kann es sein, dass ihr Parity Spaces nutzt? Falls ja, dann ist die Performance zu erklären, da dieses enorm langsam sind. Eigentlich macht nur Mirror Sinn, ansonsten solltet ihr einen HW RAID Controller nutzen.

Badge +3

Software RAID in der Größe ist vielleicht nicht zum empfehlen. Ich gehe mal davon aus, dass es Storage Spaces sind?

Sollte ein Hardware RAID Controller inkl. Cache nicht möglich sein, dann ist beim Einsatz von Storage Spaces zu beachten, dass ein größerer SSD Cache (oder besser NVMe) durch mehrere Laufwerke vorhanden ist um überhaupt etwas an Performance zu erhalten https://docs.microsoft.com/en-us/windows-server/storage/storage-spaces/storage-spaces-storage-bus-cache. Ich habe Cache-Größen von 10-50% gesehen und an der Stelle ist es dann oft eine kostengünstigere Entscheidung doch auf einen Hardware RAID Controller zu wechseln.

Badge

Die CPU langweilt sich. Wenn ich Daten von der lokalen Ssd auf das RAID kopiere, ist es leider auch nicht schneller. 

dann ist das Problem offensichtlich ja der Raid-Verbund, bzw. entweder die settings (siehe das was mathschut geschrieben hat), oder eben, der nicht vorhandene Raid-Controller. ich würde vorschlagen einmal zu prüfen, ob ihr mit parity space oder mirror konfiguriert habt. ansonsten bleibt denke ich nichts anderes übrig als auf einen “richtigen” Controller zu wechseln...

Comment