Welche Möglichkeiten zur Problembehandlung gibt es bei einer parallelisierten FEMFAT-Analyse?

In vielen typischen Anwendungen (z.B. multiaxiale Schädigungsanalyse einer Karosserie mit mehreren Hundert Kanälen & gemessenen Lastzeitreihen) wird, wenn die Berechnungsdauer eine entscheidende Rolle spielt, dringend empfohlen, die Parallelisierung anzuwenden. 

FEMFAT setzt dazu auf eine „modellbasierte“ Parallelisierung: es werden ausgehend von der eingelesenen Geometrie (und in ChannelMAX auch unter Berücksichtigung der Belastung) vom FEMFAT-Hauptprozess (Master) Berechnungsgruppen sowie eigene Jobfiles erstellt, welche von zusätzlich gestarteten FEMFAT-Instanzen (Slaves) abgearbeitet werden. 

Die Datei parallconfig.txt (zu finden im FEMFAT-Installationsordner unter „Resources“) enthält wichtige Parameter zur Steuerung der parallelisierten FEMFAT-Analyse. Die zwei für die Problembehandlung wesentlichsten Parameter sind:

  • SlaveStartTimeout: max. Wartezeit (in Sek.) des Masterprozesses, bis alle Slave-Prozesse initialisiert wurden. Ist auch nur ein Slave bis dahin nicht fertig initialisiert, bricht die Berechnung ab.
  • SlaveFinishTimeout: max. Wartezeit (in Sek.) des Masterprozesses auf das Berechnungsende des langsamsten Slaves.

Empfohlene Vorgehensweise bei Problemen:

  • Grundsätzlich empfehlen wir, msg-, pro- bzw. fps-Dateien der einzelnen Slave-Prozesse (in den Unterordnern des FFparallel Ordners) sowie des FEMFAT Hauptprozesses  (typischerweise im Arbeitsverzeichnis) auf Fehler/Warnungen hin zu überprüfen.
  • Sind diese Dateien nicht verfügbar bzw. ist die für eine FEMFAT-Parallel-Analyse typische Verzeichnisstruktur nicht vorhanden, so überprüfen Sie bitte, ob zum Startzeitpunkt ausreichend Speicher / Lizenzen für die gewählte Anzahl an CPUs zur Verfügung standen.
    • Der benötigte Festplattenspeicher kann abgeschätzt werden durch: 

Speicher für nicht-parallelisierte Analyse x Anzahl CPUs 

Der Hauptspeicherbedarf ist sehr stark von der Modellgröße abhängig. In der Praxis hat sich folgende Faustregel bewährt: 3 GB RAM pro 1 Mio. Knoten und CPU. 

Damit sind bereits Reserven für das System sowie etwaige Aufrufe des FE-Adapters inkludiert.

c) Kein Berechnungsfortschritt, obwohl FFparallel-Ordner vorhanden sind und Slave-Prozesse gestartet wurden. Bitte prüfen Sie, ob der SlaveStartTimeout groß genug gewählt worden ist (insbesondere bei großen Modellen und/oder sehr vielen großen Scratch-Files kann es zu Zeitüberschreitungen kommen).

d) Teilbereiche ohne Ergebnisse: fps-, msg- und pro-Files der Slaves auf Fehler überprüfen sowie Filtereinstellungen bzw. die Ausgaben auf der Konsole überprüfen.

e) Performance-Probleme: Dabei ist zu beachten, dass in FEMFAT nur die eigentliche Analyse parallelisiert wird. Aktuell sind weder das Lesen der Strukturdaten noch das Scratchen der Spannungsdaten parallel ausführbar. 

Zu berücksichtigen ist außerdem, dass stets für das Aufteilen der Struktur bzw. das Zusammenfügen der Teilergebnisse Zeit veranschlagt werden muss. Diese kann im Falle kleinerer Modelle bzw. kurzer Gesamtanalysezeiten die Zeitersparnis aufgrund der parallelisierten Analyse dominieren!

Tipp: für eine optimale Performance empfehlen wir bei Abaqus odb-Files entweder die Verwendung der an die jeweilige FE-Adapter-Version angepassten odb-Version bzw. von bereits im Vorhinein upgedateten odb-Files. Andernfalls führt jeder Slave-Prozess ein Update der odb-Datenbank durch.