Kontinuierlicher Datenimport

Allgemein

Antony stellt eine Möglichkeit bereit Daten kontinuierlich von externen Quellen in Kontakte und Flexobjekte zu importieren. Die Quelle wird dabei von einem einfachen, ausführbaren Programm ausgelesen und das Ergebnis in antony importiert. Dieses Programm nennen wir Importer. Als Schlussfolgerung können von allen Quellen importiert werden, welche von einem Programm abgerufen werden können. Sei es eine Datenbankverbindung, REST-APIs, Dateien im Dateisystem, per FTP oder sonstiges.

Einzige und wichtigste Voraussetzung ist, dass das Fremdsystem eine konsistente ID liefert. Wenn diese nicht vorhanden ist, so können importierte Objekte nicht mehr geändert, sondern nur neue hinzugefügt werden.

Die Daten vom Importer werden angenommen und anschließend über ein Mapping auf die Felder in antony gemapped. Dieser Prozess findet zum Entlasten der AntonyDienste im Importer selbst statt. antony bietet für die einfache Implementierung ein NuGet Paket (https://www.nuget.org/packages/antony.Groupware.DataImport ) an.

Technische Funktionsweise

Die folgende Abbildung beschreibt die Funktionsweise. In der Mitte ist der antony-Server zu sehen. Die Datenquelle, welche anzusprechen ist, ist als Datenbank auf der rechten Seite zu sehen.

Die Antony-Dienste beinhalten ein AntonyImportModul welches sich im Mainservice befindet. Dieses führt den Importer in einem einstellbaren Zeitinterval aus. Der Importer liest die Daten aus der Datenquelle aus, mappt diese nach Konfiguration und übergibt sie zurück an das AntonyImportModul. Schlussendlich werden die zurückgegebenen “Anweisungen” vom AntonyImportModul ausgeführt und entsprechend importiert.

Das AntonyImportModule wird während der Umbauten auf die neue Struktur zwischen den neuen Diensten wandern. Die Einstellungen bleiben allerdings identisch

Schnittstelle zwischen AntonyImportModul und Importer

Die Schnittstelle zwischen dem AntonyImportModul und dem Importer arbeitet dateibasiert, um eine möglichst große Kompatibiliät zu erreichen. Das AntonyImportModule erzeugt bei einem Import zwei relevante Dateien. Wir empfehlen eine .NET Anwendung mit dem NuGet Paket für den Import zu verwenden. Anschließend wird der konfigurierte Importer mit den beiden Dateien gestartet. Als Ergebnis liefert der Importer wieder eine Datei, welche anschließend verarbeitet wird.

importconfig.json

Diese Datei enthält die Konfiguration des Imports. Unten findet sich ein gekürztes Beispiel. Zunächst enthält diese ein paar Metadaten. Interessant hierbei sind die ConnectionInformation, welche in diesen Fall einen Connectionstring enthält. Es könnte sich aber allerdings auch um Zugangsdaten für eine REST-Schnittstelle oder sonstiges handeln. Die Belegung vom Importer abhängig.

Ebenfalls kann der Importer einen weiteren Parameter enthalten, welcher im ImportParameter stehen. Für einen generischen MySqlImporter könnte dort beispielsweise einen SQL-Abfrage stehen. Der Parameter ImportGroup wird weiter unten erläutert

{ "ImportId": "94696bad-379f-43ed-bcf7-07ff5a135df8", "Frequency": "00:01:00", "Comment": "BPS-Projekt", "ConnectionInformation": "User=root;Pwd=password;Host=127.0.0.1;Port=3306;Driver ...", "ImportParameter": "", "ImportGroup": "TestGruppe", "MappingName": "TestKontakte", "Configurations": [ { "ForeignSourceField": "FIRST_NAME_FIELD_OF_FOREIGN_SYSTEM", "AntonyTargetField": "Firstname", }, { "ForeignSourceField": "SOME_CUSTOM_FIELD_OF_FOREIGN_SYSTEM", "AntonyTargetField": "Field_4711", "ConverterInfos": [ { "ConverterName":"Expression", "ConverterParameter":"(t) => { var match = new System.Text.RegularExpressions.Regex(\"(?<str>[^,]+),[ ]*(?<plz>[^ ]+)[ ]+(?<ort>.*)\").Match(t.ToString()); if (!match.Success) return $\"(Nicht erkannt) {t}\"; return match.Groups[\"str\"].Value; }" } } ] }

Unter den Metadaten befinden sich Informationen zum eigentlichen Mapping. Diese werden im AntonyImportModul konfiguriert und beschreiben das Mapping der Felder aus dem Fremdsystem und antony. Die Einträge enthalten immer ein ForeignSourceField und ein AntonyTargetField. Entsprechend dieser Mappings ist die Ausgabedatei zu generieren.

Die Konverter bereiten dem Import eine gewisse Flexibilität. Beispielsweise können Texte transformiert oder Werte berechnet werden. Im Beispiel wird eine Zeichenfolge mit einem regulären Ausdruck auseinandergeschnitten, um anschließend Teile dessen zurückgegeben.

Im Import NuGet Paket ist die ObjectMapping-Klasse enthalten, welche das Mapping mit den Konvertern auf eine einfache Weise implementiert. Wenn dieses nicht verwendet werden soll, können diese natürlich auch “hart verdrahtet” werden. Ein Datenimport ist IMMER individuell.

ImportState

Die zweite Datei, die dem Importer übergeben enthält den ImportState. Dieser enthält das Mapping der Ids aus dem Fremdsystem und antony. Im Beispiel sehen wir das Mapping der “Projekte“. Das Objekt mit dem Identifier “bps://projekt/201857” ist in antony mit “antony://flexobject/26/31581” importiert worden. Etwaige Änderungen spiegeln sich in diesem Objekt nieder.

Antony verwendet für das Identifizieren URIs (https://diegroupware.atlassian.net/wiki/spaces/DEV/pages/113737729). Auf Seite des Fremdsystems ist dies ebenfalls sinnvoll.

{ "ImportId": "94696bad-379f-43ed-bcf7-07ff5a135df8", "LastSyncUTC": "2022-01-10T13:21:57", "IdMappings": { "Projekte": { "bps://projekt/201857": "antony://flexobject/26/31581", "bps://projekt/201858": "antony://flexobject/26/31589" } } }

ImportGroup und MappingName

Das ImportModul kann beliebig viele Importe gleichzeitig vornehmen, wobei jeder Import wiederrum einen eigenen ImportName aufweist. Es können sich mehrere Importe in der gleichen sogenannten ImportGroup befinden. Eine ImportGroup ist ein logischer Zusammenschluss von Import und ermöglicht den Zugriff auf die ImportStates der anderen Importe.

Der Anwendungsfall ist beispielsweise ein Flexobjekt, welches ein Feld mit einem Verweis auf einen Kontakt hat - wie zum Beispiel ein “Auftraggeber” Feld. In dem dazugehörigen, gemappten Feld muss sich die ID des antony-Kontakts (antony://contact/4711) befinden. Dies kann der Importer allerdings nur dann machen, wenn er die Kentniss vom Mapping der Kontakte hat. Die ImportGroup sorgt dafür, dass dieser Zugriff möglich ist. So kann der Importer die KontaktId des Fremdsystems generieren und über das Mapping in die AntonyId überführen.

Converter

Converter können für die Umwandung “im Kleinen” für Anpassungen genutzt werden. Sie werden im AntonyImportModule konfiguriert und im Importer.exe ausgeführt. Sie dienen dazu die Werte inhaltlich anzupassen. Im NuGet Paket sind die standardmäßigen Konverter bereits enthalten.

Zusammenfassung

Dieser Artikel dient dafür, dass Sie einen groben Einblick in die Funktionsweise des Imports erhalten. Die Konfiguration finden Sie in den Unterpunkten.