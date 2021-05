? Datenschutz in GIT ? Risikobewertung und De-ID von sensiblen PII mit optionaler Erstellung von intelligenten Testdaten und Audit-Artefakten ?

Dieser Artikel ist der erste in einer 4-teiligen Serie über die Verwaltung von Metadaten-Assets in der IRI Workbench IDE. Er konzentriert sich auf den Wert eines Metadaten-Hubs im Allgemeinen und einer Egit-Implementierung im Besonderen. Die nachfolgenden Artikel der Serie behandeln die Verwendung von EGit für Metadaten-Assets: Versionskontrolle, Lineage-Tracking und Sicherheit.

Was ist ein Metadaten-Management-Hub?

Durch die Verwaltung und das Verständnis von Metadaten und Datenbeständen kann ein Metadaten-Management-Hub sowohl Einblicke als auch Kontrolle in Enterprise Information Management (EIM)-Infrastrukturen bieten.

Ein Metadaten-Management-Hub ist eine Software, die das Sammeln, Speichern, Pflegen und Verteilen von Metadateninformationen über Repositories ermöglicht. Benutzer können dann Informationen über ihre Metadaten und damit auch über ihre Daten und Verarbeitungsaktivitäten finden und analysieren. Außerdem wird es für Personen und Teams einfacher, ihre Metadaten zu verwalten und zu sichern.

Die bekanntesten Arten von Metadaten-Repositories sind: zentralisiert, verteilt und föderalisiert. Jedes hat seine eigenen Vor- und Nachteile. IRI führt in seiner integrierten Entwicklungsumgebung Eclipse (IRI Workbench) unter Verwendung von Git-Repositories eine verteilte Metadaten-Management-Hub-Strategie ein.

Was ist Git (und EGit)?

Git ist eine Open-Source-Software, die Arbeitsverzeichnisse mit vollständiger Historie und Versionsverfolgung zur Verfügung stellt. Git ist nicht auf einen Netzwerkzugang oder einen zentralen Server angewiesen. Wir halten Git auch für eine gute Alternative zu einem datenbankgesteuerten Metadaten-Repository-Hub- und Kontrollsystem, weil es:

speziell für die Verwaltung und Nachverfolgung von Code (und damit auch von Metadaten) entwickelt wurde

Eclipse-Anwendern bereits vertraut ist (über das EGit-Plugin)

nahtlos in die IRI Workbench installiert und ausgeführt werden kann

keine separate Datenbank zur Verwaltung benötigt

es kostenlos ist

Bedenken Sie auch, dass Sie Metadateninformationen über Git-Repositories in der Cloud weit verbreiten können. Sie können eine Metadaten-Community gründen und Repositories für Ihren eigenen Bedarf und andere Repositories für den Bedarf von Gruppen erstellen. Über Git-Hosting-Dienste können Repositorys für die Gruppe freigegeben werden – entweder in einem offenen (öffentlichen) Repository oder in einem privaten Repository, das nur für Benutzer mit entsprechender Berechtigung sichtbar ist. In beiden Fällen können Sie entscheiden, ob Sie Metadaten unabhängig oder gemeinsam verwalten und nutzen möchten.

Verwendung von EGit für das IRI-Metadaten-Asset-Management:

Über das Eclipse-Plug-in für Git, EGit, können IRI-Workbench-Benutzer Git-Repositories zur Verwaltung verschiedener IRI-Datendefinitionsdateien (.DDF) und Manipulationsmetadaten bereitstellen, darunter:

Voracity (.flow) ETL und andere Multi-Table-Workflows

CoSort SortCL (.scl) Datentransformations- und Berichtsskripte

FACT (.ini) DB-Entlade-Skripte

NextForm (.ncl) Skripte für Daten- und DB-Migration, Replikation und Föderation

FieldShield (.fcl) Datenmaskierungs-Skripte

RowGen (.rcl) Skripte zur Erzeugung von Testdaten

Einchecken und Verwalten von IRI-Workflows (z. B. ETL, Reorgs, DB-Testdatenpopulationen), Batch-Jobs, Transformations- und Generierungsregeln, etc. Verwenden Sie den Hub auch zum Einchecken und Verwalten anderer Unternehmens-Metadaten-Assets, die in IRI-Workbench-Operationen eingesetzt werden, einschließlich .ddl-Dateien und .sql-Prozeduren, Datenbank-Loader-Steuerdateien usw. … so wie Java-Programmierer Git-Repositories zur Verwaltung ihres Quellcodes verwenden.

IRI-Workbench-Benutzer, die Git installieren und verwenden, sehen außerdem:

Echtzeit-Zugriff auf (und Kontrolle über) ihre Metadaten-Assets

Head-up-Anzeige der aktuellsten Informationen zu jedem Asset*

kontinuierliche Synchronisation mit Teilnehmern

Beseitigung von Entwicklungsengpässen aufgrund von Versionsunsicherheiten bei Metadaten, Duplizierung usw.

Sicherheit für ihre Metadaten und andere Assets unter der Kontrolle von Git

Der Zugriff auf den Hub und die darin enthaltenen Informationen ist für autorisierte Benutzer vorgesehen. Der Hub steuert die Rechte zum Anzeigen, Erstellen, Löschen und Ändern von Assets und erleichtert die Kommunikation zwischen Benutzern über ihre Assets. Der Hub steuert auch das Ein- und Auschecken von Assets sowie die Versionierung und erleichtert Metadatenänderungen, die Nachverfolgung der Historie und die Analyse der Auswirkungen.

Alle weiteren technischen Details sind hier in dem Blog unseres Partners IRI zu finden.

