DeltaMaster clicks 07/2006

Relationale Daten integrieren

PDF Download

Liebe Datenanalysten,

in der Automobilindustrie gilt der Hybridantrieb, die Kombination von Verbrennungs- und Elektromotor, als zukunftsträchtige Technologie. Das erste in Großserie produzierte Hybridfahrzeug war der Toyota Prius. Seine Verkaufszahlen zeugen von dem wachsenden Interesse: Rund deltamaster_clicks_2006-07-001 175.000 Stück wurden im Jahr 2005 abgesetzt. Als Vorteile gelten niedriger Verbrauch und geringe Emissionen sowie eine gesteigerte Leistung durch die Ausnutzung der unterschiedlichen Drehmomententfaltung.

Auch DeltaMaster setzt mehrere „Engines“ parallel ein: Ergänzend zur bewährten OLAP-Technologie schalten Sie bei Bedarf einfach die integrierte SQL-Engine hinzu und greifen damit auch relational auf Ihre Daten zu. In den aktuellen clicks! möchten wir Ihnen demonstrieren, wie und wo sich der Doppelmotor besonders sinnvoll einsetzen lässt.

Herzliche Grüße
Ihr Team von Bissantz & Company

Beginnen wir mit ein wenig Theorie: Ein Grundgedanke des Online Analytical Processing (OLAP) ist, Daten auf verschiedenen Ebenen zu verdichten und aggregiert zu betrachten. Um möglichst flexibel analysieren und berichten zu können, überspielt man den relevanten Datenbestand aus den operativen Anwendungssystemen, beispielsweise aus der Warenwirtschaft oder aus so genannten ERP-Systemen, zunächst in eine relationale Datenbank, wo die Daten für den Aufbau von mehrdimensionalen Würfel-Strukturen vorbereitet werden. Aus dieser „Zwischenschicht“ speisen sich die OLAP-Datenbanken, auf die Sie schließlich mit dem Front-end Ihrer Wahl, DeltaMaster, zugreifen. Das folgende Schema zeigt die Architektur im Überblick.

Überspielung der Datenquellen, Operativen Vorsystemen; Datenbereitstellung, Aufbereitung und Speicherung der relationalen Daten mit OLAP-Cubes; Datennutzung, Analyse und Präsentation mit DeltaMaster

Immer wieder ist es notwendig, zusätzlich zu den Analysen und Berichten, die auf OLAP basieren, auch auf relationale Daten zuzugreifen – sei es, um unverdichtet die zugrunde liegenden Einzeldatensätze abzurufen, sei es, um Analyseergebnisse zur Weiterverarbeitung in der Datenbank zu hinterlegen, oder sei es, um Benutzereingaben wie Planzahlen und Kommentare zentral zu verwalten. Typisch sind Anwendungsfälle wie die folgenden:

  • In einer Analyse sind Sie auf einen ungewöhnlich hohen Auftragswert aufmerksam geworden. Ein Blick in die ursprünglichen Quelldaten offenbart, dass es sich offensichtlich um eine Fehleingabe handelt. Gleichzeitig erhalten Sie so die zur Korrektur benötigte Auftragsnummer.
  • Mit den Data-Mining-Methoden von DeltaMaster haben Sie ein kleines Segment von Kunden identifiziert, das einerseits hohe Erträge in der Zukunft erwarten lässt, andererseits aber auch viel vertrieblicher Zuneigung bedarf. Um sie gezielt ansprechen zu können, benötigen die Außendienstmitarbeiter ihre Kunden- und Vertragsnummern. Wenn außerdem auch der Dateiname oder Pfad der Vertragsdokumente abgespeichert ist, können Sie diese Unterlagen direkt aus der DeltaMaster-Anwendung heraus bereitstellen.

Der Weg von DeltaMaster in die relationalen Systeme wird nach der dabei verwendeten Abfragesprache als SQL-Durchgriff bezeichnet. Auch in diesem Bereich verfügt DeltaMaster über besonders leistungsfähige, integrierte Mechanismen. Deshalb sprechen wir auch von einem „Hybridantrieb“: DeltaMaster funktioniert mit multidimensionalen OLAP-Würfeln ebenso wie mit den zugehörigen Tabellen einer relationalen Datenbank, und die Kombination ermöglicht besonders agiles Arbeiten.

Relationales in DeltaMaster

Relationale Daten können in DeltaMaster-Anwendungen an verschiedenen Stellen einbezogen werden, nämlich:

  • im Modul SQL-Durchgriff zum Abruf von Einzeldatensätzen,
  • zum Rückschreiben von virtuellen und benutzerdefinierten Hierarchien,
  • in den Analyseverfahren Assoziationsanalyse (siehe DeltaMaster clicks! 06/2005) und Selector, die von der OLAP-typischen Vorverdichtung nicht profitieren und deshalb mit relationalen Daten arbeiten, sowie
  • zur Speicherung von Textkommentaren zum Beispiel in Planungsanwendungen (siehe DeltaMaster clicks! 04/2006).

In den vorliegenden clicks! wollen wir die beiden erstgenannten Punkte näher darstellen.

Voraussetzung für alle diese Varianten ist, dass das relationale Modell an Ihr Analysemodell angebunden ist.

Gute Anbindung

Das relationale Modell binden Sie entweder gleich beim Erstellen eines neuen Analysemodells an, indem Sie im Assistenten die entsprechende Option aktivieren, oder nachträglich über den Eintrag im Menü Modell. In beiden Fällen erscheint ein Dialog, in welchem Sie sich für eine der drei Methoden entscheiden, wie DeltaMaster an die zusätzlichen, für die Arbeit mit den relationalen Daten benötigten Strukturinformationen (die Metadaten) kommt:

Relationales Modell anbinden im Menü Modell

  • Besonders komfortabel ist die so genannte DSO-Schnittstelle (Decision Support Objects), über die DeltaMaster die Strukturen der relationalen Datenbank direkt aus Microsoft Analysis Services 2000 ausliest, sodass keine weitere Konfiguration erforderlich ist. In Analysis Services 2005 werden relationale Modelle über AMO (Analysis Management Objects) angebunden; diese Schnittstelle wird ab der kommenden Version DeltaMaster 5.2 zur Verfügung stehen.
  • Für alle anderen Datenbanken außer Microsoft Analysis Services, zum Beispiel Applix TM1 oder MIS Alea, lassen sich die Strukturinformationen mithilfe einer XML-Datei formulieren. Gerne sind Ihnen unsere Berater dabei behilflich, die passende Konfiguration zu erstellen.
  • Das Werkzeug ImportWizard aus unserem Hause dient dazu, Daten in verschiedenen tabellenartigen Formaten einzulesen, aufzubereiten und als mehrdimensionale Würfel für Microsoft Analysis Services oder MIS Alea abzuspeichern. Die Strukturdefinitionen, die in diesem Prozess erhoben werden, lassen sich ebenfalls zum Anbinden des relationalen Modells nutzen.

Die Angaben über das angebundene relationale Modell speichert DeltaMaster im Analysemodell (.dam) bzw. in der Analysesitzung (.das), sodass die Einrichtung nur einmal vorzunehmen ist. Von der Anbindung zu unterscheiden ist die Anmeldung. Auch die relationale Datenbank verlangt eine Authentifizierung. Die dazu prinzipiell erforderliche zusätzliche Abfrage von Benutzername und Passwort lässt sich vermeiden, wenn Ihre Systemumgebung für das so genannte „Single Sign-On“ konfiguriert ist. Bei den Microsoft-Datenbanken ist dies mit der Option „Windows-Authentifizierung“ schnell erledigt.

Relationale Daten anzeigen – das Modul SQL-Durchgriff

Das Modul SQL-Durchgriff in den Basisverfahren übernimmt die Anzeige der relationalen Daten. Nach Maßgabe der Einstellungen, die wir weiter unten erläutern, zeigt es alle Datensätze, die zu der aktuellen Sicht gehören, als Tabelle an. Alternativ können Sie auch den SQL-Ausdruck, mit dem DeltaMaster die Daten ausgelesen hat, abrufen, kopieren und als Abfrage in Ihre Datenbankoberfläche, zum Beispiel Query Analyzer, übernehmen.

Modul SQL-Durchgriff in den Basisverfahren

Die wichtigsten Einstellungen für den SQL-Durchgriff nehmen Sie auf der Registerkarte Felder vor, die Sie auch über das Menü Felder auswählen erreichen.

Registerkarte Felder in den Einstellungen für den SQL-Durchgriff

Hier bestimmen Sie zunächst die Fakttabelle, zu der Sie die relationalen Daten sehen möchten. Daraufhin listet DeltaMaster alle ihre Felder und deren Datentyp auf. Im Anschluss an die Fakttabelle erscheinen die Dimensionstabellen mit ihren Feldern, die ebenfalls für SQL-Abfragen verwendet werden können.

Mit den Markierungen in der Spalte ganz links legen Sie fest, welche Felder in der Abfrage berücksichtigt werden sollen. Ein Häkchen neben einem Tabellennamen aktiviert alle Felder der markierten Tabelle.

In der Spalte Format bestimmen Sie für jedes Feld das Anzeigeformat der Werte, beispielsweise die Anzahl der Nachkommastellen. Wenn Sie möchten, können Sie die Ausgabe nach einem oder mehreren Kriterien sortieren lassen. Die Richtung (aufsteigend oder absteigend) legen Sie mit dem Auswahlfeld in der Spalte Sortierung fest. Wenn Sie mehrere Felder zur Sortierung angegeben haben, kommt es auch auf die Reihenfolge an, die in der entsprechenden Spalte als Ordnungszahl eingetragen oder über den Link Reihenfolge der Sortierung einfach per Drag & Drop eingestellt wird.

Ebenso lässt sich die Reihenfolge der Anzeige, in der DeltaMaster die Datensatzfelder von links nach rechts präsentiert, regeln: Entweder stellen Sie die Ordnungszahl in der entsprechenden Spalte ein oder Sie benutzen den gleichnamigen Link, um die Reihung per Drag & Drop herzustellen. Als zusätzliche Bedingung können Sie SQL-Ausdrücke angeben, die in die WHERE-Klausel des zu generierenden SQL-Ausdrucks eingefügt werden. Damit lassen sich auch ganz individuelle Filterkriterien festlegen.

Mit der Spaltenbreite, angegeben in Pixeln, nehmen Sie Einfluss auf die Bildschirmanzeige. Das ist besonders praktisch bei langen Textfeldern: DeltaMaster bricht den Text an der angegebenen Stelle um und gibt ihn mehrzeilig aus. Wenn Sie das Feld wie in der Voreinstellung leer lassen oder 0 eingeben, justiert DeltaMaster die Spalte automatisch.

Die Option Funktionen blendet eine zusätzliche Spalte ein, mit der Sie die Ausgabedatensätze nach einzelnen Feldern gruppieren und die Werte aggregieren können, zum Beispiel aufsummieren oder den Mittelwert bilden. Dies wird nur in speziellen Anwendungsfällen oder zur Kontrolle des OLAP-Modells sinnvoll sein; schließlich will man mit dem SQL-Durchgriff ja vornehmlich auf einzelne Datensätze zugreifen, während man die Zusammenfassung besser dem OLAP-Modell überlässt.

Auch wenn man sich für disaggregierte, einzelne Datensätze interessiert, sind oftmals nicht alle Einträge von Belang. Eine „Vorauswahl“ haben Sie bereits mit der aktuellen Sicht getroffen, denn der SQL-Durchgriff ist in die Analysekette von DeltaMaster eingebunden und berücksichtigt deswegen die jeweils geltende Analysesicht. Um die Rückgabemenge weiter einzuschränken und auf das Wesentliche zu konzentrieren, können Sie zum einen die Anzahl der auszugebenden Datensätze auf der Registerkarte Allgemein beschränken. Zum anderen lassen sich auch beim SQL-Durchgriff, wie in vielen anderen Modulen, Filter für Analysewerte definieren, sodass nur bestimmte Wertebereiche zur Anzeige gelangen.

Definition von Filtern für Analysewerte

Das Zusammenspiel dieser Optionen macht DeltaMaster zu einem äußerst anpassungsfähigen Betrachter für relationale Daten.

Einschreiben mit Rückschein

Die in der Tabellenansicht des SQL-Durchgriffs präsentierten Datensätze lassen sich wiederum in die relationale Datenbank zurückspeichern, sodass andere Anwendungssysteme sie dort „abholen“ und weiterverarbeiten können. Zwei Varianten stehen zur Wahl:

  • Beim „Update“ markiert DeltaMaster die Datensätze der Ergebnismenge in einem Feld, das in der Fakttabelle für diesen Zweck reserviert wurde. Als Wert tragen Sie einen beliebigen Text oder eine Zahl ein, die bei allen Datensätzen in das entsprechende Feld eingetragen wird. So kennzeichnen Sie beispielsweise die Kunden, die mit einer Mailing-Aktion angeschrieben werden sollen.

Registerkarte Zurückschreiben in den Einstellungen für den SQL-Durchgriff

  • Beim „Insert“ schreibt DeltaMaster die Datensätze der Ergebnismenge wie angezeigt in eine eigene Tabelle. Wenn diese noch nicht existiert, erzeugt DeltaMaster die Relation automatisch. Im anderen Fall können Sie entscheiden, ob DeltaMaster vor dem Einfügen die bereits vorhandenen Datensätze löschen oder die neuen an den bestehenden Tabelleninhalt „anhängen“ soll. Letzteres erlaubt es beispielsweise, für mehrere Sichten Einzelsätze zu bestimmen und sukzessive zu exportieren.

Hierarchien zurückschreiben

Um Datensätze in der relationalen Datenbank zu kennzeichnen, ist es jedoch nicht unbedingt erforderlich, zunächst die Einzeleinträge abzurufen. Auch virtuelle Hierarchien, die Sie beispielsweise aus der ABC-, der Portfolio- oder der Verteilungsanalyse heraus gebildet haben, und benutzerdefinierte Hierarchien stellen eine Klassifizierung dar, die zurückgeschrieben werden kann.

Dazu wechseln Sie im Dimensionsbrowser in die gewünschte Hierarchie und rufen im Menü Ich möchte die Funktion Hierarchie zurückschreiben auf. Dann wählen Sie das Feld der Dimensionstabelle aus, in das die jeweilige Kennzeichnung eingetragen werden soll.

Fenster Virtuelle Hierarchie zurückschreiben

Modell-Symmetrie

Wie eng OLAP- und relationales Modell in DeltaMaster verbunden sind, wird im Modell-Browser (Menü Modell) besonders deutlich.

Modell-Browser

Die Begrifflichkeiten Ihrer Analyseanwendung, zum Beispiel die Namen der Dimensionen und Kennzahlen, sind den entsprechenden OLAP-Objekten und den Konstrukten der relationalen Datenbank, aus der sie stammen, gegenübergestellt. So geht beispielsweise der Würfel „Deckungsbeitragsrechnung“ auf die Fakttabelle „V_FACT_ Chair“ zurück. Das Analyseobjekt „Kunden (Top)“ entspricht im OLAP-Modell der Dimensionsebene „[Kunden]. [Top]“ und relational dem Feld „DE_Top“ in der Dimensionstabelle „Geograph“.