Data Warehouse-Erstellung

7

Ich bin ziemlich grün, wenn es um dieses Feld geht. Ich bin jetzt seit 8 Monaten Datenanalyst in einem kleinen Krankenhaus, nach einem zweijährigen Abschluss in einem neuen Berufsfeld für mich.

Situation

Wir haben eine Cobol "Datenbank" (ich benutze den Begriff Datenbank leichtfertig ...). Es ist eine proprietäre hierarchische Datenbank. Wir haben eine sekundäre Softwarelösung, die darüber eine ODBC-SQL-Schicht für den Zugriff von außen über eine Standardschnittstelle bereitstellt. Ich denke, es enthält SQL 99-kompatible Befehle.

COBOL Database to SQL lässt zu wünschen übrig. Indizes sind in Stein gemeißelt. Wenn ich also eine Abfrage durchführen möchte, die nicht für ein oder zwei indizierte Felder eingegeben wurde (Index = Patientennummern. Wenn ich also nach Zulassungs- / Entlassungsdaten fragen möchte ... vergessen Sie es), dann ist es hundeschwach . Joins verwandeln eine 5-minütige Abfrage in eine 45-minütige Abfrage. Zu viele Abfragen verlangsamen den REST des Systems und verursachen schlechte Dinge.

Das System verfügt zwar über ein internes Abfragesystem, ist jedoch keineswegs vollständig. Es hat seine Stärken und Schwächen, aber das Hauptproblem ist die Zusammenarbeit mit der Außenwelt, die ich auch zum Senden von Berichten benötige.

Frage

Was ich zu bauen versuche ... ist ein TSQL Data Warehouse. Ich möchte einen Prozess erstellen, der die Daten in eine SQL-Umgebung zieht, die ich steuern kann (Indizes hinzufügen, moderne Dinge wie case-Anweisungen verwenden, für "einfache" Abfragen keine 15 Minuten dauern).

Ich frage mich, welche guten Ressourcen, Tutorials und Tools die Experten vorschlagen würden. Meine ideale Situation wäre ein "historisches" Laden aller Daten in eine T-SQL-Datenbank, gefolgt von wöchentlichem Laden neuer Daten. Es wäre nicht ideal für "Echtzeit" -Berichte, aber der Großteil meiner Berichtsanforderungen würde mit "leicht" alten Daten erfüllt.

Ich habe mit ## Temp-Tabellen, Zusammenführen in, Aktualisieren usw. herumgespielt und versucht, die Zeiten für Ladevorgänge und Aktualisierungen zu ermitteln und was nicht ... aber bevor ich zu tief gehe, möchte ich nur einige allgemeine Informationen erhalten Rat.

WernerCD
quelle

Antworten:

7

Ich würde empfehlen, ein Data Warehouse mit Beispielen in SQL Server von Vincent Rainardi zu erstellen, da dies die SQL Server-Besonderheiten abdeckt. Das Data Warehouse Toolkit ist ebenfalls eine hervorragende und praktische Anleitung, jedoch nicht plattformspezifisch.

Meilen D.
quelle
Ich hatte sehr viel Glück mit Apress, also muss ich mir das mal ansehen. Ich mag auch die Idee eines plattformunabhängigen Ansatzes, obwohl wir SQL-Server intern verwenden.
WernerCD
Ich hatte erstaunlicherweise nicht daran gedacht, nach Büchern zu suchen, die speziell für Data-Warehousing bestimmt waren. Vielen Dank, dass Sie mich auf das Offensichtliche hingewiesen haben.
WernerCD
3

Ich gehe davon aus, dass dies mit SSIS geschieht und eine Verbindung über Ihren vorhandenen ODBC hergestellt wird. Es ist maßgeschneidert, um Daten aus verschiedenen Quellen in SQL Server abzurufen und anschließend beispielsweise von SSRS zu verwenden . Mein Rat wäre, ein wenig Hintergrundwissen über diese Tools zu lesen und zu prüfen, ob sie auf Ihre Situation angewendet werden können. Wenn nicht, haben Sie zumindest eine klarere Vorstellung davon, welche Funktionen Sie benötigen, die sie nicht haben und können damit einkaufen.

Gaius
quelle
0

Der Microsoft Business Intelligence 24-Stunden-Trainer von Knight ist eine Buch-DVD-Kombination. Dies ist ein weiterer guter Einstieg in Microsoft BI.

Bob Blackburn
quelle