Kategorisierung von Datenstrukturen

8. Juni 2009 Keine Kommentare

Zu beurteilen, ob eine Visualisierungsmethode auf die vorliegenden Daten sinnvoll anwendbar ist, ist oft nicht einfach. Man muss wissen, für welche Datenstrukturen die Methode geeignet ist, und dann die eigenen Daten daraufhin prüfen oder evaluieren. Bisher habe ich aber keinerlei umfassende Kategorisierung von Datenstrukturen gefunden. Und auch die Autoren von Vis-Methoden gehen kaum auf die Voraussetzungen ein, um die Methode anzuwenden. Und schließlich fehlen Tools, die Daten (typischerweise in Datenbanken) auf ihre Struktur untersuchen. Mehr…

Extract, Transform, Load (ETL)

27. April 2009 Keine Kommentare

Aus einem Tutorial auf talend.com

Extract, Transform, Load (ETL) bezeichnet in der Informatik einen Prozess, um Daten aus mehreren Datenquellen mit ggf. unterschiedlichen Strukturen in einer Zieldatenbank zu vereinigen. Dieser Vorgang wird in drei Schritten vollzogen, aus denen sich die Bezeichnung ETL ableitet:

  1. Extraktion (Extract) der relevanten Daten aus verschiedenen Quellen
  2. Transformation (Transform) der Daten in das Schema und Format der Zieldatenbank
  3. Laden (Load) der Daten in die Zieldatenbank

[Quelle: Wikipedia]

Und bevor du nun anfängst, selbst ein ETL-Skript zu schreiben: es gibt da ein Open Source Tool. Talend bietet ein Klick-mich Wysiwyg-Interface und Unterstützung für so ziemlich alle Datenbanksysteme.

KategorienDaten, Lexikon Tags: