Data Science

Du bist hier:

Kurze Empfehlung:

Ein kleiner Technologiestack für DataScience-Heimprojekte“ von David Kriesel, dieser ist einigen vielleicht durch seine unterhaltsamen und lehrreichen Vorträge bekannt:

[Dieser Artikel soll zu einem späteren Zeitpunkt erweitert werden]

Data Science mit Python

[…]

Visualisierungen

Durch das Plotten versucht man Daten zu verstehen, indem man sie in einen visuellen Kontext setzt und so Muster, Trends und Korrelationen sichtbar macht.

Python bietet die Möglichkeit mehrere großartige Grafikbibliotheken mit vielen verschiedenen Funktionen einzubinden: Ob interaktiver Plot, Live-Plots oder ästhetisch anspruchsvolle Plots, Python hat für (fast) alles eine Lösung.

Pythons Plot-Bibliotheken

Um einen kleinen Überblick zu schaffen, hier einige beliebte Plot-Bibliotheken:

  • Matplotlib: Low Level, viel (gestalterische) Freiheit.
  • Pandas: Benutzerfreundlich, basiert auf Matplotlib.
  • Seaborn: Mächtige Bibliothek mit großartigen Standardstilen.
  • ggplot: Basiert auf Rs ggplot2 – Hier sei das Buch „The Grammar of Graphics (Statistics and Computing)“ empfohlen, dort wird der Prozess der Erstellung von Grafiken dekonstruiert und genauer auf die Art der Darstellung von Informationen eingegangen.
  • Plotly: Gut für interaktive Plots.

(Das oben genannte Buch liegt der Fachschaft auch physisch vor und kann bei Bedarf geliehen werden – schreibe uns dazu einfach eine E-Mail.)

Eine kleine Einführung in Matplotlib, Pandas und Seaborn

[…]

Daten visualisieren mit Tableau

Tableau für Studenten

Unter „Tableau für Studierende“ kannst Du eine kostenlose Tableau-Einjahreslizenzen bekommen, wenn Du an einer staatlichen Hochschule studierst – die Lizenz umfasst Tableau Prep und Tableau Desktop.

Mit Tableau Prep kannst Du Deine Daten für eine erfolgreiche Analyse kombinieren, formatieren und aufbereiten; anschließend kannst Du sie in Tableau Desktop visualisieren.

(Unter anderem die Kombinationsmöglichkeit macht Tableau Prep zu einem sehr mächtigen Tool – ein einfaches Beispiel: Hat man beispielsweise 3 Tabellen, Tabelle A enthält Produktbezeichnungen und Preise, Tabelle B enthält die Produktkategorie, -nummer und die -bezeichnung, Tabelle C enthält die verkauften Mengen nach Tag für eine Produktnummer. In manchen Tabellen fehlen einzelne Einträge. Prep schafft es diese drei Tabellen zu verknüpfen und gibt im Zweifel Warnungen für Felder aus, die nicht zugeordnet werden konnten. In einem Test von uns konnten so problemlos drei Tabellen mit 9 Spalten (jeweils nur ein bis zwei identisch) und 1.000.000 Zeilen (einige Einträge fehlten jeweils komplett) zusammengefügt werden.)

Die Installation erfolgt problemlos und falls bei Dir trotzdem Schwierigkeiten auftreten sollten gibt es ein umfangreiches FAQ.

Schulungen und Tutorials

Es gibt eine Reihe ausführlicher und kostenloser Lernvideos direkt auf der Website der Firma.

Und hier findest Du die Schulungsmaterialien für Studenten: