Die Datenaufbereitung

Konkretes Vorgehen

Nach der Datensammlung und der Aufbereitung der Daten möchten wir uns zunächst mittels verschiedener Data Science Libraries (Seaborn, scikit-learn, Pandas etc.) einen Überblick über die einzelnen Parameter und deren Korrelationen etc. verschaffen.

Mögliche Fragestellungen in diesem Teil wären: „Inwieweit spielt das Alter eine Rolle?“, „Gibt es stadtteilbezzogene Differenzen?“, „Gibt es wirklich Stereotypen in der Musik: Hören Leute über 60 automatisch klassische Musik und schließen jüngere Menschen Klassik von vornerein aus oder hat die schulische Ausbildung wirklich etwas damit zu tun welches Genre wir bevorzugen?!“

Haben wir dann ein Datenverständnis erlangt, so begeben wir uns an die Ausarbeitung der wichtigsten Aussagen aus dem Datensatz für die interaktive Musikkarte. Für die Auswertung werden wir verschiedene ML (Meachin Learning) und Clustermethoden anwenden, anschließend für die Kartenerstellung Cufflinks und Plotly nutzen und das ganze dann abschließend über HTML, Django und CSS auf unserer Website einbinden.

Im Allgemeinen ist die Datenerhebung, Datenaufbereitung, Datenpflege und das Implementieren der Daten äußerst zeitintensiv. Demgegenüber ist der allgemeine Kostenaufwand ungeachtet der Arbeitszeit und Rechenleistung gleich null.