Statistische Auswertung

Statistische Auswertung

Statistische Datenanalyse – Auswertungsverfahren richtig anwenden

Bei der statistischen Auswertung von (Umfrage-)Daten kann die falsche Anwendung von statistischen Verfahren dazu führen, dass Werte fehlerhaft analysiert, präsentiert und interpretiert werden. Im schlimmsten Fall werden aus den fehlerhaften Analysen die falschen praktischen Schlussfolgerungen gezogen. Als einfaches Beispiel sei an dieser Stelle die in der Markt- und Meinungsforschung oft gängige Praxis erwähnt, Mittelwerte ohne Berücksichtigung von Streuungsmaßen zu interpretieren und darzustellen. Durch fehlendes Wissen und Verständnis von statistischen Analyseverfahren und deren spezifischen Anwendungsmöglichkeiten können zudem wertvolle Informationen verloren gehen, wenn die erhobenen Daten nur nach einem einfachen Schema ausgewertet werden und vertiefende weiterführende Datenanalysen ausbleiben.

Volles Potential der Daten nutzen

Um das volle Potential Ihrer Daten nutzen zu können, wende ich ein breites Spektrum von uni-, bi- und multivariaten Verfahren an und werte Ihre Daten nach wissenschaftlichen Standards aus. Die statistische Auswertung orientiert sich bei der angewandten Analysemethodik dabei individuell an Ihren spezifischen Zielsetzungen, Fragestellungen und den zu analysierenden Datentypen. Im Rahmen der statistischen Auswertung kommen unter anderem die folgenden Analyseverfahren zum Einsatz:

 

Treiberanalyse / Kausalanalyse / Prognose:

  • (Partielle) Korrelationen
  • Kreuztabellierung und Kontingenzanalyse
  • Regressionsanalyse (OLS- / Shapley-Value-Regression, Logistische Regression)
  • Varianzanalyse (ANOVA, MANOVA)
  • Strukturgleichungsmodelle

Segmentierung / Gruppenbildung / Dimensionsreduktion:

  • Faktorenanalyse
  • Clusteranalyse
  • Diskriminanzanalyse
  • Conjoint-Analyse

Für die Durchführung der statistischen Analysen wird je nach Fragestellung und den anzuwendenden Analyseverfahren die Auswertungssoftware SPSS, Excel oder die Programmiersprache Python mit ergänzenden Programmbibliotheken zur Datenauswertung (pandas, NumPy, Matplotlib) herangezogen. 

Anschauliches und verständliches Reporting der Ergebnisse

Die Ergebnisse der statistischen Datenanalyse bereite ich für Sie anschaulich in Form von Chartberichten, Tabellenbänden oder umfangreichen Studienreports visuell auf und leite dort, wo es sinnvoll und notwendig erscheint, Handlungsempfehlungen für die Praxis ab. Bei Bedarf sorgen zusätzliche Kommentare zu den einzelnen Analyseergebnissen und zu den im Rahmen der Auswertung angewandten statistischen Verfahren dafür, dass die Ergebnisdarstellung auch für den "statistischen Laien" stets verständlich und nachvollziehbar bleibt.  

Ergebnisreport Kundenbefragung Fitnessstudio
Auszug Beispielreport Kundenbefragung Fitnessstudio (zum Vergrößern klicken)

Beispiel: Ablauf Statistische Auswertung von Fragebögen einer Online-Umfrage

  1. Ex-/Import der Daten: Nach dem Ende der Feldzeit Ihrer Umfrage werden die Befragungsdaten aus der verwendeten Befragungssoftware exportiert (meist im csv-Format) und in die präferierte Auswertungssoftware importiert.
  1. Datenbereinigung und -aufbereitung: Im nächsten Schritt werden die Daten auf mögliche Inkonsistenzen geprüft. Hierzu gehören beispielsweise widersprüchliche Angaben im Fragebogen, extreme Ausreißerwerte, eine unrealistisch kurze Ausfülldauer oder Fragebögen mit eindeutigen Antworttendenzen (z. B. durchgehende Auswahl des ersten Skalenpunkts). Offensichtlich falsch bzw. manipulativ ausgefüllte Fragebögen werden aus der nachfolgenden Analyse ausgeschlossen. Der Ausschluss sollte sich dabei nur auf diejenigen Fragebögen beschränken, bei denen mit einer hohen Wahrscheinlichkeit von bewussten Falschangaben ausgegangen werden kann. Ansonsten besteht die Gefahr, dass der schmale Grat zwischen gerechtfertigter Datenbereinigung und subjektiver Datenmanipulation durch den Analysten überschritten wird. Im Anschluss wird der bereinigte Datensatz für die nachfolgenden Analysen aufbereitet (Definition fehlender Werte und der Skalenniveaus, Sortierung der Variablen, Erstellen von Mehrfachantwortensets etc.).
pandas DataFrame deskriptive Statistik
Einfache Datentabelle und deskriptive Statistiken in Form eines pandas DataFrame (zum Vergrößern klicken)
  1. Deskriptive Analysen: Im Rahmen der deskriptiven Analysen wird die Verteilung der Befragungsdaten unter anderem mit Hilfe von (relativen) Antworthäufigkeiten sowie verschiedener Lage- (z. B. Mittelwert, Median) und Streuungsmaße (z. B. Standardabweichung, Varianz) beschrieben. Die deskriptiven Statistiken werden je nach Forschungsfrage sowohl für die Gesamtstichprobe als auch für verschiedene Teilgruppen (z. B. Neu- und Bestandskunde) erstellt und liefern in Verbindung mit einer anschaulichen Visualisierung der Ergebnisse (siehe Punkt 6.) für viele Fragestellungen bereits wertvolle Erkenntnisse.
  1. Gruppenvergleiche: Oft ist es von Interesse, wie sich die Antworten zwischen verschiedenen Teilgruppen (Altersgruppen, verschiedene Abteilungen, Kundengruppen) unterscheiden. Bei (Quasi-)Vollerhebungen mit ausreichend hoher Rücklaufquote genügt es zur Veranschaulichung der Differenzen, die Antworthäufigkeiten bzw. Mittelwerte der Vergleichsgruppen einfach gegenüberzustellen und z. B. in Form von Balkendiagrammen zu visualisieren. Wenn es sich bei den Befragungsdaten dagegen um eine repräsentative Stichprobe der Grundgesamtheit handelt, müssen zusätzlich statistische Signifikanztests herangezogen werden, mit deren Hilfe sich überprüfen lässt, ob sich die in der Stichprobe ermittelten Gruppenunterschiede auch in der Grundgesamtheit wiederfinden. In Frage kommen hier z. B. der t-Test, die Varianzanalyse oder der Chi²-Test.
  1. Weiterführende statistische Analysen: Bestimmte Forschungsfragen erfordern für ihre Beantwortung weiterführende Analyseverfahren. Die Regressionsanalyse erlaubt beispielsweise die Ermittlung signifikanter Treiber der Kundenzufriedenheit, während die Clusteranalyse zur Segmentierung von Kundengruppen herangezogen werden kann. Zu beachten ist, dass für jedes Analyseverfahren eine Reihe von Modellvoraussetzungen (Skalenniveau, Verteilung der Daten, Korrelationen zwischen den Variablen etc.) erfüllt sein müssen, damit mit diesem aussagekräftige Ergebnisse erzielt werden können. Die verschiedenen Verfahren sind daher nicht immer bei allen Daten gleichermaßen anwendbar. Die für die Auswertung heranzuziehenden Analyseverfahren sollten daher bereits im Rahmen der Fragebogenkonzeption mit berücksichtigt werden.
  1. Visualisierung der Analyseergebnisse: Ist die statistische Auswertung abgeschlossen, werden die Ergebnisse anschaulich in Form von Tabellen oder Diagrammen visualisiert. Hierfür eigenen sich je nach Datentyp unter anderem Balken-, Säulen- oder Kreisdiagramme, Streudiagramme, Spinnennetzdiagramme, Verbunddiagramme, Histogramme und Boxplots.
Verbunddiagramm mit Antworthäufigkeiten und Mittelwert
Verbunddiagramm mit relativen Antworthäufigkeiten und Mittelwertvergleich (zum Vergrößern klicken)
  1. Ergebniszusammenfassung: Die statistische Auswertung endet mit der Zusammenfassung der Ergebnisse in Form eines Tabellenbandes, Chartberichts oder ausführlichen Studienreports. Welche Form der Ergebnisdarstellung gewählt wird, hängt unter anderem vom Umfang und der Art der Ergebnisdaten sowie davon ab, auf welche Weise die Befragungsergebnisse präsentiert werden sollen (z. B. PPT-Präsentation vor Mitarbeitern). Insbesondere bei sehr umfangreichen Befragungen kann es zudem sinnvoll sein, mehrere separate Ergebnisdarstellungen für verschiedene Organisationseinheiten (z. B. abteilungsspezifische Reports) zu erstellen. 

Unter Beispiele & Vorlagen finden Sie weitere Informationen zur statistischen Auswertung einer Kundenbefragung und einer Mitarbeiterbefragung sowie Beispiele zur grafischen Darstellung der Ergebnisse.

 

Für Details zur Analysemethodik, den angewendeten statistischen Verfahren oder für ein unverbindliches Angebot nehmen Sie gerne Kontakt mit mir auf.