11.3.3 Streuungsmaße

Mittelwerte und Quantile sind Lagemaße, d.h. sie sagen etwas über die absolute Lage der qualitativen Werte xj aus. Addiert man zu jedem xj eine Konstante c, so erhöhen sich auch die Lagemaße um c. Streuungsmaße sind dagegen Maßzahlen, die etwas über die Streuung oder relative Verteilung der Datenwerte aussagen, unabhängig von ihrer absoluten Lage. Vorgegeben sei eine Stichprobe vom Umfang n2 zu einem quantitativen Merkmal X. Die Urliste sei x=( x1 , x2 ,, xn )n .

Info 11.3.15  
 
Die Stichprobenvarianz zur Urliste ist

sx 2   =   1 n-1 · k=1 n( xk - x )2   =   ( x1 - x )2 ++( xn - x )2 n-1 .

Die Stichprobenstandardabweichung ist definiert durch sx =+ sx 2 .


Die Stichprobenvarianz ist ein Streuungsmaß, welches die Variabilität einer Beobachtungsreihe beschreibt. Je kleiner die Varianz, desto „näher“ sind die Datenwerte beieinander. die Varianz sx 2 =0 ist nur möglich, wenn alle Datenwerte gleich sind. Sie steigt mit zunehmendem n typischerweise stark an, die Standardabweichung ist ein besserer Maßstab um die „Weite“ der Verteilung der Datenwerte einzuschätzen. Die beiden Formeln haben ein paar Tücken:
  • Um die Varianz ausrechnen zu können, muss der Mittelwert x schon bekannt sein.

  • Die Tatsache, dass in der Definition von sx 2 durch n-1 und nicht durch das zunächst naheliegende n dividiert wird, hat tieferliegende mathematische Gründe, die erst in den Statistikvorlesungen behandelt werden können.

  • Die Schreibweise sx =+ sx 2 ist ein wenig irreführend, man darf das Quadrat nicht mit der Wurzel kürzen, denn tatsächlich muss man erst sx 2 ausrechnen (und dieser Wert ist nicht als Einzelquadrat definiert), um sx bestimmen zu können.

  • Vorsicht ist bei der Benutzung eines Taschenrechners mit Statistikfunktionen geboten: Die Stichprobenvarianz erhält man mit der Taste s2 , die Taste σ2 liefert dagegen die Summe mit Nenner n statt n-1, das ist nicht die Stichprobenvarianz.



Beispiel 11.3.16  
Die Datenreihe x=(-1,0,1) besitzt den Mittelwert x =0 und die Stichprobenvarianz

sx 2   =   1 n-1 · k=1 n( xk - x )2   =   1 3-1 ·((-1-0 )2 +(0-0 )2 +(1-0 )2 )  =  1.

Hinzufügen von weiteren Nullen zur Datenreihe verändert das Lagemaß x nicht, sehr wohl aber das Streuungsmaß sx 2 , da dann mehr Datenwerte in der Mitte konzentriert sind. Dagegen verändert das Verschieben aller Datenwerte um eine Konstante die Varianz nicht, beispielsweise besitzt auch die Datenreihe (-5,-4,-3) die Varianz 1.


Aufgabe 11.3.17  
Eine Datenreihe (mit einer unbekannten Anzahl n von Werten habe die Maßzahlen x =4, sx 2 =10 und den Median x ~ =3. Angenommen eine zweite Datenreihe erfüllt die Gleichung yk =(-2)· xk für jedes k, wie lauten dann ihre Maßzahlen?  
 
Antwort: Die Maßzahlen sind y = , sy 2 = und y ~ = .  
 
Hinweis: Untersuchen Sie in den Definitionen des Mittelwerts, der Stichprobenvarianz und des Medians, wie sich die Multiplikation aller x-Werte mit (-2) auf den gesamten Term auswirkt.