11.1.1 Einführung



Bei statistischen Untersuchungen (Erhebungen) werden an geeignet ausgewählten Untersuchungseinheiten (Beobachtungseinheiten, Versuchseinheiten) jeweils die Werte eines oder mehrerer Merkmale festgestellt. Dabei ist ein Merkmal eine zu untersuchende Größe der Beobachtungseinheit. Begriffe und Sprechweisen:
  • Die Untersuchungseinheit (auch: Beobachtungseinheit oder Merkmalträger) ist die kleinste Einheit, an der Beobachtungen durchgeführt werden.

  • Das Merkmal ist die zu untersuchende Größe der Untersuchungseinheit. Merkmale werden meist mit großen lateinischen Buchstaben ( X,Y,Z,) bezeichnet.

  • Merkmalsausprägungen oder Merkmalswerte sind die Werte, die von Merkmalen angenommen werden können. Merkmalswerte werden meist mit kleinen, lateinischen Buchstaben ( a,b,,x,y,z, a1 , a2 ,) bezeichnet.

  • Die Menge der Untersuchungseinheiten, über die hinsichtlich eines interessierenden Merkmals eine Aussage gemacht werden soll, heißt Grundgesamtheit oder auch Population. Sie ist die Menge aller denkbaren Untersuchungseinheiten einer Untersuchung.

  • Eine Stichprobe ist eine „zufällig gewonnene“ endliche Teilmenge aus einer bestimmten, interessierenden Grundgesamtheit. Hat diese Teilmenge n Elemente, so spricht man von einer „Stichprobe vom Umfang n“.

  • Daten sind die beobachteten Werte (Ausprägungen) eines oder mehrerer Merkmale einer Stichprobe von Untersuchungseinheiten einer bestimmten Grundgesamtheit.

  • Die Urliste ist das Protokoll, auf dem die Daten einer Untersuchung in der beobachteten Reihenfolge stehen. Die Urliste ist also ein n-Tupel (bzw. Vektor, hier meist als Zeile statt Spalte geschrieben):

    x  =  ( x1 ,, xn ).

    aus Daten. Oft nennt man auch dieses n-Tupel eine „Stichprobe vom Umfang n“.



Beispiel 11.1.1  
Bei einer Tagesproduktion von Werkstücken werden n=20 Proben zu je 15 Teilen entnommen und jeweils die Anzahl defekter Teile festgestellt. Dabei sei xi die Anzahl der defekten Teile in der i-ten Probe, i=1,,20. Die Urliste (Stichprobe vom Umfang n=20) sei

x  =  (0,4,2,1,1,0,0,2,3,1,0,5,3,1,1,2,0,0,1,0).

In der zweiten Probe wurden z.B. x2 =4 defekte Teile gefunden. Die Grundgesamtheit in diesem Beispiel wäre also die Menge aller 15-elementigen Teilmengen der Tagesproduktion. Das interessierende Merkmal ist

X  =   Anzahl der defekten Werkstücke in einer Probe mit 15 Elementen .



Info 11.1.2  
 
Die bei einer statistischen Untersuchung beobachtbaren Größen heißen Merkmale. Werte, die von Merkmalen angenommen werden können, heißen Merkmalsausprägungen oder Merkmalswerte.


Bei Merkmalen wird grob zwischen qualitativen (artmäßig erfassbaren) und quantitativen (in natürlicher Weise zahlenmäßig erfassbaren) Merkmalen unterschieden:
  • Qualitative Merkmale:
    • Nominale Merkmale: Die Klassifizierung der Merkmalsausprägungen erfolgt nach rein qualitativen Gesichtspunkten. Beispiele: Hautfarbe, Nationalität, Blutgruppe.

    • Ordinale Merkmale: Eine natürliche Rangfolge der Merkmalsausprägungen ist vorhanden, man kann die Werte anordnen bzw. sortieren. Beispiele: Schulnote, Dienstgrade, Nachnamen.



  • Quantitative Merkmale:
    • Diskrete Merkmale: Die Merkmalsausprägungen sind isolierte Zahlwerte. Beispiele: Anzahlen, Jahreszahlen, Alter in Jahren.

    • Stetige Merkmale: Die Merkmalsausprägungen können (zumindestens prinzipiell) jeden Wert in einem Intervall annehmen. Beispiele: Größe, Gewicht, Länge.





Der Übergang zwischen stetigen und diskreten Merkmalen ist durch Rundungsmöglichkeiten zum Teil fließend.