Miary rozproszenia mówią, czy dane są skupione blisko siebie, czy mocno rozrzucone. Sama średnia nie wystarczy — dwa zbiory mogą mieć tę samą średnią, ale zupełnie inne rozproszenie.
Bo średnia potrafi ukryć bardzo ważną informację: czy wyniki są podobne, czy bardzo różne.
Dwie klasy mogą mieć tę samą średnią z testu, np. 70%, ale w jednej prawie wszyscy napisali blisko 70%, a w drugiej połowa napisała bardzo słabo i połowa bardzo dobrze. Średnia jest taka sama, ale sytuacja jest zupełnie inna.
Miary rozproszenia pokazują właśnie ten rozrzut.
Słownictwo
Rozproszenie mówi, jak bardzo dane oddalają się od typowej wartości, najczęściej od średniej.
Najważniejsze miary:
| Miara | Co mówi? | Prosty sens |
|---|---|---|
| Rozstęp | Różnica między maksimum i minimum | Jak szeroki jest cały zakres danych |
| Odchylenie od średniej | O ile dana wartość różni się od średniej | Czy wynik jest powyżej czy poniżej typowego poziomu |
| Wariancja | Średnia z kwadratów odchyleń od średniej | Techniczna miara rozrzutu |
| Odchylenie standardowe | Pierwiastek z wariancji | Typowa odległość danych od średniej |
| Rozstęp międzykwartylowy | Q3−Q1 | Rozrzut środkowych 50% danych |
Najbardziej „ludzką” interpretację ma odchylenie standardowe: mówi, o ile przeciętnie wyniki odbiegają od średniej.
Dla rozstępu: 1. Znajdź największą wartość.
Przykład
Dane: 2, 4, 4, 6, 9 Pytanie: oblicz rozstęp i zinterpretuj rozproszenie względem średniej. Krok 1: rozstęp.
- Uczeń porównuje tylko średnie i ignoruje rozproszenie. - Uczeń przy rozstępie odejmuje minimum od średniej zamiast minimum od maksimum.
Przykład
Na maturze zadanie często nie wymaga ciężkich rachunków, tylko porównania dwóch zbiorów danych. Typowe polecenia: - oblicz rozstęp, - wskaż zbiór o większym rozproszeniu, - porównaj dwie klasy o tej samej średniej, - zinterpretuj odchyl…
Rozproszenie danych
Informacja o tym, jak bardzo dane różnią się od siebie lub od średniej.