Histogram - czym jest i jak go zbudować?
Histogram jest graficznym sposobem ukazania zestawienia danych. Histogram to wykres, który zbudowany jest z słupków umieszczonych na osi współrzędnych.
Ich wysokość opisuje liczebność danej cechy w populacji lub próbie, a podstawa wyznacza przedział klasowy.
Do czego używamy histogramu?
Używając histogramu możemy analizować zbiorowość danego zestawienia danych. Histogramu możemy użyć, gdy szukamy odpowiedzi na przykładowe pytania:
– jaka jest dominanta? (przedział, który jest najliczniejszy)
– jaki rozkład obserwujemy?
– czy w naszej obserwacji występują przedziały, których wyniki odstają od reszty?
Histogram ułatwia nam analizowanie częstotliwości występowania danego zjawiska. Graficzne przedstawienie danych pomaga nam w przewidywaniu dalszych zmienności danej grupy. Pozwala to na prognozowanie zmiennych, ostrzega nas przed błędami lub przyszłymi trudnościami. Wykorzystanie histogramu pozwala także na łatwiejsze zrozumienie danego zjawiska.
Różnica pomiędzy histogramem a wykresem słupkowym
Różnią pomiędzy histogramem, a wykresem słupkowym jest rodzaj prezentowanych danych:
Histogram – rozkład zmiennych ciągłych
Wykres słupkowy – zmienne kategoryczne
Dlatego podczas tworzenia histogramu powstałe słupki muszą się ze sobą łączyć, gdyż mamy wtedy pewność że nie pominęliśmy żadnych danych z przedziału.
W przypadku wykresu słupkowego należy robić przerwy między słupkami ze względu na rodzaj zmiennych.
Jak zbudować histogram?
- Zbierz ilości obserwacji
- Posegreguj obserwacje
- Określ liczbę przedziałów
k = √n , gdzie n – ilość obserwacji - Ustal szerokości przedziałów
h – długość każdego przedziału
h = (max-min) / k, gdzie max i min to wartość największa i najmniejsza - Wyznacz przedziały
[ Xp;Xk ), gdzie Xp – początek przedziału, Xk – koniec przedziału
Należy pamiętać, że ostatni przedział musi być prawostronnie domknięty, aby mieć informacje o wartości największej.
Ostatnim krokiem jest narysowanie histogramu.