Histogram - czym jest i jak go zbudować?
Histogram jest narzędziem statystycznym, które przedstawia rozkład częstości dla zmiennej ciągłej. Histogram jest podobny do wykresu słupkowego w danym przedziale, ale jego oś X przedstawia zakres wartości zmiennej ( histogram zmiennej ), a oś Y przedstawia liczbę lub procent wystąpień dla każdego zakresu wartości.
W przemyśle histogram jest często używany do analizy danych, dotyczących procesów produkcyjnych lub jakości produktów. Może być używany do określenia:
- jakie wartości są najczęstsze dla danej zmiennej,
- jakie wartości są najrzadsze,
- jakie wartości są poza normą.
Histogram pokazuje wartości danych w poszczególnych przedziałach.
Jednocześnie histogram pozwala na identyfikację tendencji i rozkładu danych, a także pozwala na określenie jakie są wartości graniczne dla danej zmiennej. Wizualizuje kształt rozkładu. Może być również używany do określenia, czy proces jest stabilny i kontrolowany, czy też jest niestabilny i niekontrolowany dla dużej liczby danych. Prezentowany przez histogram rozkład danych, ma za zadanie pomóc w podjęciu decyzji inżynierom, analitykom, naukowcom, czy dany przypadek określonej analizy mieści się w założonych normatywach.
Interpretacja histogramu
Histogram jest często używany w połączeniu z innymi narzędziami jakościowymi wykorzystującymi określony zakres danych do tworzenia wykresu, takimi jak Diagram Pareto, Diagram Kontrolny, Diagram Ishikawy, i inne. Wartości powyżej wartości granicznej, często są automatyczne interpretowane jako odchylenia.
Do czego używamy histogramu?
- jaka jest dominanta? (przedział, który jest najliczniejszy)
- jaki rozkład obserwujemy?
- czy w naszej obserwacji występują przedziały, których wyniki odstają od reszty?
Wady i zalety histogramu
Zalety histogramu:
- Wykres histogramu pozwala na szybkie i łatwe zrozumienie rozkładu danych,
- Rozkład danych histogramu pomaga w identyfikowaniu tendencji występujących w analizowanym przykładzie
- Umożliwia określenie wartości granicznych dla danej zmiennej,
- Słupki histogramu pozwalają na określenie, czy proces jest stabilny i kontrolowany, czy też jest niestabilny i niekontrolowany,
- Wykres statystyczny jest często używany w połączeniu z innymi narzędziami jakościowymi.
Wady histogramu:
- Dane wejściowe zawarte w histogramach nie są odpowiednie do przedstawiania danych kategorycznych,
- Tworzenie wykresu nie nadaje się do prezentowania danych z dużą liczbą wartości odstających (outliers),
- Określona liczba przedziałów histogramu nie pozwala na precyzyjne określenie średniej, mediany ani odchylenia standardowego.
Histogram należy głównie wykorzystywać do analiz danych dotyczących procesów produkcyjnych lub jakości produktów. Może być używany do określenia, jakie wartości są najczęstsze dla danej zmiennej, jakie wartości są najrzadsze, oraz jakie wartości są poza normą. Zawarte w histogramach dane są często wykorzystywane w przemyśle, medycynie, naukach przyrodniczych, marketingu, itp.
Różnica pomiędzy histogramem a wykresem słupkowym
- Histogram – rozkład zmiennych ciągłych
- Wykres słupkowy – zmienne kategoryczne
Jak zbudować histogram?
- Zbierz ilości obserwacji
- Posegreguj obserwacje
- Określ liczbę przedziałów
- k = √n , gdzie n – ilość obserwacji
- Ustal szerokości przedziałów
- h – długość każdego przedziału
- h = (max-min) / k, gdzie max i min to wartość największa i najmniejsza
- Wyznacz przedziały
- [ Xp;Xk ), gdzie Xp – początek przedziału, Xk – koniec przedziału
Jeśli zainteresował Cię temat opisujący narzędzie jakim jest histogram, zapraszamy Cię do przeczytania pozostałych artykułów, na których dowiesz się m.in. czym jest SPC, do czego służy Diagram Relacji.
Zapraszamy do lektury i poszerzania wiedzy.
Jesteśmy do Twojej dyspozycji. Zapraszamy do kontaktu.