Za razliku od ocenjivanja parametara osnovnog skupa, kod testiranja statističkih hipoteza u fokusu su tvrdnje o parametrima ili osobinama osnovnog skupa koje se proveravaju na osnovu reprezentativnog uzorka. Dakle, umesto da formiramo interval pouzdanosti oko određene vrednosti parametra osnovnog skupa, testiraćemo različite hipoteze o vrednostima parametara. Na taj način, recimo, možemo da testiramo da li se potrošnja određene grupe potrošača povećala nakon što je organizovana propagandna kampanja usmerena baš na tu grupu potrošača. Takođe, pomoću statističkih hipoteza možemo da proverimo tvrđenje o poboljšanoj produktivnosti rada posle uvođenja novog načina organizacije posla i tako dalje.
Tvrdnja ili pretpostavka o osobini ili parametru koju treba da testiramo naziva se statistička hipoteza, a naučni metod kojim se prihvatljivost te tvrdnje proverava naziva se testiranje statističke hipoteze. Naravno, prilikom testiranja hipoteza kao i pri ocenjivanju parametara postoji mogućnost greške i ta mogućnost ili, preciznije, rizik greške može da se kontroliše odnosno unapred određuje.
Postupak testiranja statističkih hipoteza sprovodi se kroz nekoliko faza:
Iz prve faze postupka testiranja hipoteza je jasno da postoje dve suprotstavljene hipoteze - nulta i alternativna. Nulta hipoteza predstavlja određenu tvrdnju o karakteristikama osnovnog skupa i njegovih parametara koju nastojimo da ispitamo. Alternativna hipoteza obuhvata sve vrednosti koje nisu obuhvaćene nultom hipotezom. Ako, na primer, želimo da testiramo tvrdnju da potrošači troše više od 12 litara sokova određenog proizvođača, nultu i alternativnu hipotezu bismo mogli da postavimo na sledeći način:
H0: μ≥12 H1: μ<12
Statistika testa predstavlja kriterijum testiranja. Kao kriterijum testiranja najčešće se koristi nepristrasna ocena parametra za koji je vezano tvrđenje iz nulte hipoteze. U našim razmatranjima koja će se najčešće odnositi na aritmetičku sredinu osnovnog skupa statistika koju ćemo najviše koristiti je aritmetička sredina uzorka odnosno njene standardizovane vrednosti Z i t.
Nivo značajnosti testa koji se obeležava sa α biramo unapred i to je verovatnoća da ćemo odbaciti tačnu nultu hipotezu. Međutim, potrebno je obratiti pažnju na još jedan rizik greške koji postoji pri testiranju statističkih hipoteza - to je rizik da ćemo prihvatiti netačnu nultu hipotezu. Ishodi statističkog testiranja prikazani su u sledećoj tabeli:
Dakle, prilikom testiranja statističkih hipoteza možemo da napravimo dve vrste grešaka. Greška I vrste se obeležava sa α i predstavlja verovatnoću da ćemo odbaciti tačnu nultu hipotezu. Ova greška se naziva i nivo značajnosti testa. Druga greška ili greška II vrste se obeležava sa β i predsavlja verovatnoću da ćemo prihvatiti (odnosno da nećemo odbaciti) netačnu nultu hipotezu.
Oblasti odbacivanja odnosno neodbacivanja nulte hipoteze zavise od forme njenog formulisanja. Prema formi u kojoj je data razlikujemo sledeće vrste nultih odnosno alternativnih hipoteza:
U prvom slučaju nulta hipoteza je prosta, a alternativna složena. Oblasti odbacivanja nulte hipoteze odnosno kritične oblasti će se nalaziti na krajevima rasporeda koji koristimo za testiranje i to po α/2 na svakom. U drugom slučaju složene su i alternativna i nulta hipoteza, a kritična oblast je na desnom kraju rasporeda koji koristimo za testiranje. Dakle, ako je ocenejena vrednost u uzorku značajno veća od pretpostavljene vrednosti, nultu hipotezu ćemo odbaciti. Treći slučaj je suprotan od drugog - kritična oblast koja zavisi od veličine α nalazi se na levoj strani rasporeda koji koristimo za testiranje, a nulta hipoteza će biti odbačena ako je ocenjena vrednost aritmetičke sredine u uzorka značajno manja od pretpostavljene vrednosti (vrednosti μ0).
Kada je varijansa osnovnog skupa poznata testiranje se vrši na osnovu Z rasporeda - standardizovanog normalnog rasporeda. Dakle, pretpostavke su:
Statistika testa će se određivati na sledeći način:
Gde predstavlja realizovanu vrednost aritmetičke sredine u uzorku, a μ0 hipotetičku vrednost aritmetičke sredine osnovnog skupa (vrednost koju testiramo). Pravilo odlučivanja formulišemo zavisno od oblika nulte odnosno alternativne hipoteze. Razlikovaćemo ponovo tri slučaja:
1. Prvi slučaj bi bio kada su nulta i alternativna hipoteza formulisane na sledeći način:
H0: μ=μ0 H1: μ≠μ0
U pitanju je takozvani dvosmeran test. Na sledećoj slici je prikazano pravilo odlučivanja:
Slika 1: Pravilo odlučivanja za nultu hipotezu H0: μ = μ0
Dakle, H0 treba odbaciti u slučaju da je |z| > zα/2; u suprotnom, H0 ne treba odbaciti.
Ako se, naime, realizovana vrednost aritmetičke sredine uzorka previše razlikuje od pretpostavljene vrednosti (hipotetičke vrednosti μ0) onda nultu hipotezu treba odbaciti. Ako bismo, recimo, testirali tvrdnju da je prosečna mesečna potrošnja kozmetičkih proizvoda domaćinstava 2700 dinara, hipoteze bi bile formulisane na sledeći način:
H0: μ=2700 H1: μ≠2700
2. Nulta i alternativna hipoteza su formulisane na sledeći način:
H0: μ≤μ0 H1: μ>μ0
Ovaj test je jednosmeran test. Pravilo odlučivanja biće:
Slika 2: Pravilo odlučivanja za nultu hipotezu H0: μ≤μ0
Dakle, H0 treba odbaciti u slučaju da je z > zα; u suprotnom, H0 ne treba odbaciti.
Ako se, naime, realizovana vrednost aritmetičke sredine uzorka previše razlikuje od pretpostavljene vrednosti (hipotetičke vrednosti μ0) odnosno ako je realizovana vrednost aritmetičke sredine uzorka previše velika, nultu hipotezu treba odbaciti. Ovakvo pravilo odlučivanja bismo koristili ako bismo testirali tvrdnju da domaćinstva za kozmetiku mesečno troše manje od 2200 dinara:
H0: μ≤2200 H1: μ>2200
3. Nulta i alternativna hipoteza su formulisane na sledeći način:
H0: μ≥μ0 H1: μ<μ0
Ovaj test je kao i prethodni jednosmeran test. Pravilo odlučivanja biće:
Slika 3: Pravilo odlučivanja za nultu hipotezu H0: μ≥μ0
Dakle, H0 treba odbaciti u slučaju da je z < -zα; u suprotnom, H0 ne treba odbaciti.
Ako se, naime, realizovana vrednost aritmetičke sredine uzorka previše razlikuje od pretpostavljene vrednosti (hipotetičke vrednosti μ0) odnosno ako je realizovana vrednost aritmetičke sredine uzorka previše mala, nultu hipotezu treba odbaciti. Ovakvo pravilo odlučivanja bismo koristili ako bismo testirali tvrdnju da domaćinstva za kozmetiku mesečno troše više od 2900 dinara:
H0: μ≥2900 H1: μ<2900
Primer 1: Proizvod ispunjava standarde ako je njegov radni vek duži od godinu dana. Ako je u uzorku od 300 proizvoda prosečno vreme trajanja proizvoda bilo 11 meseci i 23 dana i ako se zna da je varijansa osnovnog skupa proizvoda 2,3 godine, testirati sa rizikom α = 0,05 hipotezu da se proizvođač pridržava standarda.
Rešenje:
Aritmetička sredina uzorka koja iznosi 11 meseci i 23 dana može se predstaviti i kao 0,978 godina. Ako je varijansa 2,3 godine sledi da će standardna devijacija biti koren varijanse odnosno σ = 1,52. Nulta hipoteza će biti da se proizvođač pridržava standarda, a alternativna da se ne pridržava:
H0: μ≥1 H1: μ<1
Dakle, nulta hipoteza je da je vreme trajanja proizvoda jedna godina, a alternativna da je to vreme kraće. Kako nam je poznata varijansa pravilo odlučivanja formulisaćemo na osnovu Z rasporeda (standardizovanog normalnog rasporeda). Pravilo odlučivanja biće da H0 treba odbaciti u slučaju da je z < -z-α. Za α = 0,05 zα ćemo odrediti iz tablica Z rasporeda:
zα = 1,65 → -zα = -1,65
Odatle sledi da ako posle transformacije polaznih podataka u Z raspored dobijena vrednost z bude manja od -1,65 nultu hipotezu treba odbaciti. Izvršićemo transformaciju:
Primer 2:
Testirati hipotezu da je prosečno vreme trajanja proizvoda iz prethodnog primera tačno 11 meseci.
Rešenje:
Trajanje od 11 meseci može se predstaviti kao 0,915 godina. Prema tome, hipoteze možemo postaviti na sledeći način:
H0: μ=0,915 H1: μ≠0,915
Pošto se radi o dvosmernom testu rizik greške će biti raspoređen na krajevima rasporeda. Potrebno je, dakle, odrediti vrednosti zα/2 odnosno -zα/2. Za α = 0,05 iz tablica Z rasporeda sledi:
±zα/2 = ±1,96
Znači da ćemo nultu hipotezu o trajanju proizvoda odbaciti ako njena transformisana vrednost bude manja od -1,96 odnosno veća od 1,96. Transformišimo sada aritmetičku sredinu uzorka:
Testiranje hipoteza o aritmetičkoj sredini osnovnog skupa kada je varijansa osnovnog skupa nepoznata
Kada je varijansa osnovnog skupa nepoznata princip testiranja statističkih hipoteza se ne menja s tim što se pri određivanju pravila odlučivanja ne koristi Z raspored već Studentov t raspored. Kao i kod statističkog ocenjivanja parametara osnovnog skupa kada je varijansa nepoznata standardizovan raspored nije pouzdan za donošenje zaključaka već se umesto njega koristi Studentov t raspored.
U slučaju da je osnovni skup normalno raspoređen veličina uzorka nije bitna, ali ako nije poznat raspored osnovnog skupa onda moramo koristiti veliki uzorak (n > 30) da bismo pri testiranju hipoteza koristili Studentov t raspored. Statistika testa data je na sledeći način:
Zavisno od oblika nulte i alternativne hipoteze biće formulisano i pravilo odlučivanja: