Statistinė reikšmė: apibrėžimas, sąvoka, reikšmingumas, regresijos lygtys ir hipotezių tikrinimas

Turinys:

Statistinė reikšmė: apibrėžimas, sąvoka, reikšmingumas, regresijos lygtys ir hipotezių tikrinimas
Statistinė reikšmė: apibrėžimas, sąvoka, reikšmingumas, regresijos lygtys ir hipotezių tikrinimas

Video: Statistinė reikšmė: apibrėžimas, sąvoka, reikšmingumas, regresijos lygtys ir hipotezių tikrinimas

Video: Statistinė reikšmė: apibrėžimas, sąvoka, reikšmingumas, regresijos lygtys ir hipotezių tikrinimas
Video: Intro to A/B Testing by Adam Wesolowski @GrowthHacking23 Conference 2024, Gegužė
Anonim

Statistika jau seniai buvo neatsiejama gyvenimo dalis. Žmonės su tuo susiduria visur. Remiantis statistika, daromos išvados, kur ir kokios ligos yra dažnos, kas yra paklausesnė konkrečiame regione ar tarp tam tikros gyventojų grupės. Net politinių kandidatų į valdžios organus programų konstravimas remiasi statistiniais duomenimis. Jas pirkdami prekes naudoja ir prekybos tinklai, o gamintojai vadovaujasi šiais duomenimis savo pasiūlymuose.

Statistika vaidina svarbų vaidmenį visuomenės gyvenime ir daro įtaką kiekvienam atskiram jos nariui, net ir smulkmenose. Pavyzdžiui, jei pagal statistiką dauguma žmonių tam tikrame mieste ar regione renkasi tamsias drabužių spalvas, tai vietinėse prekybos vietose rasti ryškiai geltoną lietp altį su gėlių raštu bus nepaprastai sunku. Bet kokius kiekiusar šie duomenys turi tokį poveikį? Pavyzdžiui, kas yra „statistiškai reikšminga“? Ką tiksliai reiškia šis apibrėžimas?

Kas tai?

Statistika kaip mokslas susideda iš įvairių dydžių ir sąvokų derinio. Viena iš jų – „statistinio reikšmingumo“sąvoka. Tai yra kintamųjų reikšmės pavadinimas, kai kitų rodiklių atsiradimo tikimybė yra nereikšminga.

Statistinių rodiklių skaičiavimas
Statistinių rodiklių skaičiavimas

Pavyzdžiui, 9 iš 10 žmonių apsiauna guminius batus ant kojų ryte eidami grybauti rudens miške po lietingos nakties. Tikimybė, kad kažkuriuo momentu 8 iš jų užsidėjo drobinius mokasinus, yra nereikšminga. Taigi, šiame konkrečiame pavyzdyje skaičius 9 yra tai, kas vadinama „statistiniu reikšmingumu“.

Atitinkamai, jei pateiktą praktinį pavyzdį plėtosime toliau, batų parduotuvės iki vasaros sezono pabaigos guminius batus perka didesniais kiekiais nei kitu metų laiku. Taigi statistinės vertės dydis turi įtakos įprastam gyvenimui.

Žinoma, atliekant sudėtingus skaičiavimus, tarkime, prognozuojant virusų plitimą, atsižvelgiama į daugybę kintamųjų. Tačiau pati reikšmingo statistinių duomenų rodiklio nustatymo esmė yra panaši, nepaisant skaičiavimų sudėtingumo ir kintamųjų reikšmių skaičiaus.

Kaip tai apskaičiuojama?

Naudojama apskaičiuojant lygties „statistinio reikšmingumo“rodiklio reikšmę. Tai yra, galima teigti, kad šiuo atveju viską sprendžia matematika. Paprasčiausias skaičiavimo variantas yra matematinių operacijų grandinė, kurioje dalyvauja šie parametrai:

  • dviejų tipų rezultatai, gauti iš apklausų arba tiriant objektyvius duomenis, pvz., pirkimų kiekį, žymimus a ir b;
  • abiejų grupių imties dydžio indikatorius – n;
  • bendros imties dalies vertė - p;
  • standartinė klaida – SE.

Kitas žingsnis yra nustatyti bendrą testo rezultatą – t, jo reikšmė lyginama su skaičiumi 1,96. 1,96 yra vidutinė vertė, perteikianti 95 % diapazoną pagal Stjudento t pasiskirstymo funkciją.

Paprasto skaičiavimo formulė
Paprasto skaičiavimo formulė

Dažnai kyla klausimas, kuo skiriasi n ir p reikšmės. Šį niuansą lengva paaiškinti pavyzdžiu. Tarkime, apskaičiuojama statistinė vyrų ir moterų lojalumo bet kuriai prekei ar prekės ženklui reikšmingumas.

Šiuo atveju po raidžių bus rašoma:

  • n - respondentų skaičius;
  • p – patenkintų gaminiu skaičius.

Šiuo atveju apklaustų moterų skaičius bus nurodytas kaip n1. Atitinkamai, vyrai – n2. Tą pačią reikšmę turės simbolio p.skaičiai „1“ir „2“

Testo balo palyginimas su Studento skaičiuoklių vidurkiu tampa vadinamuoju „statistiniu reikšmingumu“.

Ką reiškia patvirtinimas?

Bet kurio matematinio skaičiavimo rezultatus visada galima patikrinti, to vaikai mokomi pradinėje mokykloje. Logiška manytikad kadangi statistika nustatoma naudojant skaičiavimų grandinę, tada jie yra tikrinami.

Tačiau statistinio reikšmingumo tikrinimas nėra tik matematika. Statistika susijusi su daugybe kintamųjų ir įvairių tikimybių, kurias toli gražu ne visada galima apskaičiuoti. Tai yra, jei grįšime prie guminių batų pavyzdžio straipsnio pradžioje, tai logišką statistinių duomenų konstravimą, kuriais remsis prekių parduotuvėms pirkėjai, gali sujaukti rudeniui nebūdingi sausi ir karšti orai.. Dėl šio reiškinio sumažės guminius batus perkančių žmonių, o prekybos centrai patirs nuostolių. Žinoma, matematinė formulė negali numatyti oro anomalijos. Ši akimirka vadinama „klaida“.

Statistinių duomenų vizualizavimo įrankiai
Statistinių duomenų vizualizavimo įrankiai

Tai tik tokių klaidų tikimybė ir atsižvelgiama į apskaičiuoto reikšmingumo lygio patikrinimą. Jame atsižvelgiama ir į apskaičiuotus rodiklius, ir į priimtus reikšmingumo lygius, taip pat į kiekius, paprastai vadinamus hipotezėmis.

Koks yra reikšmingumo lygis?

Sąvoka „lygis“įtraukta į pagrindinius statistinio reikšmingumo kriterijus. Jis naudojamas taikomojoje ir praktinėje statistikoje. Tai tam tikra vertė, kurioje atsižvelgiama į galimų nukrypimų arba klaidų tikimybę.

Lygis pagrįstas paruoštų mėginių skirtumų nustatymu, leidžia nustatyti jų reikšmingumą arba, atvirkščiai, atsitiktinumą. Ši sąvoka turi ne tik skaitmenines reikšmes, bet ir savitas jų interpretacijas. Jie aiškinakaip reikia suprasti reikšmę, o pats lygis nustatomas lyginant rezultatą su vidutiniu indeksu, tai atskleidžia skirtumų patikimumo laipsnį.

Diskusija apie statistiką
Diskusija apie statistiką

Taigi, lygmens sąvoką galime įsivaizduoti paprastai – tai priimtinos, tikėtinos klaidos arba klaidos, padarytos iš gautų statistinių duomenų išvadose, rodiklis.

Kokie reikšmingumo lygiai naudojami?

Klaidų tikimybės koeficientų statistinis reikšmingumas praktikoje grindžiamas trimis pagrindiniais lygiais.

Pirmasis lygis yra riba, kurią pasiekus vertė yra 5 %. Tai yra, paklaidos tikimybė neviršija 5% reikšmingumo lygio. Tai reiškia, kad pasitikėjimas išvadų, padarytų remiantis statistinių tyrimų duomenimis, nepriekaištingumu ir neklystamumu yra 95%.

Antras lygis yra 1 % riba. Atitinkamai, šis skaičius reiškia, kad galima vadovautis duomenimis, gautais atliekant statistinius skaičiavimus su 99 % patikimumu.

Trečias lygis – 0,1 proc. Naudojant šią vertę, klaidos tikimybė yra lygi procento daliai, tai yra, klaidos praktiškai pašalinamos.

Kas yra statistikos hipotezė?

Klaidos kaip sąvoka skirstomos į dvi sritis, susijusias su nulinės hipotezės priėmimu arba atmetimu. Hipotezė – tai sąvoka, už kurios pagal apibrėžimą slepiasi apklausos rezultatų rinkinys, kiti duomenys ar teiginiai. Tai yra kažko, kas susiję su statistinės apskaitos dalyku, tikimybių pasiskirstymo aprašymas.

statistinis regresijos reikšmingumas
statistinis regresijos reikšmingumas

Paprastuose skaičiavimuose yra dvi hipotezės – nulis ir alternatyvioji. Skirtumas tarp jų yra tas, kad nulinė hipotezė grindžiama idėja, kad tarp imčių, dalyvaujančių nustatant statistinį reikšmingumą, nėra esminių skirtumų, o alternatyvioji yra visiškai priešinga. Tai yra, alternatyvi hipotezė grindžiama reikšmingu šių pavyzdžių skirtumu.

Kokios klaidos?

Klaidos kaip statistikos sąvoka yra tiesiogiai proporcingi tam, ar viena ar kita hipotezė pripažįstama teisinga. Juos galima suskirstyti į dvi kryptis arba tipus:

  • pirmasis tipas atsirado dėl to, kad buvo priimta nulinė hipotezė, kuri pasirodė esanti neteisinga;
  • sekundė – atsirado dėl alternatyvos laikymosi.
Statistinių grafikų peržiūra
Statistinių grafikų peržiūra

Pirmasis klaidų tipas vadinamas klaidingai teigiama ir yra gana dažnas visose srityse, kuriose naudojama statistika. Atitinkamai, antrojo tipo klaida vadinama klaidinga neigiama.

Kodėl mums reikia regresijos statistikoje?

Statistinė regresijos reikšmė ta, kad jos pagalba galima nustatyti, kiek duomenų pagrindu apskaičiuotas įvairių priklausomybių modelis atitinka tikrovę; leidžia nustatyti apskaitai ir išvadoms reikalingų veiksnių pakankamumą ar trūkumą.

Regresijos reikšmė nustatoma lyginant rezultatus su Fisher lentelėse nurodytais duomenimis. Arba naudojant dispersijos analizę. Regresijos rodikliai svarbūs, kaisudėtingi statistiniai tyrimai ir skaičiavimai, apimantys daugybę kintamųjų, atsitiktinių duomenų ir galimų pokyčių.

Rekomenduojamas: