Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

Hoe berekenen hoe vaak chi-kwadraat 1 of lager is, tussen 5 en 10 ligt of boven 17.9?

0 leuk 0 niet-leuks
Op blz. 6 bovenaan van de bron non-parametrische data-analyse, staat 'net als bij de bekende verdelingen kunnen we nu ook uitrekenen hoe vaak onze optelsom (chi-kwadraat dus) 1 of lager is (68% van de tijd), hoe vaak de optelsom tussen de 5 en 10 in ligt (2,3% van de tijd), en hoe vaak hij boven de 17.9 ligt (0.0023 procent van de tijd).

In de tekst wordt mijns inziens niet uitgelegd hoe je dit kunt doen. Kunt u, iemand mij dit uitleggen? Ook wat betreft de andere steekproevenverdelingen, zoals t- en F- verdeling en Pearson's r?

De 68% doet mij denken aan de vuistregels van de normaalverdeling (68% vd waarnemingen ligt + of - 1 standaardafwijking, etc., maar hoe de 5 en de 10 en 17,9 in dit plaatje passen zie ik niet meteen.

Alvast bedankt voor uw/ jullie reactie,

Vriendelijke groet,

Mariska
gevraagd 7 augustus 2016 in Kwalitatief Onderzoek (oude cursus Observatie & Interview) door Mariska (150 punten)

1 Antwoord

1 leuk 0 niet-leuks

Dit wordt hier inderdaad niet uitgelegd; dit gaat ver buiten de examenstof. Het betreft een wat intimiderende formule (zie https://en.wikipedia.org/wiki/Chi-squared_distribution#Probability_density_function).

In de praktijk wordt dit natuurlijk gedaan met statistische programma's; deze aanpak wordt uitgelegd in http://oupsy.nl/help/517/hoe-moet-je-de-t-tabel-en-f-tabel-precies-lezen/. Het kan ook met spreadsheet programma's zoals Microsoft Excel of het gratis uitstekende LibreOffice Calc (zie https://help.libreoffice.org/Calc/Statistical_Functions_Part_One#CHIDIST).

Normaal worden deze berekeningen achter de schermen uitgevoerd door je statistische software (e.g. R of SPSS).

In R is het bovendien mogelijk om eenvoudig rechtstreeks deze kansen uit te rekenen:

Verdeling Functie in R Aanroep Voorbeeld Uitkomst
z (normaal) pnorm pnorm(q) pnorm(-1.96); 0.0249979
t (Student) pt pt(q, df) pt(-1.96, 99); 0.02640356
F (Anova) pf pf(q, df1, df2) pf(2, 98, 2); 0.6080694
$\chi^2$ pchisq pchisq(q, df) pchisq(6, 2); 0.9502129

Houd er rekening mee dat je standaard de proportie van de oppervlakte aan de linkerkant of 'onderkant' van 'q' krijgt. Als je bijvoorbeeld een positieve z of t-waarde hebt, of als je de F- of de $\chi^2$-verdeling gebruikt, moet je argument 'lower.tail=FALSE' gebruiken. Bijvoorbeeld:

> pchisq(17.9, 1, lower.tail=FALSE);
[1] 2.328211e-05

Die 'e-05' betekent dat het decimaalteken 5 posities naar links moet. Dan wordt dit dus .0000238211, oftewel .00238211 procent.

(Je ziet hier een verschil door afronding. Dit is geen reden tot zorg om twee redenen. Ten eerste zijn er verschillende geaccepteerde manieren om af te ronden, waar niet altijd hetzelfde uitkomt. Afronding is geen wiskundige regel, het is een subjectieve keuze (zie deze Wikipedia pagina en deze illustratie). Ten tweede zijn statistische uitkomsten altijd onderhevig aan dermate veel meetfout en steekproeftoeval, dat ze weinig nauwkeurig zijn. Kleine verschillen maken dus niet uit.)

beantwoord 9 augustus 2016 door Gjalt-Jorn Peters (41,140 punten)
bewerkt 10 augustus 2016 door Gjalt-Jorn Peters
...