Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

Leptokurt en platykurt : verwarring over spitsheid

0 leuk 0 niet-leuks
Betreft 2.2, pagina 53+54.

.... Het extreemste voorbeeld is een verdeling waarbij alle datapunten dezelfde waarde hebben, spitser kan niet. Omgekeerde is  de 'platste' verdeling de verdeling van het opgooien van een muntje: kans op kop en munt 50%. Geen van beiden komt bij pso + ow voor.

.... Spits = leptokurt, plat = platykurt.

In het beeld dat ik er visueel bij maak, is juist een plaatje waarbij alle waardes hetzelfde zijn de platte: alles even hoog/laag. en omdat er een 50/50 kans is met maar één uitkomst bij het muntje, zie ik die afbeelding juist als spits. In figuur 2.2.8 staat het ook zo: bij plat een platte (nou ja,kan platter, maar niet symmetrisch en zeker minder spits dan de laatste van de rij) en bij spits een soort toren.

Waar maak ik een lees- of denkfout?

Groet en alvast dank, Petra Deij
gevraagd 24 november 2016 in Inleiding Data Analyse (IDA) door 851928612 (1,030 punten)

1 Antwoord

0 leuk 0 niet-leuks

Bij een muntje zijn twee uitkomsten: kop en munt. Dit zijn de twee meetwaarden van deze categorische (nominale) variabele (dit kom je nog tegen in 2.5, dus no stress als je die termen nog niet kunt :-)).

De kans op de ene meetwaarde (kop) is 50%. De kans op de andere meetwaarde (munt) is ook 50%.

Als je dus duizend keer een muntje opgooit, verwacht je 500 keer munt te vinden, en 500 keer kop.

Als je hier een histogram van maakt (wat je niet zou doen; je zou een staafdiagram maken want het is een categorische variabelen - maar goed, je kunt het doen ondanks dat het eigenlijk niet moet), is het dus het platste plaatje dat mogelijk is, gegeven het aantal mogelijke meetwaarden. Elke mogelijke meetwaarde heeft evenveel datapunten (ik gebruik even een staafdiagram als illustratie in plaats van een histogram, maar die zou er hetzelfde uitzien in dit geval):

Als het munt is om mee vals te spelen, met bijvoorbeeld twee keer kop, dan zou je 1000 keer kop krijgen, en 0 keer munt:

Deze verdeling is spitser dan de bovenste verdeling; die is meer afgeplat.

Je denkfout was, denk ik, dat je de lege categorie misschien niet meetelde?

Als alles even hoog of laag is, is er dus een spitse punt bij die waarde (hoog of juist laag, dus), maar is er niets bij de andere mogelijke meetwaarden.

Juist als er maximale variatie is, krijg je een platte verdeling.

PS: voor geinteresseerde studenten, de code om dit te reproduceren in R, met package ggplot2:

### Maak dataframe met uitkomsten van 1000x munt opgooien
muntUitkomsten <-
  data.frame(uitkomst = factor(c(rep('kop', 500),
                                 rep('munt', 500))));

### Teken staafdiagram
ggplot(muntUitkomsten, aes(x=uitkomst)) +
  theme_bw() +       ### Mooier thema
  geom_bar()         ### Staafdiagram 'bestellen'

### Verander muntstuk naar eentje met alleen kop
### (zet laatste 500 uitkomsten op 'kop')
muntUitkomsten$uitkomst[501:1000] <- 'kop';

### Teken nieuwe staafdiagram
ggplot(muntUitkomsten, aes(x=uitkomst)) +
  theme_bw() +                    ### Mooier thema
  geom_bar() +                    ### Staafdiagram
  scale_x_discrete(drop=FALSE);   ### Lege categorie houden

beantwoord 24 november 2016 door Gjalt-Jorn Peters (39,870 punten)
...