Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

formule bij asymmetrie van de regressiecoëfficient

0 leuk 0 niet-leuks

Beste Gjalt-Jorn

Bij het herhalen van de leerstof blijk ik toch nog niet goed te zien aan de formules hieronder dat de hoeveelheid ruis nog hetzelfde is, dat deze aan de andere variabele wordt toegekend en daarom anders is opgedeeld tussen de deelnemers. Ik zie het duidelijk in de scatterplots en ik versta het 'concept' hier wel. Vlak onder de formules ​​ryx. SDy/SDx  en ​​ryx. SDx/SDy staat er echter dat de vermenigvuldiging van de correlatie met het quotiënt van de standaarddeviaties op te vatten is als een vertaling van de correlatie naar de schalen van de twee variabelen. Zou je mij dit laatste kunnen uitleggen zodat ik de link kan leggen met dat verschil in ruis? Ik vermoed dat ik iets over het hoofd zie...

Alvast mijn dank

Kristien

gevraagd 10 januari in Inleiding Data Analyse (IDA) door Kristien Bynens (1,050 punten)

1 Antwoord

0 leuk 0 niet-leuks

Laten we de formules er nog even bij pakken:

$$\hat{\beta}_{\text{y voorspellen uit x}} = r_{xy} \frac{sd_y}{sd_x}$$

En andersom:

$$\hat{\beta}_{\text{x voorspellen uit y}} = r_{xy} \frac{sd_x}{sd_y}$$

Ok, laten we nu eerst een situatie nemen waarin $x$ en $y$ beiden zijn gestandaardiseerd. In dat geval (omdat we enkelvoudige regressie uitvoeren) geldt dat de correlatiecoëfficiënten gelijk zijn aan de regressie-coëfficiënten.

Stel dat de correlatie tussen deze twee variabelen gelijk is aan .5. Omdat beide variabelen zijn gestandaardiseerd geldt dat $\hat{\beta}_{\text{y voorspellen uit x}}=.5$ en $\hat{\beta}_{\text{x voorspellen uit y}}=.5$.

Stel je nu voor dat ze niet zijn gestandaardiseerd. De standaarddeviatie van $x$ is 10, en die van $y$ is 2.

Dan geldt:

$$\hat{\beta}_{\text{y voorspellen uit x}} = r_{xy} \frac{sd_y}{sd_x} = .5 \frac{2}{10} = .5 \times .2 = .1 $$

En andersom:

$$\hat{\beta}_{\text{x voorspellen uit y}} = r_{xy} \frac{sd_x}{sd_y} = .5 \frac{10}{2} = .5 \times 5 = 2.5$$

Oftewel, als $x$ met $1$ toeneemt, neemt $y$ met $.1$ toe. De standaarddeviatie van $x$ is heel groot ($10$), dus de schaal waar $x$ op is gemeten is heel breed. Een toename van $1$ in $x$ is dus een relatief kleine toename: maar een tiende van de standaarddeviatie.

Als $y$ met $1$ toeneemt, neemt $x$ met $2.5$ toe. De schaalverdeling van $y$ is immers een stuk smaller: een toename van $1$ is al een halve standaarddeviatie!

De ruis in een variabele 'vindt plaats' in de schaal van de variabele. Als je de schaalverdelingen gelijk trekt (door standaardisering), dan is het effect van ruis relatief even groot per variabele: een 'ruis' van $2$ is dan voor beide variabelen evenveel. Echter, voor standaardisatie geldt dat een 'ruis' van $2$ veel meer impact heeft voor $y$ (een hele standaarddeviatie!) dan voor $x$ (maar een vijfde standaarddeviatie!).

beantwoord 11 januari door Gjalt-Jorn Peters (39,910 punten)
...