Of je nu studeert voor je tentamen Statistiek of gewoon wat extra hulp nodig hebt bij je huiswerk, oefenopgaven geven je de extra hulp die je nodig hebt. Statistische analysemethoden en - modellering vaak direct in verband gebracht met gegevensanalyse. Het is belangrijk om eerst de rekenkunde te begrijpen die aan de basis ligt van deze analysemethoden.

Hoewel de meeste softwarepakketten, zoals SPSS en Stata, weinig tot geen rekenwerk van de statisticus vergen, is het belangrijk te weten hoe deze software werkt.

Aan de basis van de meeste van je statistische analyses ligt een tak van de wiskunde die Bayesiaanse statistiek wordt genoemd. Het is niet waarschijnlijk dat je na je eerste inleidende cursus statistiek nog te maken krijgt met de Stelling van Bayes, maar het is wel belangrijk dat je de zogenaamde Bayesiaanse gevolgtrekking altijd in je achterhoofd houdt.

De Stelling van Bayes probeert de waarschijnlijkheid te beschrijven dat een gebeurtenis plaatsvindt, met eerdere informatie over diezelfde gebeurtenis, ook wel de zogenaamde a-priori-kans genoemd. Als je bijvoorbeeld de waarschijnlijkheid wilt berekenen dat de ijscoman in je buurt op komt dagen, omdat het een zonnige dag is, dan kun je eerdere, empirische gegevens gebruiken om in te schatten hoe waarschijnlijk dat is.

Grafiek en rekenmachine
Op basis van eerder onderzoek kun je de waarschijnlijk van een gebeurtenis voorspellen | Bron: Pexels

De definitie van Bayesiaanse inferentie is dus het afleiden van de waarschijnlijkheid van een gebeurtenis op basis van een reeks gegevens. Dit is de basis van veel statistische problemen en tests die je zult tegenkomen. Het is belangrijk om het te onthouden omdat je het vaak niet expliciet zult zien. Deze blog biedt drie secties met voorbeelden die van deze theorie uitgaan.

De beste beschikbare leraren Statistiek
Marijn
4,9
4,9 (33 beoordelingen)
Marijn
€39
/u
Gift icon
1e les gratis!
Mehdi zamani
4,9
4,9 (22 beoordelingen)
Mehdi zamani
€35
/u
Gift icon
1e les gratis!
Sanne
4,8
4,8 (24 beoordelingen)
Sanne
€39
/u
Gift icon
1e les gratis!
Thomas
5
5 (10 beoordelingen)
Thomas
€30
/u
Gift icon
1e les gratis!
Amir
4,9
4,9 (29 beoordelingen)
Amir
€60
/u
Gift icon
1e les gratis!
Jonas
5
5 (10 beoordelingen)
Jonas
€25
/u
Gift icon
1e les gratis!
Tom
5
5 (78 beoordelingen)
Tom
€50
/u
Gift icon
1e les gratis!
Rob
5
5 (19 beoordelingen)
Rob
€20
/u
Gift icon
1e les gratis!
Marijn
4,9
4,9 (33 beoordelingen)
Marijn
€39
/u
Gift icon
1e les gratis!
Mehdi zamani
4,9
4,9 (22 beoordelingen)
Mehdi zamani
€35
/u
Gift icon
1e les gratis!
Sanne
4,8
4,8 (24 beoordelingen)
Sanne
€39
/u
Gift icon
1e les gratis!
Thomas
5
5 (10 beoordelingen)
Thomas
€30
/u
Gift icon
1e les gratis!
Amir
4,9
4,9 (29 beoordelingen)
Amir
€60
/u
Gift icon
1e les gratis!
Jonas
5
5 (10 beoordelingen)
Jonas
€25
/u
Gift icon
1e les gratis!
Tom
5
5 (78 beoordelingen)
Tom
€50
/u
Gift icon
1e les gratis!
Rob
5
5 (19 beoordelingen)
Rob
€20
/u
Gift icon
1e les gratis!
Daar gaan we

Statistische Basisberekeningen

Om de oefenopgaven in dit deel te kunnen maken, is het belangrijk dat je de elementaire statistiek begrijpt. Waarschijnlijk heb je een inleiding in kansberekening gevolgd. Je begrijpt het belang van voorwaardelijke kansberekening bij het maken van zelfs de meest eenvoudige exploratieve gegevensanalyse.

Statistiek en kansberekening gaan hand in hand, en daarom is het belangrijk dat je ze begrijpt voordat je onderstaande problemen probeert op te lossen. De definities en vaardigheden die je moet begrijpen om de onderstaande problemen op te lossen zijn onder andere:

  • Centrale Limiet Theorie;
  • Centrale tendens;
  • Standaard normale verdeling;
  • Gemiddelde, mediaan en modus van de steekproef.

Vraag Een: Construeer een Boxplot

Zowel de boxplot als de stam- en bladdiagrammen zijn verschillende manieren om de verdeling van een bepaalde variabele in je gegevens weer te geven. Het verschil is dat een boxplot weergeeft hoe je gegevens verdeeld zijn op basis van een normale verdeling. Om de boxplot te kunnen maken, is het belangrijk te begrijpen wat elk punt op de plot voorstelt.

De mediaan is het midden, waarbij 1, 2, 3 en 4 de vier verschillende kwartielen van je gegevens voorstellen. Dat wil zeggen, als we het eerste kwartiel nemen, betekent dit dat 25% van je gegevens in dit gebied liggen. Bij kwartiel 3 betekent dit dat 75% van je gegevens op dat punt en daaronder liggen. Kwartiel 0 staat voor het minimum en kwartiel 4 voor het maximum. Dit wordt dan vergeleken met een normale verdeling:

Als we naar het bovenstaande plaatje kijken, zien we dat ongeveer 50% van onze gegevens tussen Q1 en Q3 zal vallen. Onder Q1 of boven Q3, ligt slechts ongeveer 25% van onze gegevens. Voorbij het minimum en maximum worden deze gegevenspunten als uitbijters beschouwd. Een uitbijter is een gegevenspunt dat niet normaal is in verhouding tot de steekproefpopulatie.

Lachende persoon met bril en witte jas
Statistisch onderzoek is heel belangrijk, ook in de medische wereld | Bron: Pexels
De beste beschikbare leraren Statistiek
Marijn
4,9
4,9 (33 beoordelingen)
Marijn
€39
/u
Gift icon
1e les gratis!
Mehdi zamani
4,9
4,9 (22 beoordelingen)
Mehdi zamani
€35
/u
Gift icon
1e les gratis!
Sanne
4,8
4,8 (24 beoordelingen)
Sanne
€39
/u
Gift icon
1e les gratis!
Thomas
5
5 (10 beoordelingen)
Thomas
€30
/u
Gift icon
1e les gratis!
Amir
4,9
4,9 (29 beoordelingen)
Amir
€60
/u
Gift icon
1e les gratis!
Jonas
5
5 (10 beoordelingen)
Jonas
€25
/u
Gift icon
1e les gratis!
Tom
5
5 (78 beoordelingen)
Tom
€50
/u
Gift icon
1e les gratis!
Rob
5
5 (19 beoordelingen)
Rob
€20
/u
Gift icon
1e les gratis!
Marijn
4,9
4,9 (33 beoordelingen)
Marijn
€39
/u
Gift icon
1e les gratis!
Mehdi zamani
4,9
4,9 (22 beoordelingen)
Mehdi zamani
€35
/u
Gift icon
1e les gratis!
Sanne
4,8
4,8 (24 beoordelingen)
Sanne
€39
/u
Gift icon
1e les gratis!
Thomas
5
5 (10 beoordelingen)
Thomas
€30
/u
Gift icon
1e les gratis!
Amir
4,9
4,9 (29 beoordelingen)
Amir
€60
/u
Gift icon
1e les gratis!
Jonas
5
5 (10 beoordelingen)
Jonas
€25
/u
Gift icon
1e les gratis!
Tom
5
5 (78 beoordelingen)
Tom
€50
/u
Gift icon
1e les gratis!
Rob
5
5 (19 beoordelingen)
Rob
€20
/u
Gift icon
1e les gratis!
Daar gaan we

Vraag Twee: Hoe Bereken en Interpreteer je de Correlatiecoëfficiënt?

Het is belangrijk om te begrijpen hoe bepaalde variabelen binnen je verzamelde gegevens zich tot elkaar verhouden. Dit is vooral nuttig omdat je, ongeacht de soorten gegevens die je zult tegenkomen, je dan hulpmiddelen kunt toepassen, ongeacht de soorten statistische concepten die je gebruikt. Een belangrijke tabel die je zult tegenkomen is een correlatie- en covariantietabel tussen de variabelen in je dataset.

Daar waar de definitie van correlatie het verband tussen twee variabelen inhoudt, verwijst de covariantie naar hoe deze twee variabelen samen variëren. Het doel van deze getallen is te kunnen meten hoe nauw elke variabele zich tot elkaar verhoudt.

Als je bijvoorbeeld een dataset hebt met betrekking tot gezonde kinderen op de middelbare school, zullen lengte en gewicht hoogstwaarschijnlijk een hoge correlatie hebben. Aan de andere kant zullen variabelen als lengte en favoriete kleur waarschijnlijk geen hoge correlatie hebben. Bij regressiemodellen is de berekening en interpretatie van het correlatiecoëfficiënt uiterst belangrijk.

De getallen in de tabel geven de correlatiecoëfficiënt weer, die aangeeft hoe sterk het verband is tussen de variabelen in de tabel. Om het correlatiecoëfficiënt te berekenen, heb je alleen de standaardafwijking van de steekproef en de covariantie van de steekproef nodig.

De standaardafwijking is de maatstaf voor de spreiding van je gegevens rond het gemiddelde. Deze geeft aan hoe ver je gegevens rond het gemiddelde liggen, niet gebaseerd op je steekproefgegevens maar op de werkelijke populatie.

De covariantie daarentegen is de maatstaf van hoe twee variabelen samen variëren. Dit is sterk afhankelijk van je steekproefgegevens. De covariantie moet niet worden verward met de variantie, die alleen meet hoe één variabele varieert binnen een gegevensreeks.

De interpretatie van de correlatiecoëfficiënt volgt drie basisregels:

  • De eerste is dat de getallen langs de diagonaal altijd één moeten zijn. De diagonaal vertegenwoordigt de correlatie tussen de variabele en zichzelf, die altijd 1 moet zijn, of 100%. Bijvoorbeeld, wanneer de correlatie tussen de variabele favoriete kleur en dezelfde variabele 100% is;
  • De tweede regel is dat een correlatie van meer dan 50% moet worden beschouwd als een hoge correlatie. Een correlatie van minder dan 50% moet worden beschouwd als een zwakke correlatie. In dit voorbeeld, terwijl favoriete kleur slechts 4% correlatie heeft met gewicht, hebben gewicht en lengte een sterke correlatie van bijna 90%;
  • De derde regel is, hoewel correlaties onder 50% normaal als zwak worden beschouwd, betekent dit niet dat ze niet interessant kunnen zijn. In dit voorbeeld heeft favoriete kleur een correlatie van 57% met geslacht. Hoewel dit geen al te sterke correlatie is ten opzichte van de tabel, wijst het wel in de richting van verschillen in geslacht die de moeite waard kunnen zijn om verder te onderzoeken.
Persoon kijkt naar beeldscherm
Berekeningen zijn een belangrijk onderdeel van statistiek | Bron: Pexels

Vraag Drie: Hoe Interpreteer je Statistische Tests?

Statistiek is, zoals je misschien hebt gemerkt, sterk afhankelijk van de informatie die je al hebt geleerd. Daarom is het belangrijk dat je de grondbeginselen van de statistiek onder de knie hebt voordat je statistische tests kunt gaan begrijpen en oefenen.

De interpretatie van statistische tests zal verschillend zijn naargelang de test die je uitvoert. De twee meest voorkomende tests die je aan het begin van je statistiek carrière zult leren zijn:

  • Chi Kwadraat Toets;
  • T-Toets.

Bij beide toetsen gaat het om het toetsen van hypothesen. Hierbij wordt statistiek gebruikt om te testen of variabelen binnen de gegevens al dan niet met elkaar in verband staan. Een T-toets vergelijkt de gemiddelden van twee variabelen. Het geeft je inzicht in hoe deze twee variabelen gerelateerd zijn. Bij een vergelijking tussen een nieuw geneesmiddel en een placebo bijvoorbeeld, kunnen de gezondheidsscores van twee groepen patiënten worden geanalyseerd met een T-toets.

Een Chi-kwadraat toets daarentegen kan worden gebruikt:

  • Om te bepalen of de verdeling van de steekproefgegevens overeenkomt met een populatie. Deze test wordt een Chi-kwadraat toets voor goodness of fit genoemd;
  • Of dat twee variabelen in een contingentietabel aan elkaar gerelateerd zijn. Dit wordt een Chi-kwadraat onafhankelijkheidstoets wordt genoemd. Een voorbeeld van een Chi-kwadraat toets voor onafhankelijkheid kan worden gevonden wanneer men probeert te zien of opleidingsniveau verband houdt met burgerlijke staat door ze te vergelijken binnen een contingentietabel.
Persoon achter beeldscherm
Het kunnen interpreteren van gegevens is heel belangrijk | Bron: Pexels

Extra Hulp voor Statistiek

Gelukkig zijn er veel bronnen die je nuttige tips en handleidingen kunnen geven als je worstelt met statistiek. Deze variëren van een grote verscheidenheid aan online platforms, zoals Superprof en Khan Academy, tot studieboeken en ander leesmateriaal.

Geweldige bronnen voor het krijgen van extra statistische hulp online zijn de websites Wolfram Math en Statistics How To. Beide online platforms geven niet alleen de wiskundige componenten van statistische concepten weer, maar leggen ze ook in detail uit.

Als je meer uitleg nodig hebt, kan YouTube een redder in nood zijn. Als je op zoek bent naar nuttige video handleidingen, is het vaak het beste om te zoeken op de trefwoorden van de statistiektermen waar je mee worstelt. Je kunt bladeren om te zien welke video het beste materiaal heeft.

Als je liever hebt dat iemand het je persoonlijk uitlegt, is bijles een geweldige optie. Je kunt je bijlesdocent dan om wat extra hulp te vragen. Iedereen leert in een ander tempo en op een andere manier, dus het is belangrijk om dat in gedachten te houden als je verder gaat met het leren van statistiek.

Vond je dit artikel leuk? Laat een beoordeling achter!

5,00 (1 beoordeling(en))
Laden...

Marianne

Ik vind dat iedereen overal op de wereld recht heeft op onderwijs. Onderwijs geeft je een betere toekomst. Ik heb de mogelijkheid om mijn kennis te delen, zodat ik mensen van arm tot rijk, van jong tot oud misschien een helpende hand kan bieden om hun doel te bereiken. Dat is mijn ambitie!