Van het verzamelen van de perfecte steekproefgrootte tot het verzekeren van de integriteit van je statistische interpretatie, het begrijpen van alle componenten van de statistiek kan moeilijk zijn om doorheen te navigeren. In een wereld waarin het kennen en gebruiken van statistiek steeds relevanter wordt voor beleid, sociale bewegingen en meer, kan het nuttig zijn om een aantal van de basisbeginselen te leren of te herhalen. Hier is alles wat je moet weten over beschrijvende statistiek!

Een volle collegezaal waar mensen leren over statistiek
Op veel universiteiten kun je je specialiseren ǀ Bron: Unsplash
De beste leraren Statistiek beschikbaar
Sanne
5
5 (20 reviews)
Sanne
25€
/u
Gift icon
1e les gratis!
Rob
4,9
4,9 (15 reviews)
Rob
20€
/u
Gift icon
1e les gratis!
Tom
5
5 (9 reviews)
Tom
15€
/u
Gift icon
1e les gratis!
Peter
4,9
4,9 (12 reviews)
Peter
26€
/u
Gift icon
1e les gratis!
Mick
4,9
4,9 (11 reviews)
Mick
25€
/u
Gift icon
1e les gratis!
Marijn
4,9
4,9 (10 reviews)
Marijn
39€
/u
Gift icon
1e les gratis!
Amir
4,9
4,9 (11 reviews)
Amir
27€
/u
Gift icon
1e les gratis!
Huib
5
5 (8 reviews)
Huib
39€
/u
Gift icon
1e les gratis!
Sanne
5
5 (20 reviews)
Sanne
25€
/u
Gift icon
1e les gratis!
Rob
4,9
4,9 (15 reviews)
Rob
20€
/u
Gift icon
1e les gratis!
Tom
5
5 (9 reviews)
Tom
15€
/u
Gift icon
1e les gratis!
Peter
4,9
4,9 (12 reviews)
Peter
26€
/u
Gift icon
1e les gratis!
Mick
4,9
4,9 (11 reviews)
Mick
25€
/u
Gift icon
1e les gratis!
Marijn
4,9
4,9 (10 reviews)
Marijn
39€
/u
Gift icon
1e les gratis!
Amir
4,9
4,9 (11 reviews)
Amir
27€
/u
Gift icon
1e les gratis!
Huib
5
5 (8 reviews)
Huib
39€
/u
Gift icon
1e les gratis!
Let's go

De Oorsprong van Statistiek

Het gebruik van gegevensanalyse en statistische methoden om de wereld om ons heen te begrijpen lijkt misschien een uitvinding van de 21e eeuw. Hoewel de statistische onderzoeken die statistici tegenwoordig doen veel krachtiger zijn met statistische software en programma's, is het werk van de statisticus een van de oudste beroepen op aarde.

Hoewel de fijne kneepjes van de Bayesiaanse statistiek of het begrijpen van categorische gegevens een langere uitleg verdienen in de context van de evolutie van statistische gegevens en analyse, kun je de basis begrijpen door te kijken naar de oorsprong van de statistiek in een notendop. Hoewel statistiek een veelheid van andere moderne disciplines doorkruisen, zoals biostatistiek of bedrijfsanalyse, begon het als een manier om de verschijnselen van de vroege mens te ordenen of te registreren. Het registreren en analyseren van de bewegingen of landbouw, astrologie of handel om sanitaire, voedsel en economische omstandigheden te verbeteren waren allemaal manieren waarop onze voorouders gebruik maakten van inferentiële en beschrijvende statistiek.

Biologie en statistiek hangen nauw met elkaar samen
Statistiek is iets eeuwenouds! ǀ Bron: Unsplash

Soorten Statistische Analyse

Een domein als de mathematische statistiek, waarvan de toepassingen veel worden gebruikt, is lastig te definiëren. Toegegeven, het jargon bij statistische theorie kan eng zijn: ordinale en categorische gegevens, steekproefgegevens, populatiegemiddelde, percentiel, Markovketen.

Achter de ingewikkelde terminologie gaan echter concepten schuil die in de grond eigenlijk heel eenvoudig zijn. Als je statistiek studeert, krijg je waarschijnlijk les in Bayesiaanse statistiek, waarbij een kansverdeling wordt gebruikt om een nulhypothese te toetsen aan een alternatieve hypothese. In lekentaal: de Bayesiaanse statistiek maakt veronderstellingen over ruwe gegevens om hypothesen op te stellen en toetst dan of die hypothesen al dan niet waarschijnlijk zijn voor die reeks gegevens.

Voordat we verder duiken in voorspellingsanalyse en veelgebruikte statistische technieken, kan het nuttig zijn om te beginnen met de veelgebruikte manieren waarop je datavisualisatie kunt gebruiken om kwalitatieve en kwantitatieve gegevens te analyseren.

Vind hier een cursus data science.

Microscopen in een lab die worden gebruikt voor het verzamelen van statistische data
De wetenschap kan niet zonder statistiek ǀ Bron: Unsplash

Beschrijvende Statistiek

Iedereen die wel eens een histogram, taart- of staafdiagram heeft moeten maken voor de klas of voor het werk - gefeliciteerd, je hebt deelgenomen aan een van de meest voorkomende manieren waarop datawetenschappers statistische analyses uitvoeren. Beschrijvende statistieken zijn metingen van centrale tendens en variantie, wat zich vertaalt in het meten van gegevens aan de hand van het gemiddelde en hoe ver bepaalde punten van dat gemiddelde verwijderd zijn. Maten van centrale tendens kunnen metrieken omvatten zoals:

  • steekproefgemiddelde
  • Mediaan
  • Wijze

Metingen van variabiliteit, of spreiding, omvatten zaken als:

  • Varianties
  • Covariantie
  • Standaardafwijking

Hoewel dit misschien klinkt als een overdreven vereenvoudigd proces, is het uitvoeren van verkennende analyses met beschrijvende statistieken een integraal onderdeel van elke studieopzet. Voordat de wiskundige of datawetenschapper zich bezighoudt met multivariate lineaire regressie of het construeren van een betrouwbaarheidsinterval, moet hij weten wat zijn gegevens bevatten. Je kunt een statistische gegevensanalyse voltooien met alleen beschrijvende statistieken en hun visualisaties. Een van de mooiste voorbeelden hiervan dateert uit de jaren 1850, toen Florence Nightingale haar beruchte "coxcomb" taartdiagram maakte om vitale informatie te verkrijgen over de mortaliteit tijdens de Krimoorlog. In een tijd waarin vrouwen ondervertegenwoordigd waren in de wetenschap, maakte Nightingale de weg vrij voor innovatieve, ondervertegenwoordigde groepen in de statistiek.

Vind de beste data science cursus in Amsterdam.

Een ander belangrijk aspect van het genereren van beschrijvende statistieken is dat veel statistieken of regressiemodellen bepaalde aannames nodig hebben om geldig te zijn. Hoewel deze veronderstellingen van model tot model verschillen, is de meest voorkomende vereiste dat de gegevens normaal verdeeld zijn. Een normale verdeling is een waarschijnlijkheidskromme die de centrale limiettheorema volgt. De meeste gegevens volgen normaal gesproken geen normale verdeling, en daarom zie je veel statistici hun afhankelijke variabelen of onafhankelijke variabele transformeren.

Met behulp van software zoals SPSS, R of Excel kan iedereen gemakkelijk de centrale tendens en de spreiding uit de gegevens halen. Als de gegevens normaal verdeeld zijn, worden deze kengetallen bijzonder krachtig. In de financiële wereld worden bijvoorbeeld de verdeling van de gegevens en het percentiel waaronder bepaalde prijzen of aandelen vallen, gebruikt om de voordelen of risico's van potentiële handelsovereenkomsten te begrijpen.

Statistiek op een schoolbord
Al op school kom je er mee in aanraking ǀ Bron: Unsplash
De beste leraren Statistiek beschikbaar
Sanne
5
5 (20 reviews)
Sanne
25€
/u
Gift icon
1e les gratis!
Rob
4,9
4,9 (15 reviews)
Rob
20€
/u
Gift icon
1e les gratis!
Tom
5
5 (9 reviews)
Tom
15€
/u
Gift icon
1e les gratis!
Peter
4,9
4,9 (12 reviews)
Peter
26€
/u
Gift icon
1e les gratis!
Mick
4,9
4,9 (11 reviews)
Mick
25€
/u
Gift icon
1e les gratis!
Marijn
4,9
4,9 (10 reviews)
Marijn
39€
/u
Gift icon
1e les gratis!
Amir
4,9
4,9 (11 reviews)
Amir
27€
/u
Gift icon
1e les gratis!
Huib
5
5 (8 reviews)
Huib
39€
/u
Gift icon
1e les gratis!
Sanne
5
5 (20 reviews)
Sanne
25€
/u
Gift icon
1e les gratis!
Rob
4,9
4,9 (15 reviews)
Rob
20€
/u
Gift icon
1e les gratis!
Tom
5
5 (9 reviews)
Tom
15€
/u
Gift icon
1e les gratis!
Peter
4,9
4,9 (12 reviews)
Peter
26€
/u
Gift icon
1e les gratis!
Mick
4,9
4,9 (11 reviews)
Mick
25€
/u
Gift icon
1e les gratis!
Marijn
4,9
4,9 (10 reviews)
Marijn
39€
/u
Gift icon
1e les gratis!
Amir
4,9
4,9 (11 reviews)
Amir
27€
/u
Gift icon
1e les gratis!
Huib
5
5 (8 reviews)
Huib
39€
/u
Gift icon
1e les gratis!
Let's go

Veel Voorkomende Problemen met Beschrijvende Statistiek

Zoals je waarschijnlijk al gemerkt hebt, is beschrijvende statistiek heel anders dan de andere hoofdtak van de statistiek: de inferentiële statistiek. Terwijl de inferentiële statistiek gegevens gebruikt om voorspellingen te doen over de populaties met behulp van statistische modellen, beschrijft de beschrijvende statistiek alleen wat er werkelijk in de gegevens zit. Beschrijvende statistiek gebruiken om categorische en numerieke, observationele gegevens te analyseren is een soort statistische methodologie die mensen gebruiken wanneer zij bijvoorbeeld willen:

  • bepalen welk percentage van hun klanten jongvolwassenen zijn
  • weten wat de verdeling van de cijfers op een universiteit is
  • begrijpen wat de effectgrootte tussen twee patiëntengroepen in een proef is

Dit type analyse wordt, in tegenstelling tot regressieanalyse of ANOVA, meestal univariate analyse genoemd omdat de neiging bestaat slechts één variabele tegelijk te analyseren.

Voorbeeld Beschrijvende Statistiek

Hoewel aspecten van statistiek zoals chi-kwadraatanalyse, betrouwbaarheidsintervallen of de correlatiecoëfficiënt zeer verhelderend kunnen zijn - soms heb je alleen beschrijvende statistiek nodig. Neem de volgende getallen in aanmerking:

  • Gemiddelde: 30
  • Standaardafwijking: 4

Laten we zeggen dat deze getallen betrekking hebben op een reeks gegevens over de testscores van je klas. Je wilt begrijpen hoe de klas presteerde, maar je weet niet zeker hoe je je experimentele opzet moet opzetten. Aangenomen dat de gegevens een normale verdeling volgen, weten we dat 68% van de scores binnen één standaardafwijking van het gemiddelde ligt, 95% binnen twee standaardafwijkingen en 99% binnen drie. Zonder gebruik te maken van statistische significantie, randomisatie, of de kleinste kwadraten methode, ben je in staat om uit te vinden dat 95% van de klas tussen de 22 en 38 punten scoort waar:

  • De ondergrens: 30 - (2 * 4)
  • De bovengrens: 30 + (2 * 4)

Een andere statistische reus in het rijk van de beschrijvende analyse is de correlatie, een getal dat de relatie tussen twee variabelen beschrijft. Hoewel je dit waarschijnlijk al weet, moet je ervoor zorgen dat je het verschil tussen correlatie en causaliteit volledig begrijpt.

Correlatie is een wiskundig instrument om te begrijpen hoe veranderingen in een variabele zich verhouden tot veranderingen in een andere variabele, terwijl causaliteit de notie is dat de veranderingen in een variabele veranderingen in een andere variabele veroorzaken.

Neem, bijvoorbeeld, handgrootte en leeftijd. Als je een steekproef zou nemen van mensen van verschillende leeftijden, zou je waarschijnlijk een verband zien waarbij hoe groter de handomvang, hoe hoger ook de leeftijd. Hoewel er duidelijk een correlatie of verband bestaat tussen handgrootte en leeftijd, is het onwaarschijnlijk dat er een oorzakelijk verband is. Als dat wel zo zou zijn, zou dat betekenen dat, als je handen kleiner worden of verdwijnen, je respectievelijk ouder wordt of sterft.

Inferentiële Statistiek

De andere hoofdtak van de statistiek is de inferentiële statistiek, waaraan mensen gewoonlijk denken als ze aan statistiek denken. Vertrouwend op de waarschijnlijkheidstheorie om statistische modellen te maken om conclusies te trekken voor één of meer afhankelijke variabelen, kan de inferentiële statistiek moeilijk te definiëren zijn. De belangrijkste kenmerken van inferentiële statistiek kunnen echter in één zin worden samengevat: de tak gebruikt steekproefgegevens over een populatie om voorspellingen te doen buiten die gegevensverzameling.

Tips en Trucs voor het Leren van Toegepaste Statistiek

Van binomiale verdelingen en uitbijters tot het vinden van de perfecte parametrische test, het begrijpen of onthouden van alle componenten van de statistiek is een onmogelijke taak. Er zijn echter tal van manieren om je statistiekvaardigheden te leren of te verbeteren.

Online Hulp Krijgen bij Statistiek

Gebruik de vele websites online gewijd aan het uitleggen van statistische concepten zoals een willekeurige variabele of analyse van variantie. Hier zijn enkele van de beste online handleidingen of gidsen voor het oplossen van problemen:

  • Towards Data Science
  • Tutorials Point

Als je liever één-op-één hulp krijgt, kijk dan eens bij Superprof's community van meer dan 140.000 wiskundeleraren in Nederland. Van kansberekening tot regressie, je kunt een les proberen voor de gemiddelde prijs van 15 euro per uur!

>

Het platform dat privé leraren en leerlingen met elkaar verbindt

1e les gratis

Vond je dit artikel leuk? Laat een beoordeling achter!

5,00 (1 beoordeling(en))
Laden...

Boris

Schrijver, vertaler en journalist, woonachtig in Chili. Houdt van reizen, nieuwe culturen ontdekken en wetenschap. Werkzaam voor Superprof sinds 2017.