Bootstrap methode

Top  Previous  Next

Een bootstrap is een zogenaamde non-parametrische toets. Bij deze toets worden herhaaldelijk steekproeven met teruglegging genomen uit de oorspronkelijke steekproef. De gebruikelijke term hiervoor is resampling. De statistische uitspraak over een toetsinsgrootheid komt tot stand na het doen van een groot aantal simulaties. Het concept steekproevenverdeling is daarbij essentieel.

De bootstrap methode is heel robuust, veorronderstellingen van normaliteit zijn niet nodig. Dat deze methode goed werkt komt omdat het verschil tussen de oorspronkelijke (onbekende) populatie en de steekproef, mits aselect getrokken, klein is.

 

De module kent drie toepassingen van de bootstrap methode:

 - steekproeven uit één dataset,

 - onafhankelijke steekproeven uit twee datasets

 - steekproeven uit een puntenwolk (gepaarde waarnemingen)

 

 

Steekproeven uit één dataset

De procedure gaat als volgt:

Kies een toetsingsgrootheid, gemiddelde of mediaan

  tempobalk

 

Klik op Starten

  Een steekproef wordt getrokken

Het gemiddelde/mediaan van de steekproef gaat als blauw balletje naar de Verdeling van gemiddelden/medianen.

Ga door met simuleren

 

De grootte van de steekproef is gelijk aan de omvang van de dataset. Het maximale aantal steekproeven kun je instellen.

Omvang en gemiddelde/mediaan van elke steekproef staan in de rechter kolom. In de datatabel kun je zien hoe vaak in een steekproef een waarde  uit de oorspronkelijke dataset getrokken is.

Van de gekozen grootheid,  gemidddelde of mediaan, ontstaat  door resampling een steekproevenverdeling.

Hierin is de waarde van het waargenomen hemiddelde/mediaan aangegeven met een rode staaf.

 

Schuif          
Met het aanzetten van een paarse schuif kun je de p-waarde (overschrijdingskans) aflezen. Of een kritiek gebied vaststellen

 

Een statistische uitspraak kun je pas doen als je tevoren criteria waaraan de p-waarde moet voldoen hebt vastgesteld

 

Onafhankelijke steekproeven uit twee datasets

De twee datasets zijn aangeduid als groep A en groep B.

De procedure is als hierboven is aangegeven met dat verschil dat er steeds twee steekproeven worden getrokken, één uit groep A en één uit groep B.

De toetsingsgrootheid is nu het verschil van de gemiddelden van beide steekproeven.

 

Steekproeven uit een puntenwolk (gepaarde waarnemingen)

Er is een dataset betaande uit gepaarde waarnemingen x en y en de bijpassende puntenwolk.

De toetsingsgrootheid die je kunt kiezen is de constante waarde of de helling van de regressielijn.

De resampling verloopt als hierboven is aangegeven met dat verschil dat steekproeven een puntenwolk oplevert.

De steekproevenverdeling die ontstaat is die van constante of helling.

Regressielijn toont de regressielijn van de dataset en van de resamples. De regressielijn van de actuele resample is zwart, de voorgaande in grijs.

 

Eigen data
Je kunt eigen data invoeren en de dataset opslaan met de knop opslaan