Bootstrap methode |
Top Previous Next |
Een bootstrap is een zogenaamde non-parametrische toets. Bij deze toets worden herhaaldelijk steekproeven met teruglegging genomen uit de oorspronkelijke steekproef. De gebruikelijke term hiervoor is resampling. De statistische uitspraak over een toetsinsgrootheid komt tot stand na het doen van een groot aantal simulaties. Het concept steekproevenverdeling is daarbij essentieel. De bootstrap methode is heel robuust, veorronderstellingen van normaliteit zijn niet nodig. Dat deze methode goed werkt komt omdat het verschil tussen de oorspronkelijke (onbekende) populatie en de steekproef, mits aselect getrokken, klein is.
De module kent drie toepassingen van de bootstrap methode: - steekproeven uit één dataset, - onafhankelijke steekproeven uit twee datasets - steekproeven uit een puntenwolk (gepaarde waarnemingen)
Steekproeven uit één dataset De procedure gaat als volgt: •Kies een toetsingsgrootheid, gemiddelde of mediaan
•Klik op Starten Een steekproef wordt getrokken •Het gemiddelde/mediaan van de steekproef gaat als blauw balletje naar de Verdeling van gemiddelden/medianen. •Ga door met simuleren
De grootte van de steekproef is gelijk aan de omvang van de dataset. Het maximale aantal steekproeven kun je instellen. Omvang en gemiddelde/mediaan van elke steekproef staan in de rechter kolom. In de datatabel kun je zien hoe vaak in een steekproef een waarde uit de oorspronkelijke dataset getrokken is. Van de gekozen grootheid, gemidddelde of mediaan, ontstaat door resampling een steekproevenverdeling. Hierin is de waarde van het waargenomen hemiddelde/mediaan aangegeven met een rode staaf.
Schuif
Een statistische uitspraak kun je pas doen als je tevoren criteria waaraan de p-waarde moet voldoen hebt vastgesteld
Onafhankelijke steekproeven uit twee datasets De twee datasets zijn aangeduid als groep A en groep B. De procedure is als hierboven is aangegeven met dat verschil dat er steeds twee steekproeven worden getrokken, één uit groep A en één uit groep B. De toetsingsgrootheid is nu het verschil van de gemiddelden van beide steekproeven.
Steekproeven uit een puntenwolk (gepaarde waarnemingen) Er is een dataset betaande uit gepaarde waarnemingen x en y en de bijpassende puntenwolk. De toetsingsgrootheid die je kunt kiezen is de constante waarde of de helling van de regressielijn. De resampling verloopt als hierboven is aangegeven met dat verschil dat steekproeven een puntenwolk oplevert. De steekproevenverdeling die ontstaat is die van constante of helling. Regressielijn toont de regressielijn van de dataset en van de resamples. De regressielijn van de actuele resample is zwart, de voorgaande in grijs.
Eigen data |