INFO DATASETS
Laatste update april 2019
Datasets van het type frequentietabel kun je zowel openen in Data analyse als in Dataplot
Nr.1
Naam dataset: 10kmschaatsen
Type: tijdreeks
Onderwerp: Sport
Aantal records (cases): 28
Aantal variabelen: 3
Type variabelen: tekst, geheel getal, komma getal
Beschrijving: Wereldrecords op 10 km en jaar waarin gevestigd.
Indien in een jaar het record is verbeterd is het laatste record opgenomen.
Belangrijke veranderingen in de schaatscondities zijn vermeld.
Bron: o.a. Wikipedia Copyright: -
Nr.2
Naam dataset: bevolking-belgie
Type: tijdreeks
Onderwerp: Demografie
Aantal records (cases): 23
Aantal variabelen: 2
Type variabelen: geheel getal, komma getal
Beschrijving: Ontwikkeling van de bevolking van België vanaf 1846
Bron: o.a. Wikipedia Copyright: -
Nr.3
Naam dataset: olympics100m
Type: tijdreeks
Onderwerp: Sport
Aantal records (cases): 30
Aantal variabelen: 3
Type variabelen: geheel getal, komma getal
Beschrijving: Olympische 100 m tijden mannen en vrouwen
De eerste moderne olympische spelen begonnen in 1896 voor mannen.
Bron: wikipedia Copyright: -
Nr.4a
Naam dataset: bevolking_kleinelanden
Type: frequentietabel
Onderwerp: Demografie
Aantal records (cases): 9
Aantal variabelen: 4
Type variabelen: tekst, komma getal
Beschrijving: Prognose inwonertal vanaf 2004
Bron: - Copyright: -
Nr.4b
Naam dataset: bevolking_europa
Type: frequentietabel
Onderwerp: Demografie
Aantal records (cases): 16
Aantal variabelen: 4
Type variabelen: tekst, komma getal
Beschrijving: Prognose inwonertal vanaf 2004
Bron: - Copyright: -
Nr.4c
Naam dataset: bevolking_opp_europa
Type: frequentietabel
Onderwerp: Demografie
Aantal records (cases): 13
Aantal variabelen: 5
Type variabelen: tekst, geheel getal, komma getal
Beschrijving: Berekening bevolkingsdichtheid
Bron: - Copyright: -
Nr.5
Naam dataset: verspringen
Type: frequentietabel
Onderwerp: Sport
Aantal records (cases): 21
Aantal variabelen: 3
Type variabelen: tekst, geheel getal
Beschrijving: Resultaten van een sportdag
Bron: - Copyright: -
Nr.6
Naam dataset: grensplaatsen
Type: ruwe data
Onderwerp: Geografie
Aantal records (cases): 102
Aantal variabelen: 6
Type variabelen: tekst, geheel getal
Beschrijving: Geografische gegevens over plaatsen in de grensstreek Nederland-Duitsland-midden.
De gegevens dateren van begin jaren 90.
Bron: Euregio (Enschede) (cj) Copyright: Euregio (Enschede)
Nr.7
Naam dataset: levensduur
Type: ruwe data
Onderwerp: Biologie
Aantal records (cases): 25
Aantal variabelen: 4
Type variabelen: tekst, geheel getal, komma getal
Beschrijving: Levensverwachting en hartslag van dieren
Bron: Ogborn&Boohan (1991) Booklet 5 Scatterplots Health and Growth
Copyright: id.
Nr.8
Naam dataset: militiamen
Type: frequentietabel
Onderwerp: Biologie
Aantal records (cases): 16
Aantal variabelen: 2
Type variabelen: geheel getal, komma getal
Beschrijving: Klassieke dataset over de borstomvang van 5738 leden van een militie
Bron: - Copyright: -
Nr.9
Naam dataset: vogeltelling
Type: frequentietabel
Onderwerp: Schatten
Aantal records (cases): 100
Aantal variabelen: 2
Type variabelen: geheel getal
Beschrijving: Schatting van het aantal vogels op een dia door 100 personen
Bron: Gids voor vogelonderzoek, Hugh P. Gallagher prisma pocket 2272 1984
Copyright: Prisma boeken
Nr.10
Naam dataset: salarissen
Type: frequentietabel
Onderwerp: Demonstratie
Aantal records (cases): 8
Aantal variabelen: 2
Type variabelen: geheel getal
Beschrijving: Dataset om de invloed van een "uitschieter" op het gemiddelde en de mediaan
te laten zien.
Bron: vusoft Copyright: vusoft
Nr.11
Naam dataset: stedelingen
Type: frequentietabel
Onderwerp: Demografie, Geschiedenis
Aantal records (cases): 11
Aantal variabelen: 3
Type variabelen: tekst, geheel getal
Beschrijving: De bevolkingsaantallen van een zestiental steden in 1870 en in 1910.
Dit bestand is een voorbeeld van een frequentietabel waarvan uitstekend met
behulp van Dataplot diagrammen gemaakt kunnen worden om de ontwikkelingen
in de bevolkingsaantallen te bestuderen. Nog interessanter kan het zijn als het bestand
met meer recente data zou worden aangevuld.
Bron: C.B.S. Copyright: C.B.S.
Nr.12
Naam dataset: unicef
Type: ruwe data
Onderwerp: Gezondheid
Aantal records (cases): 17
Aantal variabelen: 8
Type variabelen: tekst, geheel getal, komma getal
Beschrijving: De data zijn afkomstig uit het UNICEF report:
"Child poverty in Perspective: An overview of child well-being in rich countries"
Bron: This report can be found on internet
Copyright: The United Nations Children's Fund, 2007
Nr.13
Naam dataset: rampen
Type: ruwe data
Onderwerp: Rampen
Aantal records (cases): 10664
Aantal variabelen: 11
Type variabelen: tekst, geheel getal, categorie
Beschrijving: EM-DAT is de internationale rampen-database.
De dataset bevat essentiële kerngegevens over het voorkomen en de gevolgen
van meer dan 18.000 massa rampen in de wereld vanaf 1900 tot heden.
De database is samengesteld uit verschillende bronnen, waaronder VN-agentschappen, niet-gouvernementele organisaties, verzekeringsmaatschappijen, onderzoeksinstituten
en persagentschappen.
Op de site van EM-DAT vind je een optie om zelf selecties te maken en op te slaan in een bestand.
Dat bestand kun je omzetten naar een vustat-bestand, zie de instructies in de pdf. Link op webpagina MEERDATA
Bron: EM-DATA http://www.emdat.be Copyright: EM-DAT
Nr.14
Naam dataset: songfestival
Type: ruwe data, tijdreeks
Onderwerp: Euro songfestival puntentelling
Aantal records (cases): 33556
Aantal variabelen: 10
Type variabelen: tekst, geheel getal, kommagetal, categorie
Beschrijving: In deze dataset staat hoeveel punten een land ontvangen heeft van een ander land bij de (halve) finales van het Eurovisie songfestival vanaf 1975 tot en met 2014. Ook zijn de geografische locaties van de hoofdsteden en de afstand tussen daartussen gegeven. De gegevens zijn afkomstig van datagraver.
Bron: Datagraver Copyright: Datagraver
Nr.15
Naam dataset: cbs-vrijetijd
Type: ruwe data, enquete
Onderwerp: Demografie
Aantal records (cases): 65535
Aantal variabelen: 11
Type variabelen: geheel getal, komma getal, categorie
Beschrijving: Het bestand beschrijft de vrijetijdsbesteding van alle inwoners van Nederland die op 1-1-2012 minstens 18 jaar zijn., deel uitmaken van een particuliere huishoudens en ingeschreven zijn in de GAB (Gemeentelijke Basis Administratie).
Informatie is verder te vinden in een document vrijetijd-cbs.pdf dat in de zip is opgenomen.
De dataset heeft grotendeels categoriale variabelen met soms erg lange labels. In verband met de grafische representatie is het aan te bevelen de labels te bekorten. Je kunt ook de codes hanteren door in het menu op Labels te klikken. Je kunt de code weergave krijgen door van een variabele het type te wijzingen van categorie in Geheel getal.
Bron: CBS Copyright: CBS
Nr.16
Naam dataset: cbs-beroepsbevolking
Type: ruwe data,enquete
Onderwerp: Demografie
Aantal records (cases): 76746
Aantal variabelen: 10
Type variabelen: categorie
Beschrijving: Gegevens over de Nederlandse beroepsbevolking. De dataset is afkomstig van de Enquete Beroepsbevolking uitgevoerd in 2011. Bij de dataset hoort een lessenserie, docentenhandleiding en toelichting. Dat alles en een uitgebreide toelichting is te vinden op http://www.cbs.nl/nl-NL/menu/informatie/onderwijs/gereedschappen/wiskunde/databestand-ebb.htm
De dataset heeft grotendeels categoriale variabelen met soms erg lange labels. In verband met de grafische representatie is het aan te bevelen de labels te bekorten. Je kunt ook de codes hanteren door in het menu op Labels te klikken. Je kunt de code weergave krijgen door van een variabele het type te wijzingen van Categorie in Geheel getal.
Bron: CBS Copyright: CBS
Nr. 17
Naam dataset: cbs-wonen
Type: ruwe data, enquete
Onderwerp: Demografie
Aantal records (cases): 65535
Aantal variabelen: 20
Type variabelen: categorie, geheel getal
Beschrijving: Gegevens over de Nederlandse particulier huishoudens. De dataset is afkomstig uit Woon Onderzoek Nederland uitgevoerd in 2012. Een uitgebreide toelichting is te vinden op http://www.cbs.nl/nl-NL/menu/informatie/onderwijs/gereedschappen/wiskunde/databestand-wonen.htm
De dataset heeft grotendeels categoriale variabelen met soms erg lange labels. In verband met de grafische representatie is het aan te bevelen de labels te bekorten. Je kunt ook de codes hanteren door in het menu op Labels te klikken. Je kunt de code weergave krijgen door van een variabele het type te wijzingen van categorie in Geheel getal.
Bron: CBS Copyright: CBS
Nr. 18
Naam dataset: nl_gemeenten
Type: tijdreeks
Onderwerp: Demografie
Aantal records (cases): 116
Aantal variabelen: 19
Type variabelen: geheel getal, komma getal
Beschrijving: Tijdreeks over de ontwikkeling van de bevolking van Nederland vanaf 1900.
De oorspronkelijke dataset is in vier subsets opgedeeld met als thema's: gemeenten, gezin, ziekten en inwoners. De namen van de variabelen zijn voor gebruiksgemak aangepast.
Bron: CBS Copyright: CBS
Nr. 19
Naam dataset: nl_gezin
Type: tijdreeks
Onderwerp: Demografie
Aantal records (cases): 116
Aantal variabelen: 20
Type variabelen: geheel getal, komma getal
Beschrijving: Tijdreeks over de ontwikkeling van de bevolking van Nederland vanaf 1900.
De oorspronkelijke dataset is in vier subsets opgedeeld met als thema's: gemeenten, gezin, ziekten en inwoners. De namen van de variabelen zijn voor gebruiksgemak aangepast.
Bron: CBS Copyright: CBS
Nr. 20
Naam dataset: nl_inwoners
Type: tijdreeks
Onderwerp: Demografie
Aantal records (cases): 116
Aantal variabelen: 24
Type variabelen: geheel getal, komma getal
Beschrijving: Tijdreeks over de ontwikkeling van de bevolking van Nederland vanaf 1900.
De oorspronkelijke dataset is in vier subsets opgedeeld met als thema's: gemeenten, gezin, ziekten en inwoners. De namen van de variabelen zijn voor gebruiksgemak aangepast.
Bron: CBS Copyright: CBS
Nr. 21
Naam dataset: nl_ziekten
Type: tijdreeks
Onderwerp: Demografie
Aantal records (cases): 116
Aantal variabelen: 24
Type variabelen: geheel getal, komma getal
Beschrijving: Tijdreeks over de ontwikkeling van de bevolking van Nederland vanaf 1900.
De oorspronkelijke dataset is in vier subsets opgedeeld met als thema's: gemeenten, gezin, ziekten en inwoners. De namen van de variabelen zijn voor gebruiksgemak aangepast.
Bron: CBS Copyright: CBS
Nr.22a
Naam dataset: muffins_slaap
Type: enquete data
Onderwerp: Studenten
Aantal records (cases): 538
Aantal variabelen: 12
Type variabelen: tekst, geheel getal, komma getal, categorie
Beschrijving: Resultaten van Muffins Projekt: Medien- und
Freizeitgestaltung für Interessanten Stochastikunterricht.
Onderzoek naar gedrag van leerlingen aan middelbare scholen in
Duitsland in 2000. Deze subset gaat over het slaap-gedrag.
Bron: Universiteit Kassel
Copyright: Rolf Biehler, Klaus Kombrink, Stefan Schweynoch
Nr.22b
Naam dataset: muffins_tv
Type: enquete data
Onderwerp: Studenten
Aantal records (cases): 538
Aantal variabelen: 21
Type variabelen: tekst, geheel getal, komma getal, categorie
Beschrijving: Resultaten van Muffins Projekt: Medien- und
Freizeitgestaltung für Interessanten Stochastikunterricht.
Onderzoek naar gedrag van leerlingen aan middelbare scholen in
Duitsland in 2000. Deze subset gaat over het tv-kijk-gedrag
Bron: Universiteit Kassel
Copyright: Rolf Biehler, Klaus Kombrink, Stefan Schweynoch
Nr.22c
Naam dataset: muffins_tijdbesteding
Type: enquete data
Onderwerp: Studenten
Aantal records (cases): 538
Aantal variabelen: 13
Type variabelen: tekst, geheel getal, komma getal, categorie
Beschrijving: Resultaten van Muffins Projekt: Medien- und
Freizeitgestaltung für Interessanten Stochastikunterricht.
Onderzoek naar gedrag van leerlingen aan middelbare scholen in
Duitsland in 2000. Onderzoek naar gedrag van leerlingen aan middelbare
scholen in Duitsland in 2000. Deze subset gaat over het vrije tijd-gedrag
Bron: Universiteit Kassel
Copyright: Rolf Biehler, Klaus Kombrink, Stefan Schweynoch
Nr.22d
Naam dataset: muffins_all
Type: enquete data
Onderwerp: Studenten
Aantal records (cases): 538
Aantal variabelen: 145
Type variabelen: tekst, geheel getal, komma getal, Categorie
Beschrijving: Resultaten van Muffins Projekt: Medien- und
Freizeitgestaltung für Interessanten Stochastikunterricht.
Onderzoek naar gedrag van leerlingen aan middelbare scholen in
Duitsland in 2000. Dit is de volledige dataset waarin alle
labels en toelichtingen zijn vertaald in het Nederlands
Bron: Universiteit Kassel
Copyright: Rolf Biehler, Klaus Kombrink, Stefan Schweynoch
Nr.23
Naam databestand: begin
Onderwerp: Leerlingen
Aantal records (cases): 92
Aantal variabelen: 8
Typen variabelen:
tekst, kommagetal, geheel getal, categorie, multipunt
Beschrijving: De onderzoeksgegevens betroffen de variabelen lengte, gewicht, leeftijd, bril, sexe en tv.
De namen zijn toegevoegd en verzonnen evenals de categorie besteding van vrije tijd.
In dit bestand komt elk type variabele voor.
Bron: De data zijn ontleend aan een onderzoek uit de jaren 80 aan een mavo
in Amsterdam (pvb)
Copyright: piet van blokland
Nr.24
Naam databestand: titanic
Type: ruwe data
Onderwerp: Scheepsramp
Aantal records (cases): 1313
Aantal variabelen: 5
Typen variabelen: tekst, kommagetal, geheel getal, categorie
Beschrijving: De ramp met de Titanic is weer in de belangstelling gekomen door een film met Leonardo di Caprio.
De data bieden diverse mogelijkheden om onderzoek te doen met deze set, waarbij bv. de klassenstructuur van begin twintigste eeuw een thema is.
Ook is het interessant te weten dat er in die tijd veel arme mensen uit Ierland en Groot Brittanie naar de USA gingen op zoek naar betere levensomstandigheden.
Op de site www.vusoft.be staat een digiboek met deze dataset.
Bron en copyright: - -
Nr.25
Naam databestand: weerdatatm2008
Type: ruwe data; tijdreeks
Onderwerp: Het weer
Aantal records (cases): 115
Aantal variabelen: 19
Typen variabelen: kommagetal, geheel getal
Beschrijving: Data over het weer over de periode van 1894 tot 2008.
De onderzoeksgegevens zijn verzameld door het weerstation
te Losser (Twente). Zie ook www.weerstationlosser.nl en specifiek voor
een update de pagina: http://www.weerstationlosser.nl/index.php?pid=91&ord=17
Deze dataset is in gebruik in het herziene havomateriaal statistiek.
Bron en copyright: Weerstation Losser
Nr.26
Naam databestand: scholierenenquete-database
Type: ruwe data; enquete
Onderwerp: Scholieren bovenbouw havo, vwo 2016-2017
Een uitgebreide pdf met info is bijgevoegd
Aantal records (cases): >3000
Aantal variabelen: zie pdf
Typen variabelen: zie pdf
Beschrijving:zie pdf
Bron en copyright: NVVW
Nr.27
Naam databestand: school154lrl
Type: ruwe data
Onderwerp: Scholieren
Aantal records (cases): 154
Aantal variabelen: 11
Typen variabelen: geheel getal,kommagetal, categorie
Beschrijving: Gegevens van 154 leerlingen uit havo 4 klassen
Deze gevens zijn gebruikt in de pilot statistiek havo
Bron en copyright: Ctwo
Nr.28
Naam databestand: nationaledoorsnee
Type: ruwe data; enquete
Onderwerp: Scholieren onderbouw 2000
Een uitgbereide pdf met info is bijgevoegd
Aantal records (cases): 50071
Aantal variabelen: 14
Typen variabelen: geheel getal, categorie, multipunt
Beschrijving: Resultaten van een enquete bij een stattistiekproject tergelegenheid van een jubileum van de NVVW en het CBS
De data stammen uit het jaar 2000 en zijn enigszins gedateerd, maar vormen interessant vergelijkingsmateriaal met anno nu.
Extra informatie: http://www.fi.uu.nl/archief/nationaledoorsnee/index2.html
Bron en copyright: NVVW en Freudenthal Instituut
Nr.29
Naam databestand: klimaat-temp
Type: ruwe data; tijdreeks
Onderwerp: Klimaatverandering
Een uitgebreide pdf met info is bijgevoegd
Aantal records (cases): 234
Aantal variabelen: 14
Typen variabelen: geheel getal, kommagetal
Beschrijving: Maandtemperaturen in de periode 1772 tot en met 2005.
De data zijn afkomstig uit het midden van Engeland.
Extra info: www.censusatschool.org.uk
Bron en copyright: Census at school UK
Nr.30
Naam databestand: faithful-geiser
Type: tijdreeks
Onderwerp: Geologie
Aantal records (cases): 272
Aantal variabelen: 2
Typen variabelen: geheel getal, kommagetal
Beschrijving:De Old Faithful geiser in het Yellowstone Park (USA)
wordt regelmatig geobserveerd. Data zijn verzameld over de duur van de erupties en de wachttijd
tussen het begin van achtereenvolgende erupties
Bron en copyright: Journal of the Royal Society 1990
Nr.31a
Naam databestand: eeuwigweer
Type: ruwe data
Onderwerp: Klimatologie
Aantal records (cases): 119
Aantal variabelen: 10
Typen variabelen: geheel getal; kommagetal; categorie; tekst
Beschrijving: een overzicht van meteorologische waarnemingen van 1900 tot 2000 aangevuld met data tot en met 2018.
Namen en eenheden zijn aangepast voor educatieve doeleinden
Bron en copyright: Koninklijk Nederlands Meteorologisch Instituut: Meteoconsult
Nr.31b
Naam databestand: luchtdruk
Type: ruwe data
Onderwerp: Klimatologie
Aantal records (cases): 575
Aantal variabelen: 16
Typen variabelen: geheel getal; categorie
Beschrijving: luchtdruk in hectopascal van de weerstations
De Bilt, Den Helder/De Kooy, Eelde/Groningen, Vlissingen, Maastricht.
De waarnemingen lopen vanaf begin vorige eeuw tot heden.
Bron en copyright: Koninklijk Nederlands Meteorologisch Instituut
Nr.31c
Naam databestand: neerslag
Type: ruwe data
Onderwerp: Klimatologie
Aantal records (cases): 575
Aantal variabelen: 16
Typen variabelen: geheel getal; categorie
Beschrijving: neerslag in mm van de weerstations
De Bilt, Den Helder/De Kooy, Eelde/Groningen, Vlissingen, Maastricht.
De waarnemingen lopen vanaf begin vorige eeuw tot heden.
Bron en copyright: Koninklijk Nederlands Meteorologisch Instituut
Nr.31d
Naam databestand: temperatuur-gem
Type: ruwe data
Onderwerp: Klimatologie
Aantal records (cases): 575
Aantal variabelen: 16
Typen variabelen: geheel getal; kommagetal; categorie
Beschrijving: gemiddelde maandtemperaturen van de weerstations
De Bilt, Den Helder/De Kooy, Eelde/Groningen, Vlissingen, Maastricht.
De waarnemingen lopen vanaf begin vorige eeuw tot heden.
Bron en copyright: Koninklijk Nederlands Meteorologisch Instituut
Nr.31e
Naam databestand: temperatuur-max
Type: ruwe data
Onderwerp: Klimatologie
Aantal records (cases): 575
Aantal variabelen: 16
Typen variabelen: geheel getal; kommagetal; categorie
Beschrijving: maximum maandtemperaturen van de weerstations
De Bilt, Den Helder/De Kooy, Eelde/Groningen, Vlissingen, Maastricht.
De waarnemingen lopen vanaf begin vorige eeuw tot heden.
Bron en copyright: Koninklijk Nederlands Meteorologisch Instituut
Nr.31f
Naam databestand: temperatuur-min
Type: ruwe data
Onderwerp: Klimatologie
Aantal records (cases): 575
Aantal variabelen: 16
Typen variabelen: geheel getal; kommagetal; categorie
Beschrijving: minimum maandtemperaturen van de weerstations
De Bilt, Den Helder/De Kooy, Eelde/Groningen, Vlissingen, Maastricht.
De waarnemingen lopen vanaf begin vorige eeuw tot heden.
Bron en copyright: Koninklijk Nederlands Meteorologisch Instituut
Nr.31g
Naam databestand: wind
Type: ruwe data
Onderwerp: Klimatologie
Aantal records (cases): 65
Aantal variabelen: 9
Typen variabelen: geheel getal; categorie; tekst
Beschrijving: hoogste gemeten windkrachten. De waarnemingen zijn chronologisch geordend
en lopen vanaf begin vorige eeuw tot heden
Bron en copyright: Koninklijk Nederlands Meteorologisch Instituut
|