Onderwerp 6: Statistische concepten

Statistiek is ongetwijfeld een chaotisch enorm vakgebied, omdat het horizontaal allerlei disciplines bestrijkt. Op dezelfde manier hebben gegevens zelf vergelijkbare kenmerken en creëren ze synergieën met statistieken.

Dit is de reden waarom we vijf concepten van statistiek zullen analyseren, die vaak worden gebruikt voor het verzamelen van gegevens.

dit veld van statistiek wordt gebruikt wanneer de wetenschapper een beschrijving van een dataset wil maken, met behulp van het gemiddelde (of gemiddelde), de mediaan (“het punt dat de gegevens in tweeën deelt”), de modus, de variantie (“meet de spreiding van een dataset ten opzichte van het gemiddelde”), en ten slotte de standaardafwijking (“meet de algehele spreiding en wordt berekend door de vierkantswortel van de variantie te nemen”) (Radečić, 2020).

Een functie geeft de waarschijnlijkheid van optreden weer voor elk mogelijk resultaat van een experiment.

deze term verwijst naar de projectie van hoogdimensionale gegevens in een ruimte met een lagere dimensie (Radečić, 2020).

De termen “steekproef” en “steekproef” verwijzen naar het proces van het collectief verzamelen van een groep waarnemingen en worden door elkaar gebruikt. Onder- of overbemonstering kan nuttig zijn in classificatiesituaties waarin minderheids- en meerderheidsklassen gelijkwaardig vertegenwoordigd moeten zijn. Een ongelijkmatige dataset kan worden gecorrigeerd door de minderheidsklasse te overbemonsteren of de dominante klasse te onderbemonsteren. Willekeurige overbemonstering (of willekeurige onderbemonstering, als alternatief) houdt het willekeurig kiezen en dupliceren van observaties uit de minderheidsklasse in (of het willekeurig kiezen en wissen van gegevens uit de meerderheidsklasse) (Radečić, 2020).

De Bayesiaanse benadering maakt flexibiliteit en aanpassingsvermogen mogelijk op basis van nieuwe gegevens. Als de verzamelde gegevens niet op de beste manier de waarneming weergeven die een wetenschapper in de toekomst graag wil zien, maakt dit statistische veld het mogelijk om zijn eigen kennis in de berekeningen op te nemen, in plaats van uitsluitend op de steekproef te vertrouwen. Het maakt het ook mogelijk om de gedachten van wetenschappers over de toekomst bij te werken na de invoer van nieuwe gegevens. (Rijst, 2018)