Θέμα 6: Στατιστικές Έννοιες

Η στατιστική είναι αναμφισβήτητα ένας χαοτικά τεράστιος τομέας, καθώς διαπερνά οριζόντια όλα τα είδη των επιστημονικών κλάδων. Ομοίως, τα ίδια τα δεδομένα έχουν παρόμοια χαρακτηριστικά και δημιουργούν συνέργειες με τη στατιστική.

Αυτός είναι ο λόγος για τον οποίο θα αναλύσουμε πέντε έννοιες της στατιστικής, οι οποίες χρησιμοποιούνται συνήθως για τη συλλογή δεδομένων.

Canva Images

(ή μέσος όρος), η διάμεσος (“το σημείο που διαιρεί τα δεδομένα στα δύο”), ο τρόπος, η διακύμανση (“μετρά τη διασπορά ενός συνόλου δεδομένων σε σχέση με τη μέση τιμή”) και, τέλος, η τυπική απόκλιση (“μετρά τη συνολική διασπορά και υπολογίζεται με την τετραγωνική ρίζα της διακύμανσης”) (Radečić, 2020).

Μια συνάρτηση παρέχει την πιθανότητα εμφάνισης για κάθε πιθανό αποτέλεσμα ενός πειράματος.

Ο όρος αυτός αναφέρεται στην προβολή δεδομένων υψηλής διάστασης σε ένα χώρο, ο οποίος έχει χαμηλότερη διάσταση (Radečić, 2020).

Οι όροι “δείγμα” και “δειγματοληψία” αναφέρονται στη διαδικασία συλλογής μιας ομάδας παρατηρήσεων συλλογικά και χρησιμοποιούνται εναλλακτικά. Η υποδειγματοληψία ή η υπερδειγματοληψία μπορεί να είναι χρήσιμη σε καταστάσεις ταξινόμησης όταν απαιτείται να εκπροσωπούνται εξίσου οι τάξεις της μειονότητας και της πλειοψηφίας. Ένα άνισο σύνολο δεδομένων μπορεί να διορθωθεί είτε με υπερδειγματοληψία της μειονοτικής τάξης είτε με υποδειγματοληψία της κυρίαρχης τάξης. Η τυχαία υπερδειγματοληψία (ή η τυχαία υποδειγματοληψία, ως εναλλακτική λύση) συνεπάγεται την τυχαία επιλογή και αναπαραγωγή παρατηρήσεων από την τάξη της μειονότητας (ή την τυχαία επιλογή και διαγραφή δεδομένων από την τάξη της πλειοψηφίας) (Radečić, 2020).

Η προσέγγιση του Μπέιζ επιτρέπει ευελιξία και προσαρμοστικότητα ανάλογα με τα νέα δεδομένα. Εάν τα δεδομένα που συλλέγονται δεν προβάλλουν με τον καλύτερο τρόπο την παρατήρηση που θέλει να δει ένας επιστήμονας στο μέλλον, αυτός ο τομέας της στατιστικής επιτρέπει να ενσωματώσει τη δική του γνώση στους υπολογισμούς, αντί να βασίζεται αποκλειστικά στο δείγμα. Επιτρέπει επίσης την επικαιροποίηση των σκέψεων του επιστήμονα για το μέλλον μετά την εισαγωγή νέων δεδομένων. (Rice, 2018)