ΣΤΑΤΙΣΤΙΚΗ

Στατιστική
είναι ο κλάδος των μαθηματικών ο οποίος ως έργο έχει την συγκέντρωση στοιχείων, την ταξινόμησή τους και την παρουσίασή τους σε κατάλληλη μορφή ώστε να μπορούν να αναλυθούν και να ερμηνευθούν για την εξυπηρέτηση διαφόρων σκοπών.

Δείγμα: Ένα μέρος του πληθυσμού που επιλέγουμε ως αντιπροσωπευτικό, και εξετάζοντάς το βγάζουμε συμπεράσματα για ολόκληρο τον πληθυσμό.

Άτομο: Κάθε στοιχείο του πληθυσμού (ή του δείγματος).

Μέγεθος του δείγματος(ν): Το πλήθος των ατόμων ενός δείγματος.

Μεταβλητή ενός πληθυσμού είναι το χαρακτηριστικό ως προς το οποίο εξετάζεται ο πληθυσμός.

Οι μεταβλητές διαχωρίζονται σε    

Ποιοτικές
μεταβλητές  
Ποσοτικές
μεταβλητές και αυτές σε:      Διακριτές
                                                                  Συνεχείς


Συχνότητα  `v_ι` μιας τιμής `x_i`   ονομάζουμε τον αριθμό των εμφανίσεων της τιμής `x_i` στο σύνολο τιμών μιας μεταβλητής.
Αν το δείγμα εμφανίζει κ διαφορετικές τιμές της μεταβλητής x με αντίστοιχες συχνότητες `ν_1` ,`ν_2`,..., `ν_κ`, τότε προφανώς ισχύει: `ν_1+ν_2+...+ ν_κ =ν`

Σχετική συχνότητα (`f_i`) είναι ο λόγος της συχνότητας προς το μέγεθος του δείγματος.
Δηλαδή είναι `f_i=ν_i/ν`  .
Ισχύει `f_1 + f_2 + ... + f_κ= 1 `

Σχετική συχνότητα επί τοις εκατό,  είναι η σχετική συχνότητα πολλαπλασιασμένη επί 100

`f_i% = 100. f_i`

Αθροιστική συχνότητα (`Ν_i`) μιας τιμής  `x_i`   λέγεται το άθροισμα των συχνοτήτων  `ν_i`   των τιμών που είναι μικρότερες ή ίσες με την τιμή αυτή (μόνο σε  ποσοτικές μεταβλητές).

Σχετική αθροιστική συχνότητα μιας τιμής  `F_i` λέγεται το άθροισμα των σχετικών συχνοτήτων `f_i` των τιμών που είναι μικρότερες ή ίσες με την τιμή αυτή (μόνο σε  ποσοτικές μεταβλητές).

Αθροιστική σχετική συχνότητα επί τοις εκατό,  είναι η αθροιστική σχετική συχνότητα πολλαπλασιασμένη επί 100

`F_i% = 100. F_i`


Μέτρα Θέσης

Επικρατούσα τιμή
μιας μεταβλητής ονομάζεται η τιμή με τη μεγαλύτερη συχνότητα. Αν δύο ή περισσότερες τιμές έχουν τη μέγιστη συχνότητα τότε υπάρχουν περισσότερες από μία επικρατούσες τιμές.

Η μέση τιμή (`bar(x)`) διαφόρων τιμών είναι το πηλίκο του αθροίσματος των τιμών προς το πλήθος τους.

Ισχύει η σχέση:  `bar(x)=(x_1+x_2+...+x_k)/ν=(sum x_i)/ν `

Αν έχουμε πίνακα συχνοτήτων, τότε για να βρούμε την μέση τιμή χρησιμοποιούμε τον τύπο:

`bar(x)=(ν_1x_1+ν_2x_2+...+ν_κx_k)/ν=(sum x_i*ν_i)/ν `

όπου `ν_1` ,`ν_2`,..., `ν_κ`, οι συχνότητες των τιμών `x_1` ,`x_2`,..., `x_κ`,

Διάμεσος (δ) ενός δείγματος ν παρατηρήσεων που έχουν διαταχθεί σε αύξουσα σειρά ονομάζεται:
Η μεσαία παρατήρηση αν το πλήθος των παρατηρήσεων είναι περιττό.
Το ημιάθροισμα των μεσαίων παρατηρήσεων αν το πλήθος των παρατηρήσεων είναι άρτιο.


Μέτρα Διασποράς

Εύρος τιμών μεταβλητής είναι η διάφορα της μικρότερης τιμής από τη μεγαλύτερη.

Διακύμανση (`s^2`) μιας μεταβλητής Χ που παίρνει τιμές `x_1` ,`x_2`,..., `x_κ`, με  αντίστοιχες συχνότητες `ν_1` ,`ν_2`,..., `ν_κ`, που έχουν μέση τιμή `barx`, ονομάζεται το πηλίκο:

`s^2=(ν_1(bar(x)-x_1)^2+ν_2(bar(x)-x_2)^2+...+ν_κ(bar(x)-x_k)^2)/ν`


Τυπική απόκλιση (s) μιας μεταβλητής Χ είναι η θετική τετραγωνική ρίζα της διακύμανσης:

`s=sqrt(s^2)`

Συντελεστής μεταβλητότητας (CV) σε ένα δείγμα εξεταζόμενο ως προς μια ποσοτική μεταβλητή του, που παρουσιάζει μέση τιμή `barx` και τυπική απόκλιση s  , ονομάζεται το πηλίκο:

`CV =(τυπική απόκλιση)/(μέσητιμή)100%=s/bar(x)100%`

Ο CV μετράει την ομοιογένεια ενός πληθυσμού.
•Αν είναι CV < 10% , ο πληθυσμός θεωρείται ομοιογενής.
•Αν είναι CV > =10% , ο πληθυσμός θεωρείται ανομοιογενής.