1
|
|
2
|
- Υπάρχει Στατιστική Σχέση για πρόβλεψη;
- Πόσο ισχυρή είναι αυτή η σχέση;
- Ποιο είναι το καταλληλότερο μοντέλο;
- Πώς εκφράζεται η καλύτερη προσαρμογή του μοντέλου;
- ΑΝΑΛΥΣΗ ΣΥΣΧΕΤΙΣΗΣ
- Αναφέρεται στη γραμμική σχέση μεταξύ των δυο μεταβλητών
- ΠΑΛΙΝΔΡΟΜΗΣΗ
- Παραδεχόμαστε ή υποθέτουμε μια συναρτησιακή σχέση ανάμεσα στις
μεταβλητές
|
3
|
|
4
|
|
5
|
|
6
|
|
7
|
|
8
|
|
9
|
|
10
|
|
11
|
|
12
|
|
13
|
|
14
|
|
15
|
|
16
|
|
17
|
|
18
|
|
19
|
- Η εύρεση των εκτιμητών με το κριτήριο των ελάχιστων τετραγώνων:
|
20
|
- Η εύρεση των εκτιμητών με το κριτήριο των ελάχιστων τετραγώνων:
|
21
|
- Συντελεστής τμηματικής συσχέτισης:
|
22
|
|
23
|
|
24
|
|
25
|
|
26
|
|
27
|
|
28
|
|
29
|
|
30
|
|
31
|
|
32
|
- Ως υπόλοιπα θεωρούνται οι αποκλίσεις των παρατηρούμενων τιμών μιας
μεταβλητής από τις αντίστοιχες τιμές που εκτιμήθηκαν, με αποτέλεσμα οι
αποκλίσεις αυτές να αποτελούν και τις μετρήσεις των σφαλμάτων της
παλινδρόμησης.
- Η εξέταση των υπολοίπων αναφέρεται:
- Στον έλεγχο της γραμμικότητας της παλινδρόμησης
- Στην ανίχνευση άλλων μεταβλητών που πιθανόν να έπρεπε να είχαν εισαχθεί
στην εξίσωση.
- Στον έλεγχο των παραδοχών που έχουν γίνει σχετικά με τα σφάλματα (ανεξαρτησία,
μέση τιμή μηδέν και σταθερή διασπορά).
|
33
|
|
34
|
|
35
|
|
36
|
|
37
|
|
38
|
|
39
|
|
40
|
|
41
|
- Στη συμβατική παλινδρόμηση θεωρείται ότι οι τιμές των σφαλμάτων εi
είναι ανεξάρτητες.
- Οι υποθέσεις αυτές σε πολλές περιπτώσεις δεν μπορούν να θεωρηθούν ότι
εκφράζουν τις χωρικές διαδικασίες που μοντελοποιούνται.
- Η αποδέσμευση της υπόθεσης της ανεξαρτησίας των υπολοίπων με τη βοήθεια
συσχετογραμμάτων και βαριογραμμάτων, στην περίπτωση των διακριτών
επιφανειακών οντοτήτων (περιοχές) είναι σχεδόν αδύνατη.
- Απαιτείται χρήση εναλλακτικών μορφών μοντελοποίησης. Δύο από αυτές
είναι:
- Γεωγραφικά Σταθμισμένη Παλινδρόμηση
- Σύγχρονη Αυτοπαλινδρόμηση
|
42
|
- Η συμβατική παλινδρόμηση αναφέρεται σε φαινόμενα πρώτης τάξης ή χωρικά
σταθερά και επομένως μοντελοποιούνται υπερτοπικές διαδικασίες.
- Η γεωγραφικά σταθμισμένη παλινδρόμηση αναφέρεται σε φαινόμενα δεύτερης
τάξης ή χωρικά μη-σταθερά, με αποτέλεσμα τη μοντελοποίηση τοπικών (local)
διαδικασιών.
|
43
|
- Συμβατική παλινδρόμηση:
- Σταθμισμένη παλινδρόμηση, κάτω από τις ίδιες υποθέσεις:
- όπου: η θέση των
παρατηρήσεων i με συντεταγμένες xi και yi
- όπου: ο
πίνακας βαρών για κάθε θέση.
|
44
|
- Για να καλυφθεί η ανάγκη της χωρικής μεταβολής, το μέγεθος
- δεν αναφέρεται μόνο
στη θέση (xi, yi) αλλά σε ένα σύνολο σημείων γύρω
από αυτή, δηλαδή σε μια περιοχή ακτίνας ri, έτσι ώστε οι
παρατηρήσεις κοντά στο (xi, yi) να έχουν
μεγαλύτερο βάρος από τις παρατηρήσεις που βρίσκονται μακρύτερα.
- Ο πίνακας βαρών έχει τη μορφή:
|
45
|
- Ο προσδιορισμός της ακτίνας της περιοχής γύρω από τη θέση (xi,
yi) ή του σημείου παλινδρόμησης, που ονομάζεται πυρήνας,
παίζει σημαντικό ρόλο:
- Αν η ακτίνα είναι πολύ μεγάλη, τότε τα στοιχεία που συμπεριλαμβάνονται
στην εκτίμηση των συντελεστών θα καλύπτουν όλη την περιοχή μελέτης.
- Αν είναι πολύ μικρή, τότε οι τιμές τους θα παρουσιάζουν μεγάλο τυπικό
σφάλμα.
- Για τον υπολογισμό του μοντέλου, θεωρείται ότι κάθε παρατήρηση j (στην
περιοχή ri) σταθμίζεται με ένα βάρος wij, ο
υπολογισμός του οποίου μπορεί να γίνει με δύο βασικές ομάδες τρόπων
στάθμισης:
- Η πρώτη ομάδα αφορά τρόπους στάθμισης που είναι αμετάβλητοι, δηλαδή
χαρακτηρίζονται από ένα σταθερό εύρος ζώνης h.
- Η δεύτερη ομάδα αφορά αυτούς που είναι προσαρμόσιμοι, δηλαδή
χαρακτηρίζονται από ένα σταθερό αριθμό σημείων παρατήρησης n.
|
46
|
|
47
|
- Με σταθερό τρόπο στάθμισης ο πιο συχνά χρησιμοποιούμενος είναι με τη
χρήση της συνάρτησης Gauss ως εξής:
-
, αν di < h
- 0 , αν
di ≥ h
- Σε κάθε θέση I, με σταθερό εύρος ζώνης h, το βάρος στο σημείο j είναι wij,
όπου dij είναι η απόσταση παλινδρόμησης i και του σημείου
παρατήρησης j.
|
48
|
- Ο πιο γνωστός προσαρμόσιμος τρόπος στάθμισης έχει ως εξής:
-
, αν dij ≤ h
- 0 , αν dij > h
- Σε κάθε θέση i, το βάρος στο σημείο j είναι wij, όπου dij
είναι η απόσταση μεταξύ i και j και hi, είναι η απόσταση του j-οστού
κοντινότερου σημείου από το σημείο i (hi = dij).
|
49
|
- Τρόποι Αξιολόγησης της Τοπικής Παλινδρόμησης
- Για τη σταθερή απόσταση ο δείκτης ονομάζεται Crossvalidation Score:
- όπου: η εκτιμηθείσα τιμή του Yi,
όταν οι παρατηρήσεις
- του
σημείου δεν έχουν συμπεριληφθεί
στην
- παλινδρόμηση.
|
50
|
- Τρόποι Αξιολόγησης της Τοπικής Παλινδρόμησης
- Για την προσαρμόσιμη απόσταση ο δείκτης ονομάζεται Akaine Information Criterion:
- AIC = Απόκλιση +
- όπου: n = ο αριθμός των σημείων παρατήρησης
- k = ο αριθμός των συντελεστών του
μοντέλου
|
51
|
- Το τετράγωνο του συντελεστή συσχέτισης δίνεται από τον τύπο:
- Όπου: αριθμητής = το σύνολο του αθροίσματος των
-
τετραγώνων και
- παρονομαστής = το γεωγραφικά
σταθμισμένο άθροισμα
-
των τετραγώνων των υπολοίπων.
|
52
|
- Ο δείκτης απόσταση Cook δίνεται
από τον τύπο:
- όπου ri = το
τυποποιημένο υπόλοιπο για το σημείο i
- k = ο αριθμός των
παραμέτρων
|
53
|
- O έλεγχος υπόθεσης που στηρίζεται
στη χρήση τεχνικών Monte Carlo:
- διαφοροποιείται
χωρικά
- Για μια δοσμένη θέση i, έστω ότι:
- είναι η
εκτίμηση της γεωγραφικά σταθμισμένης παλινδρόμησης για το και λαμβάνονται υπόψη n
τιμές αυτής της παραμέτρου (μια για κάθε σημείο j εντός της περιοχής).
|
54
|
- Τότε ένας εκτιμητής της διασποράς της παραμέτρου είναι η τυπική απόκλιση
(sk) των n εκτιμήσεων της παραμέτρου.
- Επομένως, οι παρατηρούμενες τιμές του sk μπορούν να
συγκριθούν με τις τιμές που προκύπτουν από την τυχαία αναδιάταξη των
δεδομένων στο χώρο και την εφαρμογή της γεωγραφικά σταθμισμένης
παλινδρόμησης.
|
55
|
- Η εύρεση της καλύτερης γραμμικής εξίσωσης και η αξιολόγηση της
προβλεπτικής της ικανότητας.
- Ο έλεγχος όλων των παραγόντων που επιδρούν στην εξαρτημένη μεταβλητή,
για να αξιολογηθεί η συνεισφορά μιας συγκεκριμένης μεταβλητής ή ενός
συγκεκριμένου συνόλου μεταβλητών στην «εξήγηση» της εξαρτημένης
μεταβλητής.
- Η εύρεση δομικών σχέσεων και η παροχή εξηγήσεων σε περιπτώσεις
πολύπλοκων σχέσεων πολυμεταβλητών.
|
56
|
- Εκτίμηση: Σκοπός της εκτίμησης είναι να βρεθεί ο καλύτερος εκτιμητής
μιας πληθυσμιακής παραμέτρου από τις δειγματικές παρατηρήσεις. Δηλαδή,
το αντικείμενο είναι η εξεύρεση μιας συγκεκριμένης τιμής για τον
πληθυσμό.
- Στατιστικός έλεγχος υποθέσεων:
Το αντικείμενο είναι ο έλεγχος διάφορων υποθέσεων σχετικά με τον
πληθυσμό. Συγκεκριμένα, αντί να εξετάζεται ποια είναι η πιο πιθανή τιμή
για τον πληθυσμού, το ενδιαφέρον εστιάζεται στην μηδενική υπόθεση ότι η
τιμή είναι μηδέν, σε αντίθεση με την εναλλακτική υπόθεση ότι η τιμή της
είναι μεγαλύτερη του μηδενός.
|
57
|
- Πρόβλεψη: Στις μελέτες πρόβλεψης η κύρια έμφαση είναι στις πρακτικές
εφαρμογές. Δηλαδή, με βάση τη γνώση μιας ή περισσότερων ανεξάρτητων
μεταβλητών, μια εξίσωση παλινδρόμησης δημιουργείται για χρήση στην
πρόβλεψη της εξαρτημένης μεταβλητής.
- Εξήγηση: Στην περίπτωση της εξήγησης, ο βασικός στόχος είναι ο
θεωρητικός καθορισμός της μεταβλητότητας της εξαρτημένης μεταβλητής, με
βάση τις πληροφορίες που δίνουν μια ή περισσότερες ανεξάρτητες
μεταβλητές. Επομένως, η επιλογή των ανεξάρτητων μεταβλητών ορίζεται με
βάση θεωρητικές ανάγκες και ενδιαφέροντα.
|