Σελίδα 1 από 1

Το πρόβλημα του ετεροσκεδασμού στη στατιστική

Δημοσιεύτηκε: 11 Φεβ 2022, 13:07
από wooded glade
Μπορεί να μου το εξηγήσει κάποιος αυτό ;
Βασικά πρόκειται για μία περίπτωση γραμμικής παλινδρόμησης. Η τυχαία μεταβλητή Y συνδέεται με την στάνταρ μεταβλητή X με μία κατά προσέγγιση γραμμική σχέση y = A.X + B και θέλουμε να βρούμε το Α και το Β.
Ο τύπος των ελαχίστων τετραγώνων μας λύνει εύκολα αυτό το πρόβλημα αλλά υπάρχουν και παράξενα.

Παράδειγμα: Θέλουμε να βρούμε τη σχέση που συνδέει το ετήσιο εισόδημα με τα χρόνια σπουδών.
Αν δημιουργήσουμε ένα στατιστικό δείγμα θα παρατηρήσουμε ότι σ' αυτούς με πολύ λίγα χρόνια σπουδών (μόνο δημοτικό πχ) το εισόδημα είναι μικρό με μικρή στατιστική απόκλιση - ένας του δημοτικού μόνο από θαύμα θα έχει μεγάλο εισόδημα. Αλλά σ' αυτούς με πολλά χρόνια σπουδών -πχ 20- το μέσο εισόδημα είναι πιό μεγάλο αλλά και το εύρος είναι μεγάλο, προφνώς διότι άλλοι τα καταφέρνουν να γίνουν ceo της Bayersdorf Γερμανίας και άλλοι όχι ή μπορεί να έχουν προβλήματα υγείας που τους εμποδίζουν ή και πολλά άλλα.
Έτσι στα λίγα χρόνια σπουδών η διασπορά των τιμών της μεταβλητής y είναι μικρή και στα πολλά χρόνια σπουδών είναι μεγάλη. Υπάρχει ετεροσκεδασμός.

Αν κατασκευάσουμε την ευθεία Y = A.X + B με τον απλό τύπο των ελαχίστων τετραγώνων χωρίς να λάβουμε υπ' όψιν τον ετεροσκεδασμό θα βγει μιά ανερχόμενη ευθεία που είναι μάλλον υπέρ το δέον ανερχόμενη.
Ο ίδιος τύπος με στατιστικά βάρη για κάθε ζεύγος τιμών (Χi, Yi) του δείγματος διορθώνει την κατάσταση.

Ο τύπος για τα Α, Β είναι ο ίδιος με τον απλό, συν τα στατιστικά βάρη όπως δείχνει εδώ:

https://www.chegg.com/homework-help/que ... -q40449400

Αλλά πως επιλέγω τα ειδικά βάρη Wi ;
Μπορεί κάποιος να εξηγήσει με απλό τρόπο ;