Τετάρτη 18 Απριλίου 2012

Επειδή θα βομβαρδιστούμε από δημοσκοπήσεις...

Μπορώ να εμπιστευτώ τις δημοσκοπήσεις, για το πιθανό εκλογικό αποτέλεσμα;
Η σύντομη απάντηση είναι καθόλου, η εξήγηση της σύντομης απάντησης είναι παρακάτω.
Μια καλή δημοσκόπηση έχει συνήθως δείγμα 1200-1800 ατόμων. Πολλές από τις δημοσκοπήσεις που γίνονται σήμερα δεν έχουν ούτε αυτό, οπότε ότι πούμε παρακάτω ισχύει ακόμα περισσότερο.
Ας ξεκινήσουμε με τον αφορισμό πως το συνολικό δείγμα δεν έχει καμία σημασία. Κι ας ξεκινήσουμε από την υπόθεση πως η εταιρία που κάνει τη δημοσκόπηση προσπαθεί να βγάλει ένα ειλικρινές αποτέλεσμα, κάνει σωστά τη δουλειά της και επιλέγει το σωστό δείγμα κάτι το οποίο επίσης δεν ισχύει. Όμως θα αρχίσω με αυτή την ιδανική παραδείσια κατάσταση για να δείξω πως ακόμα κι έτσι, ικανό μέρος των αποτελεσμάτων της δημοσκόπησης είναι αδιάφορο. Πάμε να δούμε τι έχει σημασία.

Από αυτούς τους 1800 ανθρώπους που ρωτάει η ειλικρινής δημοσκόπηση μας, απαντάει στην ερώτηση της πρόθεσης ψήφου περίπου το 50-60% . Ας πούμε 55,5% για να το στρογγυλέψουμε στα 1000 άτομα. Άρα ο δημοσκόπος μας πήρε μόλις 1000 απαντήσεις. Αν λοιπόν υπάρχει ένα κόμμα που παίρνει 2% στη δημοσκόπηση, αυτό σημαίνει πως από τους 1000ανθρώπους, μόλις 20 επέλεξαν αυτό το κόμμα (2/100*1000=20). Αν ένα άλλο κόμμα στην ίδια δημοσκόπηση πάρει 20% αυτό σημαίνει πως 200 άνθρωποι επέλεξαν αυτό το κόμμα (20/100*1000=200). Το δείγμα των 200 ανθρώπων είναι ένα συμπαθές αν όχι και υπέροχο δείγμα και σε γενικές γραμμές μπορούμε να το εμπιστευτούμε. Το δείγμα όμως των 20ατόμων είναι ένα ελάχιστο δείγμα και είναι παντελώς αναξιόπιστο. Κι αυτό διότι η αξιοπιστία του δείγματος κρίνεται ξεχωριστά κι όχι από το συνολικό δείγμα των 1800.

Για να καταλάβετε τι εννοώ δείτε εδώ έναν πίνακα με πιο απτά παραδείγματα γιατί το δείγμα των 15-20-30-40 ατόμων είναι ένα αστείο δείγμα. Μην πάρετε τον πίνακα της μετρητοίς γιατί αφορά άλλο παράδειγμα, κοιτάξτε όμως τα νούμερα για να πάρετε μια γεύση για τι περιθώρια λάθους μιλάμε συνήθως σε πολύ μικρά δείγματα που ακόμα και στις καμπύλες των βιβλίων δεν εμφανίζονται. Στο άρθρο της wikipedia πχ η πιο χαμηλή καμπύλη αφορά δείγμα 96 ατόμων. Καταλαβαίνετε λοιπόν πως σε ένα κόμμα του 1-6% το εάν θα μπει ή όχι στη βουλή είναι στα όρια του στατιστικού λάθους.

Η διαφορά μεταξύ του 1% και του 3% (δηλαδή του εκλόγιμου ορίου) είναι η διαφορά μεταξύ των 10 ατόμων και των 30ατόμων και αυτό το δείγμα, ένας ειλικρινής δημοσκόπος θα το πέταγε στα σκουπίδια. Όμως δεν το κάνει, διότι οι δημοσκοπήσεις κοστίζουν, οι πελάτες θέλουν απαντήσεις και ταυτόχρονα θέλουν να κατευθύνουν την κοινή γνώμη. Διότι όπως είπαμε πιο πάνω, αν ένα κόμμα δεν μπει στη βουλή, τότε η ψήφο σας δεν έχει αντιπρόσωπο και την μοιράζονται όλα τα κόμματα αναλογικά. Άρα αν ο δημοσκόπος ή ο πελάτης του θέλει να προωθήσει ένα κόμμα και να χαντακώσει ένα άλλο, τότε μαγειρεύει το αποτέλεσμα για να δείχνει πως το ίδιο δείγμα των 20-30ατόμων στη μία περίπτωση μεταφράζεται σε 3,5% και στην άλλη περίπτωση σε 2,5%

Υπάρχουν πολλά ακόμα κόλπα και παγίδες στις δημοσκοπήσεις. Κάποια μπορώ να σας τα πω, τα περισσότερα τα ξέρουν μόνο οι ειδικοί. Που επειδή δεν βγαίνουν να τα πουν μόνοι τους, μήπως και χαλάσουν την επιστημοσύνη τους (και το παντεσπάνι τους), με αναγκάζουν να κάνω εγώ τον καραγκιόζη (όπως πάντα). Για παράδειγμα, αν από τους 1800 ανθρώπους που ρωτήσαμε πανελλαδικά οι 200 από τη θεσσαλονίκη δεν απάντησαν στην ερώτηση της πρόθεσης ψήφου γιατί δεν γουστάρουν την προφορά των αθηνέζων, τότε στην ουσία, το δείγμα μας δεν είναι αντιπροσωπευτικό, διότι δεν έχουμε ιδέα τι θα ψηφίσουν οι σαλονικιοί. Αν οι σαλονικιοί ψηφίζουν περίπου ό,τι ψηφίζουν και οι κοζανίτες μπορούμε να μαγειρέψουμε λίγο το αποτέλεσμα και να υποθέσουμε πως οι σαλονικιοί επέλεξαν ό,τι και οι κοζανίτες. Ή αν ένας φίλος μας δημοσκόπος που είχε κάνει μια παρόμοια έρευνα πριν 15μέρες πήρε απαντήσεις από τους σαλονικιούς γιατί ήταν καρντάσι, μπορούμε να συμβουλευτούμε τις δικές του απαντήσεις. Όπως καταλαβαίνετε ήδη έχουμε αρχίσει να μπαίνουμε σε περιοχές που είναι περισσότερο τέχνη και διαίσθηση και όχι κάποια σίγουρη επιστήμη από την οποία μπορούμε να εξάγουμε σίγουρα συμπεράσματα. Θα πρέπει δηλαδή εκεί να εμπιστευτούμε την κρυστάλλινη σφαίρα του δημοσκόπου, που μπορεί να είναι γατόνι και να τα μυρίζεται όλα αυτά, ή μπορεί και όχι. Και στην ελλάδα γνωρίζουμε πολύ καλά πως πέρα από γατόνι, ο δημοσκόπος είναι πολύ πιθανό να είναι και διαπλεκόμενος ή να θέλει να ευχαριστήσει τον πελάτη που τον πληρώνει.

Ένα άλλο κόλπο που κάνουν πχ στις μηνιαίες (κυλιόμενες) δημοσκοπήσεις είναι το εξής. Χρησιμοποιούν είναι πάρα πολύ μικρό δείγμα 800-1000ατόμων. Όπως εξηγήσαμε παραπάνω με συμμετοχή γύρω στο 60% αυτό σημαίνει πως στην πρόθεση ψήφου απαντάνε γύρω στους 500 ανθρώπους. Ένα κόμμα που παίρνει 3% σημαίνει ότι επιλέχθηκε από μόλις από 15άτομα (3/100*500=15). Κάτι που κάνει το δείγμα εντελώς αναξιόπιστο. Σε τόσο μικρό δείγμα ακόμα κι ένα κόμμα του 6% βρίσκεται στα όρια της αναξιοπιστίας, κι ακόμα κι ένα κόμμα του 10% (10/100*500=50) βρίσκεται πολύ κοντά στην πιθανότητα να μην μπαίνει καν στη βουλή ή τελικά να πάρει 4% και όλοι να μιλάνε για έκπληξη (και το ερώτημα είναι έκπληξη σε σχέση με τι?).

Για να ξεπεράσει αυτόν τον σκόπελο η εταιρία κάνει το εξής. Παίρνει τις δημοσκοπήσεις που έκανε τους προηγούμενους μήνες και προσθέτει τα παλιότερα δείγματα στο καινούργιο με κάποιου είδους στάθμιση. Δηλαδή λέει πως το δείγμα φεβρουαρίου θα το λάβω υπόψη μου κατά 80%, το δείγμα ιανουαρίου κατά 60% κλπ κλπ. Με αυτόν τον τρόπο φτιάχνει ένα δείγμα που είναι αρκετά μεγαλύτερο από τα 800 άτομα που ρώτησε αυτόν τον μήνα, αλλά που στην πραγματικότητα αρχίζει και μπάζει διότι θεωρεί πως τον φλεβάρη και τον γενάρη οι άνθρωποι πίστευαν ακριβώς τα ίδια πράγματα με τον μάρτη. Κάτι που μπορεί να είναι πολύ αξιόπιστο αν η ερώτηση είναι, ποιά ποδοσφαιρική ομάδα υποστηρίζετε (διότι οι άνθρωποι δεν αλλάζουν κάθε μήνα ομάδα), αλλά πολύ προβληματικό αν τους ρωτάς ποιο κόμμα ψηφίζεται σε ένα τόσο ρευστό πολιτικό σκηνικό.

Θα μπορούσε να υπάρξει μια δημοσκόπηση την οποία θα μπορούσα να εμπιστευτώ?
Ναι θεωρητικά όπως θα μπορούσε να υπάρξει ελεύθερη αγορά σε ένα άλλο σύμπαν, θα μπορούσε να υπάρξει και μια τέτοια δημοσκόπηση. Για αρχή θα πρέπει να εμπιστευόμαστε και την επιστημονική αρτιότητα, αλλά κυρίως την ειλικρίνεια του δημοσκόπου. Κατά δεύτερο θα πρέπει να εμπιστευόμαστε την ειλικρίνεια των προθέσεων των ανθρώπων που ρωτά ο δημοσκόπος. Παλιότερα πχ, πριν οι δημοσκόποι οι τηλεοράσεις και ο λοβέρδος νομιμοποιήσουν τη χρυσή αυγή, οι δημοσκόποι ήξεραν πως οι άνθρωποι θα ντρέπονταν να απαντήσουν ότι ψηφίζουν ένα ναζιστικό κόμμα και άρα τα αποτελέσματά τους δεν θα ήταν αξιόπιστα όσον αφορά τη χρυσή αυγή.

Και τέλος θα έπρεπε να πάρουμε ένα επαρκώς μεγάλο δείγμα προκειμένου να ξεπεράσουμε τα μαθηματικά προβλήματα των μικρών δειγμάτων. Διότι σ’ ένα δείγμα 20.000 ανθρώπων με 55% απάντηση στην πρόθεση ψήφου θα είχαμε 11.000 απαντήσεις κι ένα κόμμα του 2% θα είχε 220απαντήσεις (2/100*11000=220). Δεν είναι τέλειο δείγμα αλλά είναι ένα ικανό δείγμα.

Άρα τι κάνουμε σε αυτή την περίπτωση?
Δεν έχω κάποια μαγική απάντηση, αλλά στο επόμενο μέρος θα προσπαθήσω να αναλύσω μερικές στρατηγικές πάνω στο τι θα μπορούσαμε να κάνουμε γιατί κι εμένα είναι κάτι που με προβληματίζει πολύ.

Δεν υπάρχουν σχόλια:

Δημοσίευση σχολίου