Μια απλή εξήγηση του θεωρήματος του Bayes. Μπεϋζιανοί τύποι

Ποιος είναι ο Bayes; και τι σχέση έχει με τη διαχείριση; - μπορεί να ακολουθήσει μια εντελώς δίκαιη ερώτηση. Προς το παρόν, πάρτε το λόγο μου: αυτό είναι πολύ σημαντικό!... και ενδιαφέρον (από τουλάχιστον, σε μένα).

Ποιο είναι το παράδειγμα με το οποίο λειτουργούν οι περισσότεροι μάνατζερ: Αν παρατηρήσω κάτι, τι συμπεράσματα μπορώ να βγάλω από αυτό; Τι διδάσκει ο Bayes: τι πρέπει πραγματικά να υπάρχει για να παρατηρήσω αυτό το κάτι; Έτσι ακριβώς εξελίσσονται όλες οι επιστήμες και γράφει για αυτό (το παραθέτω από μνήμης): ένα άτομο που δεν έχει μια θεωρία στο κεφάλι του θα αποφύγει τη μια ιδέα στην άλλη υπό την επίδραση διαφόρων γεγονότων (παρατηρήσεις). Δεν είναι τυχαίο που λένε: δεν υπάρχει τίποτα πιο πρακτικό από μια καλή θεωρία.

Παράδειγμα από την πρακτική. Ο υφιστάμενός μου κάνει λάθος και ο συνάδελφός μου (προϊστάμενος άλλου τμήματος) λέει ότι θα ήταν απαραίτητο να ασκηθεί διευθυντική επιρροή στον αμελή υπάλληλο (με άλλα λόγια, τιμωρία / επίπληξη). Και ξέρω ότι αυτός ο υπάλληλος εκτελεί 4-5 χιλιάδες του ίδιου τύπου πράξεις το μήνα και κατά τη διάρκεια αυτής της περιόδου δεν κάνει περισσότερα από 10 λάθη. Νιώθετε τη διαφορά στο παράδειγμα; Ο συνάδελφός μου αντιδρά στην παρατήρηση και γνωρίζω εκ των προτέρων ότι ο υπάλληλος κάνει έναν συγκεκριμένο αριθμό λαθών, οπότε ένα άλλο δεν επηρέασε αυτή τη γνώση... Τώρα, αν στο τέλος του μήνα αποδειχθεί ότι υπάρχουν, για παράδειγμα, 15 τέτοια λάθη!.. Αυτό θα είναι ήδη ένας λόγος για να μελετήσουμε τους λόγους μη συμμόρφωσης με τα πρότυπα.

Είστε πεπεισμένοι για τη σημασία της Μπεϋζιανής προσέγγισης; Ενδιαφέρεστε; Ελπίζω". Και τώρα η μύγα στην αλοιφή. Δυστυχώς, οι μπεϋζιανές ιδέες σπάνια δίνονται αμέσως. Ήμουν ειλικρινά άτυχος, αφού γνώρισα αυτές τις ιδέες μέσα από τη λαϊκή λογοτεχνία, μετά την ανάγνωση της οποίας παρέμειναν πολλές ερωτήσεις. Όταν σχεδίαζα να γράψω μια σημείωση, συγκέντρωσα όλα όσα είχα κρατήσει προηγουμένως σημειώσεις για τον Bayes και επίσης μελέτησα όσα γράφτηκαν στο Διαδίκτυο. Σας παρουσιάζω την καλύτερη εικασία μου για το θέμα. Εισαγωγή στην Μπεϋζιανή Πιθανότητα.

Παραγωγή του θεωρήματος Bayes

Εξετάστε το ακόλουθο πείραμα: ονομάζουμε οποιονδήποτε αριθμό βρίσκεται στο τμήμα και καταγράφουμε όταν αυτός ο αριθμός είναι, για παράδειγμα, μεταξύ 0,1 και 0,4 (Εικ. 1α). Η πιθανότητα αυτού του γεγονότος είναι ίση με τον λόγο του μήκους του τμήματος προς το συνολικό μήκος του τμήματος, με την προϋπόθεση ότι η εμφάνιση αριθμών στο τμήμα εξίσου πιθανό. Μαθηματικά αυτό μπορεί να γραφτεί Π(0,1 <= Χ <= 0,4) = 0,3, или кратко R(Χ) = 0,3, όπου R- πιθανότητα, Χ– τυχαία μεταβλητή στην περιοχή , Χ– τυχαία μεταβλητή στην περιοχή . Δηλαδή, η πιθανότητα να χτυπήσει το τμήμα είναι 30%.

Ρύζι. 1. Γραφική ερμηνεία πιθανοτήτων

Τώρα θεωρήστε το τετράγωνο x (Εικ. 1β). Ας πούμε ότι πρέπει να ονομάσουμε ζεύγη αριθμών ( Χ, y), καθένα από τα οποία είναι μεγαλύτερο από μηδέν και μικρότερο από ένα. Η πιθανότητα ότι Χ(πρώτος αριθμός) θα βρίσκεται εντός του τμήματος (μπλε περιοχή 1), ίση με την αναλογία της περιοχής της μπλε περιοχής προς την περιοχή ολόκληρου του τετραγώνου, δηλαδή (0,4 – 0,1) * (1 – 0 ) / (1 * 1) = 0, 3, δηλαδή το ίδιο 30%. Η πιθανότητα ότι yπου βρίσκεται μέσα στο τμήμα (πράσινη περιοχή 2) ισούται με την αναλογία της περιοχής πρασίνου προς την περιοχή ολόκληρης της πλατείας Π(0,5 <= y <= 0,7) = 0,2, или кратко R(Υ) = 0,2.

Τι μπορείτε να μάθετε για τις αξίες ταυτόχρονα; ΧΚαι y. Για παράδειγμα, ποια είναι η πιθανότητα ότι ταυτόχρονα ΧΚαι yβρίσκονται στα αντίστοιχα δεδομένα τμήματα; Για να γίνει αυτό, πρέπει να υπολογίσετε την αναλογία του εμβαδού της περιοχής 3 (η τομή των πράσινων και μπλε λωρίδων) προς την περιοχή ολόκληρου του τετραγώνου: Π(Χ, Υ) = (0,4 – 0,1) * (0,7 – 0,5) / (1 * 1) = 0,06.

Τώρα ας πούμε ότι θέλουμε να μάθουμε ποια είναι η πιθανότητα yβρίσκεται στο διάστημα αν Χβρίσκεται ήδη στην περιοχή . Δηλαδή, στην πραγματικότητα, έχουμε ένα φίλτρο και όταν καλούμε ζεύγη ( Χ, y), τότε απορρίπτουμε αμέσως εκείνα τα ζεύγη που δεν ικανοποιούν την προϋπόθεση για εύρεση Χσε ένα δεδομένο διάστημα, και στη συνέχεια από τα φιλτραρισμένα ζεύγη μετράμε αυτά για τα οποία yικανοποιεί την κατάστασή μας και θεωρεί την πιθανότητα ως την αναλογία του αριθμού των ζευγών για τα οποία yβρίσκεται στο παραπάνω τμήμα στον συνολικό αριθμό των φιλτραρισμένων ζευγών (δηλαδή για τα οποία Χβρίσκεται στο τμήμα). Μπορούμε να γράψουμε αυτή την πιθανότητα ως Π(Υ|Χ στο Χχτύπησε το βεληνεκές». Προφανώς, αυτή η πιθανότητα είναι ίση με την αναλογία του εμβαδού της περιοχής 3 προς την περιοχή της μπλε περιοχής 1. Το εμβαδόν της περιοχής 3 είναι (0,4 – 0,1) * (0,7 – 0,5) = 0,06, και η περιοχή της μπλε περιοχής 1 ( 0,4 – 0,1) * (1 – 0) = 0,3, τότε η αναλογία τους είναι 0,06 / 0,3 = 0,2. Με άλλα λόγια, η πιθανότητα εύρεσης yστο τμήμα υπό τον όρο ότι Χανήκει στο τμήμα Π(Υ|Χ) = 0,2.

Στην προηγούμενη παράγραφο διατυπώσαμε ουσιαστικά την ταυτότητα: Π(Υ|Χ) = Π(Χ, Υ) / Π( Χ). Λέει: «πιθανότητα να χτυπήσει στοστο εύρος , υπό τον όρο ότι Χχτυπήστε το εύρος, ίσο με την αναλογία της πιθανότητας ταυτόχρονου χτυπήματος Χστο εύρος και στοστην εμβέλεια, στην πιθανότητα να χτυπήσει Χστην περιοχή».

Κατ' αναλογία, εξετάστε την πιθανότητα Π(Χ|Υ). Καλούμε ζευγάρια ( Χ, y) και φιλτράρετε αυτά για τα οποία yβρίσκεται μεταξύ 0,5 και 0,7, τότε η πιθανότητα ότι Χείναι στο διάστημα που προβλέπεται ότι yανήκει στο τμήμα ισούται με την αναλογία της περιοχής της περιοχής 3 προς την περιοχή της πράσινης περιοχής 2: Π(Χ|Υ) = Π(Χ, Υ) / Π(Υ).

Σημειώστε ότι οι πιθανότητες Π(Χ, Υ) Και Π(Υ, Χ) είναι ίσα, και τα δύο είναι ίσα με τον λόγο του εμβαδού της ζώνης 3 προς το εμβαδόν ολόκληρου του τετραγώνου, αλλά οι πιθανότητες Π(Υ|Χ) Και Π(Χ|Υ) δεν είναι ίσο. ενώ η πιθανότητα Π(Υ|Χ) ισούται με την αναλογία της περιοχής της περιοχής 3 προς την περιοχή 1 και Π(Χ|Υ) – περιοχή 3 έως περιοχή 2. Σημειώστε επίσης ότι Π(Χ, Υ) συχνά υποδηλώνεται ως Π(Χ&Υ).

Έτσι εισάγουμε δύο ορισμούς: Π(Υ|Χ) = Π(Χ, Υ) / Π( Χ) Και Π(Χ|Υ) = Π(Χ, Υ) / Π(Υ)

Ας ξαναγράψουμε αυτές τις ισότητες με τη μορφή: Π(Χ, Υ) = Π(Υ|Χ) * Π( Χ) Και Π(Χ, Υ) = Π(Χ|Υ) * Π(Υ)

Εφόσον οι αριστερές πλευρές είναι ίσες, οι δεξιές πλευρές είναι ίσες: Π(Υ|Χ) * Π( Χ) = Π(Χ|Υ) * Π(Υ)

Ή μπορούμε να ξαναγράψουμε την τελευταία ισότητα ως εξής:

Αυτό είναι το θεώρημα του Bayes!

Τέτοιοι απλοί (σχεδόν ταυτολογικοί) μετασχηματισμοί γεννούν πραγματικά ένα μεγάλο θεώρημα!; Μην βιαστείτε να βγάλετε συμπεράσματα. Ας μιλήσουμε ξανά για αυτό που πήραμε. Υπήρχε μια ορισμένη αρχική (a priori) πιθανότητα R(Χ), ότι η τυχαία μεταβλητή Χομοιόμορφα κατανεμημένο στο τμήμα εμπίπτει εντός του εύρους Χ. Συνέβη ένα συμβάν Υ, με αποτέλεσμα να λάβουμε την οπίσθια πιθανότητα της ίδιας τυχαίας μεταβλητής Χ: R(X|Y), και αυτή η πιθανότητα διαφέρει από R(Χ) κατά συντελεστή. Εκδήλωση Υαποκαλούμενες αποδείξεις, περισσότερο ή λιγότερο επιβεβαιωτικές ή διαψεύδουσες Χ. Αυτός ο συντελεστής ονομάζεται μερικές φορές δύναμη αποδείξεων. Όσο πιο ισχυρή είναι η απόδειξη, όσο περισσότερο το γεγονός της παρατήρησης του Υ αλλάζει την προηγούμενη πιθανότητα, τόσο περισσότερο η μεταγενέστερη πιθανότητα διαφέρει από την προηγούμενη. Εάν τα στοιχεία είναι αδύναμα, η μεταγενέστερη πιθανότητα είναι σχεδόν ίση με την προηγούμενη.

Ο τύπος του Bayes για διακριτές τυχαίες μεταβλητές

Στην προηγούμενη ενότητα, αντλήσαμε τον τύπο του Bayes για συνεχείς τυχαίες μεταβλητές x και y που ορίζονται στο διάστημα. Ας εξετάσουμε ένα παράδειγμα με διακριτές τυχαίες μεταβλητές, καθεμία από τις οποίες παίρνει δύο πιθανές τιμές. Κατά τη διάρκεια ιατρικών εξετάσεων ρουτίνας, διαπιστώθηκε ότι στην ηλικία των σαράντα, το 1% των γυναικών πάσχει από καρκίνο του μαστού. Το 80% των γυναικών με καρκίνο λαμβάνουν θετικά αποτελέσματα μαστογραφίας. Το 9,6% των υγιών γυναικών λαμβάνουν επίσης θετικά αποτελέσματα μαστογραφίας. Κατά τη διάρκεια της εξέτασης, μια γυναίκα αυτής της ηλικιακής ομάδας έλαβε θετικό αποτέλεσμα μαστογραφίας. Ποια είναι η πιθανότητα να έχει όντως καρκίνο του μαστού;

Η γραμμή συλλογισμού/υπολογισμού είναι η εξής. Από το 1% των καρκινοπαθών, η μαστογραφία θα δώσει 80% θετικά αποτελέσματα = 1% * 80% = 0,8%. Στο 99% των υγιών γυναικών, η μαστογραφία θα δώσει 9,6% θετικά αποτελέσματα = 99% * 9,6% = 9,504%. Συνολικά 10,304% (9,504% + 0,8%) με θετικά αποτελέσματα μαστογραφίας, μόνο το 0,8% είναι άρρωστοι και το υπόλοιπο 9,504% είναι υγιείς. Έτσι, η πιθανότητα μια γυναίκα με θετική μαστογραφία να έχει καρκίνο είναι 0,8% / 10,304% = 7,764%. Σκέφτηκες 80% ή έτσι;

Στο παράδειγμά μας, ο τύπος Bayes έχει την ακόλουθη μορφή:

Ας μιλήσουμε για τη «φυσική» έννοια αυτής της φόρμουλας για άλλη μια φορά. Χ– τυχαία μεταβλητή (διάγνωση), λαμβάνοντας τιμές: Χ 1- άρρωστος και Χ 2– υγιής Υ– τυχαία μεταβλητή (αποτέλεσμα μέτρησης – μαστογραφία), λήψη τιμών: Υ 1- θετικό αποτέλεσμα και Υ2- αρνητικό αποτέλεσμα. p(X 1)– πιθανότητα ασθένειας πριν από τη μαστογραφία (a priori πιθανότητα) ίση με 1%. R(Υ 1 |Χ 1 ) – η πιθανότητα θετικού αποτελέσματος εάν ο ασθενής είναι άρρωστος (πιθανότητα υπό όρους, αφού πρέπει να προσδιορίζεται στις συνθήκες της εργασίας), ίση με 80%· R(Υ 1 |Χ 2 ) – η πιθανότητα θετικού αποτελέσματος εάν ο ασθενής είναι υγιής (επίσης υπό όρους πιθανότητα) είναι 9,6%. p(X 2)– η πιθανότητα ο ασθενής να είναι υγιής πριν από τη μαστογραφία (a priori πιθανότητα) είναι 99%. p(X 1|Υ 1 ) – την πιθανότητα ο ασθενής να είναι άρρωστος, δεδομένου του θετικού αποτελέσματος της μαστογραφίας (οπίσθια πιθανότητα).

Μπορεί να φανεί ότι η μεταγενέστερη πιθανότητα (αυτό που ψάχνουμε) είναι ανάλογη με την προηγούμενη πιθανότητα (αρχική) με έναν ελαφρώς πιο σύνθετο συντελεστή . Να τονίσω ξανά. Κατά τη γνώμη μου, αυτή είναι μια θεμελιώδης πτυχή της Μπεϋζιανής προσέγγισης. Μέτρηση ( Υ) πρόσθεσε μια συγκεκριμένη ποσότητα πληροφοριών σε ό,τι ήταν αρχικά διαθέσιμο (a priori), κάτι που διευκρίνισε τις γνώσεις μας για το αντικείμενο.

Παραδείγματα

Για να εμπεδώσετε το υλικό που έχετε καλύψει, προσπαθήστε να λύσετε πολλά προβλήματα.

Παράδειγμα 1.Υπάρχουν 3 τεφροδόχοι. στο πρώτο υπάρχουν 3 άσπρες μπάλες και 1 μαύρη. στο δεύτερο - 2 άσπρες μπάλες και 3 μαύρες. στο τρίτο υπάρχουν 3 άσπρες μπάλες. Κάποιος πλησιάζει τυχαία ένα από τα δοχεία και βγάζει 1 μπάλα από αυτό. Αυτή η μπάλα αποδείχθηκε άσπρη. Βρείτε τις μεταγενέστερες πιθανότητες να τραβηχτεί η μπάλα από την 1η, 2η, 3η λάρνακα.

Λύση. Έχουμε τρεις υποθέσεις: H 1 = (επιλέγεται το πρώτο δοχείο), H 2 = (επιλέγεται το δεύτερο δοχείο), H 3 = (επιλέγεται το τρίτο δοχείο). Εφόσον το δοχείο επιλέγεται τυχαία, οι a priori πιθανότητες των υποθέσεων είναι ίσες: P(H 1) = P(H 2) = P(H 3) = 1/3.

Ως αποτέλεσμα του πειράματος, εμφανίστηκε το συμβάν A = (μια λευκή μπάλα τραβήχτηκε από την επιλεγμένη λάρνακα). Υπό όρους πιθανότητες του συμβάντος Α στις υποθέσεις H 1, H 2, H 3: P(A|H 1) = 3/4, P(A|H 2) = 2/5, P(A|H 3) = 1. Για παράδειγμα, η πρώτη ισότητα έχει ως εξής: "η πιθανότητα να τραβήξετε μια λευκή μπάλα εάν επιλεγεί η πρώτη λάρνακα είναι 3/4 (αφού υπάρχουν 4 μπάλες στην πρώτη λάρνακα και οι 3 από αυτές είναι λευκές)."

Χρησιμοποιώντας τον τύπο του Bayes, βρίσκουμε τις μεταγενέστερες πιθανότητες των υποθέσεων:

Έτσι, υπό το φως των πληροφοριών σχετικά με την εμφάνιση του γεγονότος Α, οι πιθανότητες των υποθέσεων άλλαξαν: η υπόθεση H 3 έγινε η πιο πιθανή, η υπόθεση H 2 έγινε η λιγότερο πιθανή.

Παράδειγμα 2.Δύο σκοπευτές πυροβολούν ανεξάρτητα στον ίδιο στόχο, ο καθένας εκτοξεύει μία βολή. Η πιθανότητα να χτυπηθεί ο στόχος για τον πρώτο σκοπευτή είναι 0,8, για τον δεύτερο - 0,4. Μετά τη βολή, βρέθηκε μια τρύπα στον στόχο. Βρείτε την πιθανότητα αυτή η τρύπα να ανήκει στον πρώτο σκοπευτή (Το αποτέλεσμα (και οι δύο τρύπες συνέπεσαν) απορρίπτεται ως αμελητέα απίθανο).

Λύση. Πριν από το πείραμα, είναι δυνατές οι ακόλουθες υποθέσεις: H 1 = (ούτε το πρώτο ούτε το δεύτερο βέλος θα χτυπήσει), H 2 = (και τα δύο βέλη θα χτυπήσουν), H 3 - (ο πρώτος σκοπευτής θα χτυπήσει, αλλά το δεύτερο δεν θα χτυπήσει ), H 4 = (ο πρώτος σκοπευτής δεν θα χτυπήσει και ο δεύτερος θα χτυπήσει). Προηγούμενες πιθανότητες υποθέσεων:

Ρ(Η 1) = 0,2*0,6 = 0,12; Ρ(Η2) = 0,8*0,4 = 0,32; Ρ (Η 3) = 0,8 * 0,6 = 0,48; Ρ(Η4) = 0,2*0,4 = 0,08.

Οι πιθανότητες υπό όρους του παρατηρούμενου γεγονότος A = (υπάρχει μία τρύπα στον στόχο) κάτω από αυτές τις υποθέσεις είναι ίσες: P(A|H 1) = P(A|H 2) = 0; P(A|H 3) = P(A|H 4) = 1

Μετά το πείραμα, οι υποθέσεις H 1 και H 2 καθίστανται αδύνατες και οι μεταγενέστερες πιθανότητες των υποθέσεων H 3 και H 4 σύμφωνα με τον τύπο του Bayes θα είναι:

Bayes ενάντια στο spam

Η φόρμουλα του Bayes έχει βρει ευρεία εφαρμογή στην ανάπτυξη φίλτρων ανεπιθύμητης αλληλογραφίας. Ας υποθέσουμε ότι θέλετε να εκπαιδεύσετε έναν υπολογιστή ώστε να προσδιορίζει ποια email είναι ανεπιθύμητα. Θα προχωρήσουμε από το λεξικό και τις φράσεις χρησιμοποιώντας Μπεϋζιανές εκτιμήσεις. Ας δημιουργήσουμε πρώτα έναν χώρο υποθέσεων. Ας έχουμε 2 υποθέσεις σχετικά με οποιοδήποτε γράμμα: Το H A είναι ανεπιθύμητο, το H B δεν είναι ανεπιθύμητο, αλλά ένα κανονικό, απαραίτητο γράμμα.

Αρχικά, ας «εκπαιδεύσουμε» το μελλοντικό μας σύστημα anti-spam. Ας πάρουμε όλα τα γράμματα που έχουμε και ας τα χωρίσουμε σε δύο «σωρούς» των 10 γραμμάτων το καθένα. Ας βάλουμε spam email στο ένα και ας το ονομάσουμε H A heap, στο άλλο θα βάλουμε την απαραίτητη αλληλογραφία και θα το ονομάσουμε H B heap. Ας δούμε τώρα: ποιες λέξεις και φράσεις βρίσκονται σε ανεπιθύμητα και απαραίτητα γράμματα και με ποια συχνότητα; Θα ονομάσουμε αυτές τις λέξεις και φράσεις αποδείξεις και θα τις υποδηλώσουμε E 1 , E 2 ... Αποδεικνύεται ότι οι λέξεις που χρησιμοποιούνται συνήθως (για παράδειγμα, οι λέξεις "όπως", "σας") στους σωρούς H A και H B εμφανίζονται με περίπου το ίδια συχνότητα. Έτσι, η παρουσία αυτών των λέξεων σε ένα γράμμα δεν μας λέει τίποτα για το σε ποιο σωρό να το αναθέσουμε (αδύναμα στοιχεία). Ας αντιστοιχίσουμε σε αυτές τις λέξεις μια ουδέτερη βαθμολογία πιθανότητας "spam", ας πούμε 0,5.

Αφήστε τη φράση "προφορικά αγγλικά" να εμφανίζεται με μόνο 10 γράμματα και πιο συχνά με ανεπιθύμητα γράμματα (για παράδειγμα, σε 7 ανεπιθύμητα γράμματα από τα 10) παρά με τα απαραίτητα (σε 3 στα 10). Ας δώσουμε σε αυτήν τη φράση υψηλότερη βαθμολογία για ανεπιθύμητα μηνύματα: 7/10 και χαμηλότερη βαθμολογία για κανονικά μηνύματα ηλεκτρονικού ταχυδρομείου: 3/10. Αντίθετα, αποδείχθηκε ότι η λέξη «φίλος» εμφανιζόταν πιο συχνά με κανονικά γράμματα (6 στα 10). Και τότε λάβαμε μια σύντομη επιστολή: "Ο φίλος μου! Πώς είναι τα προφορικά αγγλικά σου;». Ας προσπαθήσουμε να αξιολογήσουμε το "spammyness" του. Θα δώσουμε γενικές εκτιμήσεις P(H A), P(H B) για ένα γράμμα που ανήκει σε κάθε σωρό χρησιμοποιώντας έναν κάπως απλοποιημένο τύπο Bayes και τις κατά προσέγγιση εκτιμήσεις μας:

P(H A) = A/(A+B), Οπου A = p a1 *p a2 *…*p an , B = p b1 *p b2 *…*p b n = (1 – p a1)*(1 – p a2)*… *(1 – p an).

Πίνακας 1. Απλοποιημένη (και ημιτελής) εκτίμηση της γραφής Bayes.

Έτσι, η υποθετική επιστολή μας έλαβε μια βαθμολογία πιθανότητας ανήκειν με έμφαση στο "spammy". Μπορούμε να αποφασίσουμε να ρίξουμε το γράμμα σε έναν από τους σωρούς; Ας ορίσουμε τα κατώφλια απόφασης:

  • Θα υποθέσουμε ότι το γράμμα ανήκει στο σωρό H i αν P(H i) ≥ T.
  • Ένα γράμμα δεν ανήκει στο σωρό αν P(H i) ≤ L.
  • Αν L ≤ P(H i) ≤ T, τότε δεν μπορεί να ληφθεί απόφαση.

Μπορείτε να πάρετε T = 0,95 και L = 0,05. Αφού για την επίμαχη επιστολή και 0,05< P(H A) < 0,95, и 0,05 < P(H В) < 0,95, то мы не сможем принять решение, куда отнести данное письмо: к спаму (H A) или к нужным письмам (H B). Можно ли улучшить оценку, используя больше информации?

Ναί. Ας υπολογίσουμε τη βαθμολογία για κάθε αποδεικτικό στοιχείο με διαφορετικό τρόπο, όπως στην πραγματικότητα πρότεινε ο Bayes. Ας είναι:

F a είναι ο συνολικός αριθμός των ανεπιθύμητων μηνυμάτων ηλεκτρονικού ταχυδρομείου.

F ai είναι ο αριθμός των γραμμάτων με πιστοποιητικό Εγώσε ένα σωρό spam?

F b είναι ο συνολικός αριθμός των γραμμάτων που χρειάζονται.

F bi είναι ο αριθμός των γραμμάτων με πιστοποιητικό Εγώσε ένα σωρό απαραίτητα (σχετικά) γράμματα.

Τότε: p ai = F ai /F a, p bi = F bi /F b. P(H A) = A/(A+B), P(H B) = B/(A+B), Οπου A = p a1 *p a2 *…*p an , B = p b1 *p b2 *…*p b n

Λάβετε υπόψη ότι οι αξιολογήσεις των αποδεικτικών λέξεων p ai και p bi έχουν γίνει αντικειμενικές και μπορούν να υπολογιστούν χωρίς ανθρώπινη παρέμβαση.

Πίνακας 2. Πιο ακριβής (αλλά ημιτελής) εκτίμηση Bayes με βάση τα διαθέσιμα χαρακτηριστικά από μια επιστολή

Λάβαμε ένα πολύ σίγουρο αποτέλεσμα - με μεγάλο πλεονέκτημα, το γράμμα μπορεί να ταξινομηθεί ως το σωστό γράμμα, αφού P(H B) = 0,997 > T = 0,95. Γιατί άλλαξε το αποτέλεσμα; Επειδή χρησιμοποιήσαμε περισσότερες πληροφορίες - λάβαμε υπόψη τον αριθμό των γραμμάτων σε καθεμία από τις στοίβες και, παρεμπιπτόντως, καθορίσαμε τις εκτιμήσεις p ai και p bi πολύ πιο σωστά. Καθορίστηκαν όπως έκανε ο ίδιος ο Bayes, υπολογίζοντας τις πιθανότητες υπό όρους. Με άλλα λόγια, το p a3 είναι η πιθανότητα να εμφανιστεί η λέξη «φίλος» σε ένα γράμμα, υπό την προϋπόθεση ότι αυτό το γράμμα ανήκει ήδη στον σωρό ανεπιθύμητων μηνυμάτων H A . Το αποτέλεσμα δεν άργησε να έρθει - φαίνεται ότι μπορούμε να πάρουμε μια απόφαση με μεγαλύτερη βεβαιότητα.

Bayes κατά της εταιρικής απάτης

Μια ενδιαφέρουσα εφαρμογή της Bayesian προσέγγισης περιγράφηκε από τον MAGNUS8.

Το τρέχον έργο μου (IS για ανίχνευση απάτης σε μια μεταποιητική επιχείρηση) χρησιμοποιεί τον τύπο Bayes για να προσδιορίσει την πιθανότητα απάτης (απάτη) παρουσία/απουσία πολλών γεγονότων που έμμεσα μαρτυρούν υπέρ της υπόθεσης για τη δυνατότητα διάπραξης απάτης. Ο αλγόριθμος είναι αυτομάθησης (με ανατροφοδότηση), π.χ. επανυπολογίζει τους συντελεστές του (υπό όρους πιθανότητες) μετά την πραγματική επιβεβαίωση ή μη της απάτης κατά την επαλήθευση από την υπηρεσία οικονομικής ασφάλειας.

Αξίζει πιθανώς να πούμε ότι τέτοιες μέθοδοι κατά το σχεδιασμό αλγορίθμων απαιτούν μια αρκετά υψηλή μαθηματική κουλτούρα του προγραμματιστή, επειδή το παραμικρό λάθος στην παραγωγή και/ή στην υλοποίηση υπολογιστικών τύπων θα ακυρώσει και θα δυσφημήσει ολόκληρη τη μέθοδο. Οι πιθανοτικές μέθοδοι είναι ιδιαίτερα επιρρεπείς σε αυτό, καθώς η ανθρώπινη σκέψη δεν είναι προσαρμοσμένη να λειτουργεί με πιθανολογικές κατηγορίες και, κατά συνέπεια, δεν υπάρχει «ορατότητα» και κατανόηση της «φυσικής σημασίας» των ενδιάμεσων και τελικών πιθανοτικών παραμέτρων. Αυτή η κατανόηση υπάρχει μόνο για τις βασικές έννοιες της θεωρίας πιθανοτήτων και, στη συνέχεια, χρειάζεται απλώς να συνδυάσετε πολύ προσεκτικά και να εξάγετε πολύπλοκα πράγματα σύμφωνα με τους νόμους της θεωρίας πιθανοτήτων - η κοινή λογική δεν θα βοηθά πλέον για σύνθετα αντικείμενα. Αυτό, ειδικότερα, συνδέεται με αρκετά σοβαρές μεθοδολογικές μάχες που λαμβάνουν χώρα στις σελίδες σύγχρονων βιβλίων για τη φιλοσοφία των πιθανοτήτων, καθώς και με μεγάλο αριθμό σοφισμών, παραδόξων και περίεργων παζλ για αυτό το θέμα.

Μια άλλη απόχρωση που έπρεπε να αντιμετωπίσω είναι ότι, δυστυχώς, σχεδόν όλα, ακόμη περισσότερο ή λιγότερο ΧΡΗΣΙΜΑ ΣΤΗΝ ΠΡΑΚΤΙΚΗ σε αυτό το θέμα είναι γραμμένα στα αγγλικά. Στις ρωσόφωνες πηγές υπάρχει κυρίως μόνο μια πολύ γνωστή θεωρία με παραδείγματα επίδειξης μόνο για τις πιο πρωτόγονες περιπτώσεις.

Συμφωνώ απόλυτα με την τελευταία παρατήρηση. Για παράδειγμα, η Google, όταν προσπάθησε να βρει κάτι σαν «το βιβλίο Bayesian Probability», δεν έβγαλε τίποτα κατανοητό. Είναι αλήθεια ότι ανέφερε ότι ένα βιβλίο με στατιστικές Bayesian απαγορεύτηκε στην Κίνα. (Ο καθηγητής στατιστικής Andrew Gelman ανέφερε στο ιστολόγιο του Πανεπιστημίου Columbia ότι το βιβλίο του, Data Analysis with Regression and Multilevel/Hierarchical Models, απαγορεύτηκε η δημοσίευση στην Κίνα. Ο εκδότης εκεί ανέφερε ότι «το βιβλίο δεν εγκρίθηκε από τις αρχές λόγω διαφόρων πολιτικά ευαίσθητων υλικό σε κείμενο.") Αναρωτιέμαι αν ένας παρόμοιος λόγος οδήγησε στην έλλειψη βιβλίων σχετικά με την πιθανότητα Bayes στη Ρωσία;

Συντηρητισμός στην ανθρώπινη επεξεργασία πληροφοριών

Οι πιθανότητες καθορίζουν τον βαθμό αβεβαιότητας. Η πιθανότητα, τόσο σύμφωνα με τον Bayes όσο και σύμφωνα με τις διαισθήσεις μας, είναι απλώς ένας αριθμός μεταξύ του μηδενός και αυτού που αντιπροσωπεύει το βαθμό στον οποίο ένα κάπως εξιδανικευμένο άτομο πιστεύει ότι η δήλωση είναι αληθινή. Ο λόγος που ένα άτομο είναι κάπως εξιδανικευμένο είναι ότι το άθροισμα των πιθανοτήτων του για δύο αμοιβαία αποκλειόμενα γεγονότα πρέπει να ισούται με την πιθανότητα να συμβεί κάποιο από τα δύο γεγονότα. Η ιδιότητα της προσθετικότητας έχει τέτοιες συνέπειες που ελάχιστοι πραγματικοί άνθρωποι μπορούν να τις συναντήσουν όλες.

Το θεώρημα του Bayes είναι μια ασήμαντη συνέπεια της ιδιότητας της προσθετικότητας, αδιαμφισβήτητη και συμφωνημένη από όλους τους πιθανολόγους, Bayesian και άλλους. Ένας τρόπος για να γραφτεί αυτό είναι ο εξής. Εάν P(H A |D) είναι η επακόλουθη πιθανότητα ότι η υπόθεση A ήταν μετά την παρατήρηση μιας δεδομένης τιμής D, P(H A) είναι η προηγούμενη πιθανότητα πριν από την παρατήρηση μιας δεδομένης τιμής D, P(D|H A ) είναι η πιθανότητα ότι ένα δεδομένη τιμή D θα παρατηρηθεί εάν το H A είναι αληθές και το P(D) είναι η άνευ όρων πιθανότητα μιας δεδομένης τιμής D, τότε

(1) P(H A |D) = P(D|H A) * P(H A) / P(D)

Το P(D) θεωρείται καλύτερα ως μια σταθερά ομαλοποίησης, με αποτέλεσμα οι μεταγενέστερες πιθανότητες να αθροίζονται σε ενότητα πάνω από το εξαντλητικό σύνολο των αμοιβαία αποκλειστικών υποθέσεων που εξετάζονται. Εάν πρέπει να υπολογιστεί, θα μπορούσε να είναι ως εξής:

Αλλά πιο συχνά το P(D) εξαλείφεται παρά υπολογίζεται. Ένας βολικός τρόπος για να εξαλειφθεί αυτό είναι να μετατρέψουμε το θεώρημα του Bayes σε μορφή λόγου πιθανότητας-απόδοσης.

Εξετάστε μια άλλη υπόθεση, το H B , η οποία είναι αμοιβαία αποκλειόμενη με το H A , και αλλάξτε γνώμη για αυτήν με βάση την ίδια δεδομένη ποσότητα που άλλαξε γνώμη για το θεώρημα του Bayes

(2) P(H B |D) = P(D|H B) * P(H B) / P(D)

Τώρα ας διαιρέσουμε την εξίσωση 1 με την εξίσωση 2. το αποτέλεσμα θα είναι ως εξής:

όπου Ω 1 είναι οι μεταγενέστερες πιθανότητες υπέρ του H A έως το H B, Ω 0 είναι οι προηγούμενες πιθανότητες και L είναι η ποσότητα που είναι γνωστή στους στατιστικολόγους ως λόγος πιθανότητας. Η εξίσωση 3 είναι η ίδια σχετική εκδοχή του θεωρήματος του Bayes με την Εξίσωση 1, και είναι συχνά σημαντικά πιο χρήσιμη ειδικά για πειράματα που περιλαμβάνουν υποθέσεις. Οι Bayesians υποστηρίζουν ότι το θεώρημα του Bayes είναι ένας τυπικά βέλτιστος κανόνας σχετικά με τον τρόπο αναθεώρησης των απόψεων υπό το φως των νέων στοιχείων.

Μας ενδιαφέρει να συγκρίνουμε την ιδανική συμπεριφορά που ορίζεται από το θεώρημα του Bayes με την πραγματική συμπεριφορά των ανθρώπων. Για να σας δώσουμε κάποια ιδέα για το τι σημαίνει αυτό, ας δοκιμάσουμε ένα πείραμα με εσάς ως εξεταζόμενο. Αυτή η τσάντα περιέχει 1000 μάρκες πόκερ. Έχω δύο τέτοιες τσάντες, η μία περιέχει 700 κόκκινες και 300 μπλε μάρκες και η άλλη περιέχει 300 κόκκινες και 700 μπλε. Πέταξα ένα νόμισμα για να καθορίσω ποιο θα χρησιμοποιήσω. Έτσι, εάν οι απόψεις μας είναι οι ίδιες, η τρέχουσα πιθανότητα να πάρετε μια τσάντα που περιέχει περισσότερες κόκκινες μάρκες είναι 0,5. Τώρα, κάνετε ένα τυχαίο δείγμα με επιστροφή μετά από κάθε μάρκα. Σε 12 μάρκες παίρνετε 8 κόκκινες και 4 μπλε. Τώρα, με βάση όλα όσα γνωρίζετε, ποια είναι η πιθανότητα να προσγειωθεί η τσάντα με τα περισσότερα κόκκινα; Είναι σαφές ότι είναι υψηλότερο από 0,5. Μην συνεχίσετε την ανάγνωση μέχρι να καταγράψετε τη βαθμολογία σας.

Εάν είστε σαν ένας τυπικός εξεταζόμενος, η βαθμολογία σας έπεσε στην περιοχή από 0,7 έως 0,8. Αν κάναμε όμως τον αντίστοιχο υπολογισμό, η απάντηση θα ήταν 0,97. Είναι πράγματι πολύ σπάνιο για ένα άτομο στο οποίο δεν έχει αποδειχθεί προηγουμένως η επιρροή του συντηρητισμού να καταλήξει σε μια τόσο υψηλή εκτίμηση, ακόμα κι αν ήταν εξοικειωμένος με το θεώρημα του Bayes.

Αν η αναλογία των κόκκινων τσιπς στη σακούλα είναι R, τότε η πιθανότητα λήψης rκόκκινα πατατάκια και ( n -r) μπλε μέσα nδείγματα με επιστροφή – p r (1-Π)n-r. Έτσι, σε ένα τυπικό πείραμα με τσάντα και μάρκες πόκερ, αν ΝΕΝΑσημαίνει ότι η αναλογία των κόκκινων τσιπς είναι r ΑΚαι Νσι– σημαίνει ότι η μετοχή είναι Rσι, τότε ο λόγος πιθανότητας:

Όταν εφαρμόζεται ο τύπος του Bayes, χρειάζεται να λαμβάνει κανείς υπόψη μόνο την πιθανότητα της πραγματικής παρατήρησης και όχι τις πιθανότητες άλλων παρατηρήσεων που μπορεί να έκανε αλλά δεν το έκανε. Αυτή η αρχή έχει ευρείες επιπτώσεις για όλες τις στατιστικές και μη στατιστικές εφαρμογές του θεωρήματος του Bayes. είναι το πιο σημαντικό τεχνικό εργαλείο για τον Μπεϋζιανό συλλογισμό.

Μπεϋζιανή επανάσταση

Οι φίλοι και οι συνάδελφοί σας μιλούν για κάτι που λέγεται «Θεώρημα Bayes» ή «Κανόνας Bayes» ή κάτι που ονομάζεται Bayesian Reasoning. Τους ενδιαφέρει πραγματικά αυτό, οπότε πηγαίνετε στο διαδίκτυο και βρίσκετε μια σελίδα για το Θεώρημα του Bayes και... Είναι μια εξίσωση. Και αυτό ήταν... Γιατί μια μαθηματική έννοια δημιουργεί τέτοιο ενθουσιασμό στα μυαλά; Τι είδους «Μπαγιέζικη επανάσταση» συμβαίνει μεταξύ των επιστημόνων, και υποστηρίζεται ότι ακόμη και η ίδια η πειραματική προσέγγιση μπορεί να περιγραφεί ως η ειδική της περίπτωση; Ποιο είναι το μυστικό που ξέρουν οι Bayesians; Τι είδους φως βλέπουν;

Η Μπεϋζιανή επανάσταση στην επιστήμη δεν συνέβη επειδή όλο και περισσότεροι γνωστικοί επιστήμονες άρχισαν ξαφνικά να παρατηρούν ότι τα νοητικά φαινόμενα είχαν μια Μπεϋζιανή δομή. Όχι επειδή οι επιστήμονες σε κάθε τομέα έχουν αρχίσει να χρησιμοποιούν τη μέθοδο Bayes. αλλά επειδή η ίδια η επιστήμη είναι μια ειδική περίπτωση του θεωρήματος του Bayes. τα πειραματικά στοιχεία είναι στοιχεία του Μπεϋζιανού. Οι Μπεϋζιανοί επαναστάτες υποστηρίζουν ότι όταν εκτελείτε ένα πείραμα και αποκτάτε στοιχεία που «επιβεβαιώνουν» ή «διαψεύδουν» τη θεωρία σας, αυτή η επιβεβαίωση ή η διάψευση συμβαίνει σύμφωνα με τους Μπεϋζιανούς κανόνες. Για παράδειγμα, πρέπει να λάβετε υπόψη όχι μόνο ότι η θεωρία σας μπορεί να εξηγήσει ένα φαινόμενο, αλλά και ότι υπάρχουν άλλες πιθανές εξηγήσεις που μπορούν επίσης να προβλέψουν αυτό το φαινόμενο.

Προηγουμένως, η πιο δημοφιλής φιλοσοφία της επιστήμης ήταν η παλιά φιλοσοφία, η οποία εκτοπίστηκε από την επανάσταση του Μπεϋζιανού. Η ιδέα του Karl Popper ότι οι θεωρίες μπορούν να παραποιηθούν πλήρως αλλά ποτέ να επαληθευτούν πλήρως είναι μια άλλη ειδική περίπτωση των κανόνων του Bayes. αν p(X|A) ≈ 1 – εάν η θεωρία κάνει σωστές προβλέψεις, τότε η παρατήρηση του ~X παραποιεί το A πολύ έντονα. η θεωρία; ίσως κάποια άλλη συνθήκη Β είναι δυνατή, τέτοια ώστε p(X|B) ≈ 1, και κάτω από την οποία η παρατήρηση Χ δεν μαρτυρεί υπέρ του Α αλλά μαρτυρεί υπέρ του Β. Για να επιβεβαιώσει οπωσδήποτε η παρατήρηση X, θα είχαμε να μην γνωρίζουμε ότι p(X|A) ≈ 1 και ότι p(X|~A) ≈ 0, που δεν μπορούμε να γνωρίζουμε γιατί δεν μπορούμε να εξετάσουμε όλες τις πιθανές εναλλακτικές εξηγήσεις. Για παράδειγμα, όταν η θεωρία της γενικής σχετικότητας του Αϊνστάιν ξεπέρασε την καλά υποστηριζόμενη θεωρία της βαρύτητας του Νεύτωνα, έκανε όλες τις προβλέψεις της θεωρίας του Νεύτωνα μια ειδική περίπτωση των προβλέψεων του Αϊνστάιν.

Με παρόμοιο τρόπο, ο ισχυρισμός του Popper ότι μια ιδέα πρέπει να είναι παραποιήσιμη μπορεί να ερμηνευθεί ως εκδήλωση του Μπεϋζιανού κανόνα της διατήρησης της πιθανότητας. Εάν το αποτέλεσμα Χ είναι θετική απόδειξη για τη θεωρία, τότε το αποτέλεσμα ~Χ πρέπει να διαψεύσει τη θεωρία σε κάποιο βαθμό. Αν προσπαθήσετε να ερμηνεύσετε τόσο το X όσο και το ~X ως «επιβεβαίωση» της θεωρίας, οι κανόνες του Bayes λένε ότι είναι αδύνατο! Για να αυξήσετε την πιθανότητα μιας θεωρίας, πρέπει να την υποβάλετε σε δοκιμές που μπορούν ενδεχομένως να μειώσουν την πιθανότητά της. Αυτός δεν είναι απλώς ένας κανόνας για τον προσδιορισμό των τσαρλατάνων στην επιστήμη, αλλά απόρροια του θεωρήματος πιθανοτήτων του Μπεϋζιανού. Από την άλλη πλευρά, η ιδέα του Popper ότι χρειάζεται μόνο παραποίηση και καμία επιβεβαίωση είναι εσφαλμένη. Το θεώρημα του Bayes δείχνει ότι η παραποίηση είναι πολύ ισχυρή απόδειξη σε σύγκριση με την επιβεβαίωση, αλλά η παραποίηση εξακολουθεί να είναι πιθανολογική. δεν διέπεται από θεμελιωδώς διαφορετικούς κανόνες και δεν διαφέρει με αυτόν τον τρόπο από την επιβεβαίωση, όπως ισχυρίζεται ο Popper.

Έτσι, διαπιστώνουμε ότι πολλά φαινόμενα στις γνωστικές επιστήμες, συν οι στατιστικές μέθοδοι που χρησιμοποιούν οι επιστήμονες, συν η ίδια η επιστημονική μέθοδος, είναι όλα ειδικές περιπτώσεις του θεωρήματος του Bayes. Αυτή είναι η Μπεϋζιανή επανάσταση.

Καλώς ήρθατε στη συνωμοσία του Μπεϋζιάν!

Βιβλιογραφία για τις πιθανότητες Μπεϋζιανής

2. Πολλές διαφορετικές εφαρμογές του Bayes περιγράφονται από τον βραβευμένο με Νόμπελ οικονομίας Kahneman (και τους συντρόφους του) σε ένα υπέροχο βιβλίο. Μόνο στη σύντομη περίληψη αυτού του πολύ μεγάλου βιβλίου, μέτρησα 27 αναφορές στο όνομα ενός Πρεσβυτεριανού λειτουργού. Ελάχιστες φόρμουλες. (.. Μου άρεσε πολύ. Αλήθεια, είναι λίγο περίπλοκο, υπάρχουν πολλά μαθηματικά (και πού θα ήμασταν χωρίς αυτά), αλλά μεμονωμένα κεφάλαια (για παράδειγμα, Κεφάλαιο 4. Πληροφορίες) είναι ξεκάθαρα σχετικά με το θέμα. Το προτείνω σε όλους Ακόμα κι αν τα μαθηματικά είναι δύσκολα για εσάς, διαβάστε κάθε άλλη γραμμή, παρακάμπτοντας τα μαθηματικά και ψαρεύοντας χρήσιμα σιτηρά.

14. (προσθήκη με ημερομηνία 15 Ιανουαρίου 2017), ένα κεφάλαιο από το βιβλίο του Tony Crilly. 50 ιδέες που πρέπει να γνωρίζετε. Μαθηματικά.

Ο βραβευμένος με Νόμπελ φυσικός Ρίτσαρντ Φάινμαν, μιλώντας για έναν φιλόσοφο με ιδιαίτερη αυτοπεποίθηση, είπε κάποτε: «Αυτό που με εκνευρίζει δεν είναι η φιλοσοφία ως επιστήμη, αλλά η μεγαλοπρέπεια που δημιουργείται γύρω από αυτήν. Αν οι φιλόσοφοι μπορούσαν να γελάσουν με τον εαυτό τους! Μακάρι να μπορούσαν να πουν: «Εγώ λέω ότι είναι έτσι, αλλά ο Φον Λειψία πίστευε ότι ήταν διαφορετικό, και ξέρει επίσης κάτι για αυτό». Αν θυμήθηκαν να ξεκαθαρίσουν ότι είναι μόνο δικό τους .

Φόρμουλα Bayes

Θεώρημα Bayes- ένα από τα κύρια θεωρήματα της στοιχειώδους θεωρίας πιθανοτήτων, το οποίο καθορίζει την πιθανότητα ενός γεγονότος να συμβεί σε συνθήκες όπου είναι γνωστές μόνο μερικές μερικές πληροφορίες για γεγονότα με βάση παρατηρήσεις. Χρησιμοποιώντας τον τύπο του Bayes, είναι δυνατός ο εκ νέου υπολογισμός της πιθανότητας με μεγαλύτερη ακρίβεια, λαμβάνοντας υπόψη τόσο τις προηγουμένως γνωστές πληροφορίες όσο και τα δεδομένα από νέες παρατηρήσεις.

«Φυσική έννοια» και ορολογία

Ο τύπος του Bayes σάς επιτρέπει να «αναδιατάξετε την αιτία και το αποτέλεσμα»: δεδομένου του γνωστού γεγονότος ενός γεγονότος, υπολογίστε την πιθανότητα να προκλήθηκε από μια δεδομένη αιτία.

Τα συμβάντα που αντικατοπτρίζουν τη δράση των «αιτιών» σε αυτήν την περίπτωση συνήθως ονομάζονται υποθέσεις, αφού είναι υποτιθεμένοςτα γεγονότα που οδήγησαν σε αυτό. Η άνευ όρων πιθανότητα να είναι αληθής η υπόθεση ονομάζεται εκ των προτέρων(πόσο πιθανός είναι ο λόγος καθόλου), και υπό όρους - λαμβάνοντας υπόψη το γεγονός του γεγονότος - εκ των υστέρων(πόσο πιθανός είναι ο λόγος αποδείχθηκε ότι έλαβε υπόψη τα δεδομένα του συμβάντος).

Συνέπεια

Μια σημαντική συνέπεια του τύπου του Bayes είναι ο τύπος για τη συνολική πιθανότητα ενός γεγονότος ανάλογα με αρκετάασυνεπείς υποθέσεις ( και μόνο από αυτούς!).

- πιθανότητα να συμβεί ένα συμβάν σι, ανάλογα με μια σειρά υποθέσεων ΕΝΑ Εγώ, εάν ο βαθμός αξιοπιστίας αυτών των υποθέσεων είναι γνωστός (για παράδειγμα, μετρήθηκε πειραματικά).

Παραγωγή του τύπου

Εάν ένα συμβάν εξαρτάται μόνο από αιτίες ΕΝΑ Εγώ, τότε αν συνέβη, σημαίνει ότι πρέπει να συνέβη ένας από τους λόγους, δηλ.

Σύμφωνα με τον τύπο του Bayes

Με μεταβίβαση Π(σι) στα δεξιά λαμβάνουμε την επιθυμητή έκφραση.

Μέθοδος φιλτραρίσματος ανεπιθύμητων μηνυμάτων

Μια μέθοδος που βασίζεται στο θεώρημα του Bayes έχει βρει επιτυχημένη εφαρμογή στο φιλτράρισμα ανεπιθύμητων μηνυμάτων.

Περιγραφή

Κατά την εκπαίδευση ενός φίλτρου, για κάθε λέξη που συναντάται με γράμματα, υπολογίζεται και αποθηκεύεται το "βάρος" του - η πιθανότητα ένα γράμμα με αυτήν τη λέξη να είναι ανεπιθύμητο (στην απλούστερη περίπτωση - σύμφωνα με τον κλασικό ορισμό της πιθανότητας: "εμφανίσεις σε ανεπιθύμητη αλληλογραφία / εμφανίσεις συνολικά»).

Κατά τον έλεγχο μιας επιστολής που έφτασε πρόσφατα, η πιθανότητα να είναι ανεπιθύμητη υπολογίζεται χρησιμοποιώντας τον παραπάνω τύπο για μια ποικιλία υποθέσεων. Σε αυτήν την περίπτωση, οι "υποθέσεις" είναι λέξεις και για κάθε λέξη, "η αξιοπιστία της υπόθεσης" είναι το % αυτής της λέξης στο γράμμα και "η εξάρτηση του γεγονότος από την υπόθεση". Π(σι | ΕΝΑ Εγώ) - το προηγουμένως υπολογισμένο «βάρος» της λέξης. Δηλαδή, το «βάρος» ενός γράμματος σε αυτή την περίπτωση δεν είναι τίποτα άλλο από το μέσο «βάρος» όλων των λέξεων του.

Ένα γράμμα ταξινομείται ως "spam" ή "non-spam" με βάση το εάν το "βάρος" του υπερβαίνει ένα ορισμένο επίπεδο που καθορίζεται από τον χρήστη (συνήθως 60-80%). Μετά τη λήψη απόφασης για ένα γράμμα, τα «βαρίδια» για τις λέξεις που περιλαμβάνονται σε αυτό ενημερώνονται στη βάση δεδομένων.

Χαρακτηριστικό γνώρισμα

Αυτή η μέθοδος είναι απλή (οι αλγόριθμοι είναι στοιχειώδεις), βολική (σας επιτρέπει να κάνετε χωρίς «μαύρες λίστες» και παρόμοιες τεχνητές τεχνικές), αποτελεσματική (μετά από εκπαίδευση σε αρκετά μεγάλο δείγμα, κόβει έως και 95-97% των ανεπιθύμητων μηνυμάτων και σε περίπτωση σφαλμάτων μπορεί να επανεκπαιδευτεί). Γενικά, υπάρχουν όλες οι ενδείξεις για την ευρεία χρήση του, κάτι που συμβαίνει στην πράξη - σχεδόν όλα τα σύγχρονα φίλτρα ανεπιθύμητης αλληλογραφίας είναι κατασκευασμένα στη βάση του.

Ωστόσο, η μέθοδος έχει επίσης ένα θεμελιώδες μειονέκτημα: αυτό με βάση την υπόθεση, Τι Ορισμένες λέξεις είναι πιο κοινές στα ανεπιθύμητα μηνύματα, ενώ άλλες είναι πιο κοινές στα κανονικά μηνύματα ηλεκτρονικού ταχυδρομείου, και είναι αναποτελεσματικό εάν αυτή η υπόθεση είναι εσφαλμένη. Ωστόσο, όπως δείχνει η πρακτική, ακόμη και ένα άτομο δεν μπορεί να εντοπίσει τέτοιο spam "με το μάτι" - μόνο διαβάζοντας το γράμμα και κατανοώντας το νόημά του.

Ένα άλλο, όχι θεμελιώδες, μειονέκτημα που σχετίζεται με την υλοποίηση είναι ότι η μέθοδος λειτουργεί μόνο με κείμενο. Γνωρίζοντας αυτόν τον περιορισμό, οι spammers άρχισαν να εισάγουν διαφημιστικές πληροφορίες στην εικόνα, αλλά το κείμενο στην επιστολή είτε έλειπε είτε δεν είχε νόημα. Για να αντιμετωπιστεί αυτό, πρέπει να χρησιμοποιήσετε είτε εργαλεία αναγνώρισης κειμένου (μια «δαπανηρή» διαδικασία, που χρησιμοποιείται μόνο όταν είναι απολύτως απαραίτητο), είτε παλιές μεθόδους φιλτραρίσματος - «μαύρες λίστες» και κανονικές εκφράσεις (καθώς τέτοια γράμματα έχουν συχνά στερεότυπη μορφή).

δείτε επίσης

Σημειώσεις

Συνδέσεις

Βιβλιογραφία

  • Πουλί Ακτινίδιο. Το θεώρημα του αιδεσιμότατου Bayes. // Περιοδικό Computerra, 24 Αυγούστου 2001.
  • Πολ Γκράχαμ. Ένα σχέδιο για ανεπιθύμητη αλληλογραφία (Αγγλικά). // Προσωπική ιστοσελίδα του Paul Graham.

Ίδρυμα Wikimedia. 2010.

Δείτε τι είναι το "Bayes Formula" σε άλλα λεξικά:

    Ένας τύπος που έχει τη μορφή: όπου τα a1, A2,..., An είναι ασύμβατα γεγονότα, Γενικό σχήμα εφαρμογής του f.v. ζ.: αν το γεγονός Β μπορεί να συμβεί σε διαφορετικά. συνθήκες για τις οποίες γίνονται n υποθέσεις A1, A2, ..., An με πιθανότητες P(A1), ... γνωστές πριν από το πείραμα. Γεωλογική εγκυκλοπαίδεια

    Σας επιτρέπει να υπολογίσετε την πιθανότητα ενός γεγονότος που σας ενδιαφέρει μέσω των υπό όρους πιθανοτήτων αυτού του γεγονότος υπό την παραδοχή ορισμένων υποθέσεων, καθώς και των πιθανοτήτων αυτών των υποθέσεων. Διατύπωση Ας δοθεί ένας χώρος πιθανότητας και η πλήρης ομάδα σε ζεύγη... ... Wikipedia

    Σας επιτρέπει να υπολογίσετε την πιθανότητα ενός γεγονότος που σας ενδιαφέρει μέσω των υπό όρους πιθανοτήτων αυτού του γεγονότος υπό την παραδοχή ορισμένων υποθέσεων, καθώς και των πιθανοτήτων αυτών των υποθέσεων. Διατύπωση Ας δοθεί ένας χώρος πιθανότητας και μια πλήρης ομάδα γεγονότων όπως... ... Wikipedia

    - (ή τύπος του Bayes) είναι ένα από τα κύρια θεωρήματα της θεωρίας πιθανοτήτων, το οποίο σας επιτρέπει να προσδιορίσετε την πιθανότητα κάποιο γεγονός (υπόθεση) να έχει συμβεί παρουσία μόνο έμμεσων στοιχείων (δεδομένων), τα οποία μπορεί να είναι ανακριβή... Βικιπαίδεια

    Το θεώρημα του Bayes είναι ένα από τα κύρια θεωρήματα της στοιχειώδους θεωρίας πιθανοτήτων, το οποίο καθορίζει την πιθανότητα ενός γεγονότος να συμβεί σε συνθήκες όπου μόνο μερικές μερικές πληροφορίες σχετικά με γεγονότα είναι γνωστές με βάση παρατηρήσεις. Χρησιμοποιώντας τον τύπο του Bayes μπορείτε... ... Wikipedia

    Bayes, Thomas Thomas Bayes Reverend Thomas Bayes Ημερομηνία γέννησης: 1702 (1702) Τόπος γέννησης ... Wikipedia

    Thomas Bayes Reverend Thomas Bayes Ημερομηνία γέννησης: 1702 Τόπος γέννησης: Λονδίνο ... Wikipedia

    Το συμπέρασμα Bayes είναι μια από τις μεθόδους στατιστικής εξαγωγής συμπερασμάτων στην οποία ο τύπος του Bayes χρησιμοποιείται για να βελτιώσει τις πιθανολογικές εκτιμήσεις της αλήθειας των υποθέσεων όταν λαμβάνονται στοιχεία. Η χρήση της Bayesian ενημέρωσης είναι ιδιαίτερα σημαντική στη... ... Wikipedia

    Για να βελτιώσετε αυτό το άρθρο, είναι επιθυμητό;: Βρείτε και τακτοποιήστε με τη μορφή υποσημειώσεων συνδέσμους σε έγκυρες πηγές που επιβεβαιώνουν όσα έχουν γραφτεί. Αφού προσθέσετε υποσημειώσεις, δώστε πιο ακριβείς ενδείξεις για τις πηγές. Περέ... Βικιπαίδεια

    Οι κρατούμενοι θα προδίδουν ο ένας τον άλλον ακολουθώντας τα εγωιστικά τους συμφέροντα ή θα παραμείνουν σιωπηλοί, ελαχιστοποιώντας έτσι τη συνολική ποινή; Το δίλημμα του κρατούμενου

Βιβλία

  • Θεωρία πιθανοτήτων και μαθηματικές στατιστικές σε προβλήματα: Περισσότερα από 360 προβλήματα και ασκήσεις, Borzykh D.. Το προτεινόμενο εγχειρίδιο περιέχει προβλήματα διαφόρων επιπέδων πολυπλοκότητας. Ωστόσο, η κύρια έμφαση δίνεται σε εργασίες μέτριας πολυπλοκότητας. Αυτό γίνεται σκόπιμα για να ενθαρρύνει τους μαθητές να...
Φόρμουλα Bayes:

Οι πιθανότητες P(H i) των υποθέσεων H i ονομάζονται a priori πιθανότητες - πιθανότητες πριν από τη διεξαγωγή πειραμάτων.
Οι πιθανότητες P(A/H i) ονομάζονται μεταγενέστερες πιθανότητες - οι πιθανότητες των υποθέσεων H i, που εξευγενίζονται ως αποτέλεσμα της εμπειρίας.

Παράδειγμα Νο. 1. Η συσκευή μπορεί να συναρμολογηθεί από εξαρτήματα υψηλής ποιότητας και από εξαρτήματα συνήθους ποιότητας. Περίπου το 40% των συσκευών συναρμολογούνται από εξαρτήματα υψηλής ποιότητας. Εάν η συσκευή συναρμολογείται από εξαρτήματα υψηλής ποιότητας, η αξιοπιστία της (πιθανότητα λειτουργίας χωρίς αστοχία) με το χρόνο t είναι 0,95. εάν είναι κατασκευασμένο από εξαρτήματα συνήθους ποιότητας, η αξιοπιστία του είναι 0,7. Η συσκευή δοκιμάστηκε για χρόνο t και λειτούργησε άψογα. Βρείτε την πιθανότητα να είναι κατασκευασμένο από ανταλλακτικά υψηλής ποιότητας.
Λύση.Δύο υποθέσεις είναι δυνατές: H 1 - η συσκευή συναρμολογείται από εξαρτήματα υψηλής ποιότητας. H 2 - η συσκευή συναρμολογείται από μέρη συνήθους ποιότητας. Οι πιθανότητες αυτών των υποθέσεων πριν από το πείραμα: P(H 1) = 0,4, P(H 2) = 0,6. Ως αποτέλεσμα του πειράματος, παρατηρήθηκε το γεγονός Α - η συσκευή λειτούργησε άψογα για το χρόνο t. Οι υπό όρους πιθανότητες αυτού του γεγονότος στις υποθέσεις H 1 και H 2 είναι ίσες: P(A|H 1) = 0,95; Ρ(Α|Η2) = 0,7. Χρησιμοποιώντας τον τύπο (12), βρίσκουμε την πιθανότητα της υπόθεσης H 1 μετά το πείραμα:

Παράδειγμα Νο. 2. Δύο σκοπευτές, ανεξάρτητα ο ένας από τον άλλο, πυροβολούν σε έναν στόχο, ο καθένας εκτοξεύει μία βολή. Η πιθανότητα να χτυπήσει το στόχο για τον πρώτο σκοπευτή είναι 0,8, για τον δεύτερο είναι 0,4. Μετά τη βολή, βρέθηκε μια τρύπα στον στόχο. Υποθέτοντας ότι δύο σκοπευτές δεν μπορούν να χτυπήσουν το ίδιο σημείο, βρείτε την πιθανότητα ο πρώτος σκοπευτής να χτυπήσει τον στόχο.
Λύση.Αφήστε το συμβάν Α - μετά τη βολή, ανιχνεύεται μία τρύπα στον στόχο. Πριν ξεκινήσουν τα γυρίσματα, είναι πιθανές οι υποθέσεις:
H 1 - ούτε ο πρώτος ούτε ο δεύτερος σκοπευτής θα χτυπήσει, η πιθανότητα αυτής της υπόθεσης: P(H 1) = 0,2 · 0,6 = 0,12.
H 2 - και οι δύο σουτέρ θα χτυπήσουν, P(H 2) = 0,8 · 0,4 = 0,32.
H 3 - ο πρώτος σκοπευτής θα χτυπήσει, αλλά ο δεύτερος δεν θα χτυπήσει, P(H 3) = 0,8 · 0,6 = 0,48.
H 4 - ο πρώτος σκοπευτής δεν θα χτυπήσει, αλλά ο δεύτερος θα χτυπήσει, P (H 4) = 0,2 · 0,4 = 0,08.
Οι υπό όρους πιθανότητες του γεγονότος Α σε αυτές τις υποθέσεις είναι ίσες:

Μετά το πείραμα, οι υποθέσεις H 1 και H 2 γίνονται αδύνατες και οι πιθανότητες των υποθέσεων H 3 και H 4
θα είναι ίσα:


Άρα, το πιθανότερο είναι ότι ο στόχος χτυπήθηκε από τον πρώτο σκοπευτή.

Παράδειγμα Νο. 3. Στο κατάστημα εγκατάστασης, ένας ηλεκτροκινητήρας είναι συνδεδεμένος στη συσκευή. Οι ηλεκτρικοί κινητήρες παρέχονται από τρεις κατασκευαστές. Σε απόθεμα υπάρχουν ηλεκτροκινητήρες από τα επονομαζόμενα εργοστάσια, αντίστοιχα, σε ποσότητες 19,6 και 11 τεμαχίων, οι οποίοι μπορούν να λειτουργήσουν χωρίς βλάβη μέχρι το τέλος της περιόδου εγγύησης, αντίστοιχα, με πιθανότητες 0,85, 0,76 και 0,71 αντίστοιχα. Ένας εργαζόμενος παίρνει έναν κινητήρα τυχαία και τον τοποθετεί στη συσκευή. Βρείτε την πιθανότητα ένας ηλεκτροκινητήρας που έχει εγκατασταθεί και λειτουργεί χωρίς βλάβη μέχρι το τέλος της περιόδου εγγύησης να έχει προμηθευτεί από τον πρώτο, δεύτερο ή τρίτο κατασκευαστή, αντίστοιχα.
Λύση.Η πρώτη δοκιμή είναι η επιλογή του ηλεκτροκινητήρα, η δεύτερη είναι η λειτουργία του ηλεκτροκινητήρα κατά τη διάρκεια της περιόδου εγγύησης. Εξετάστε τα ακόλουθα γεγονότα:
A - ο ηλεκτροκινητήρας λειτουργεί χωρίς βλάβη μέχρι το τέλος της περιόδου εγγύησης.
H 1 - ο εγκαταστάτης θα πάρει τον κινητήρα από την παραγωγή του πρώτου εργοστασίου.
H 2 - ο εγκαταστάτης θα πάρει τον κινητήρα από την παραγωγή του δεύτερου εργοστασίου.
H 3 - ο εγκαταστάτης θα πάρει τον κινητήρα από την παραγωγή του τρίτου εργοστασίου.
Η πιθανότητα του συμβάντος Α υπολογίζεται χρησιμοποιώντας τον τύπο συνολικής πιθανότητας:

Οι υπό όρους πιθανότητες καθορίζονται στη δήλωση προβλήματος:

Ας βρούμε τις πιθανότητες


Χρησιμοποιώντας τους τύπους Bayes (12), υπολογίζουμε τις υπό όρους πιθανότητες των υποθέσεων H i:

Παράδειγμα αρ. 4. Οι πιθανότητες κατά τη λειτουργία ενός συστήματος που αποτελείται από τρία στοιχεία, τα στοιχεία με αριθμό 1, 2 και 3 να αποτύχουν είναι στην αναλογία 3: 2: 5. Οι πιθανότητες ανίχνευσης αστοχιών αυτών των στοιχείων είναι ίσες με 0,95, αντίστοιχα. 0,9 και 0,6.

β) Υπό τις συνθήκες αυτής της εργασίας, εντοπίστηκε βλάβη κατά τη λειτουργία του συστήματος. Ποιο στοιχείο πιθανότατα απέτυχε;

Λύση.
Αφήστε το Α να είναι ένα γεγονός αποτυχίας. Ας εισαγάγουμε ένα σύστημα υποθέσεων H1 - αποτυχία του πρώτου στοιχείου, H2 - αποτυχία του δεύτερου στοιχείου, H3 - αποτυχία του τρίτου στοιχείου.
Βρίσκουμε τις πιθανότητες των υποθέσεων:
Ρ(Η1) = 3/(3+2+5) = 0,3
Ρ(Η2) = 2/(3+2+5) = 0,2
Ρ(Η3) = 5/(3+2+5) = 0,5

Σύμφωνα με τις συνθήκες του προβλήματος, οι υπό όρους πιθανότητες του γεγονότος Α είναι ίσες με:
P(A|H1) = 0,95, P(A|H2) = 0,9, P(A|H3) = 0,6

α) Βρείτε την πιθανότητα ανίχνευσης βλάβης στο σύστημα.
P(A) = P(H1)*P(A|H1) + P(H2)*P(A|H2) + P(H3)*P(A|H3) = 0,3*0,95 + 0,2*0,9 + 0,5 *0,6 = 0,765

β) Υπό τις συνθήκες αυτής της εργασίας, εντοπίστηκε βλάβη κατά τη λειτουργία του συστήματος. Ποιο στοιχείο πιθανότατα απέτυχε;
P1 = P(H1)*P(A|H1)/ P(A) = 0,3*0,95 / 0,765 = 0,373
P2 = P(H2)*P(A|H2)/ P(A) = 0,2*0,9 / 0,765 = 0,235
P3 = P(H3)*P(A|H3)/ P(A) = 0,5*0,6 / 0,765 = 0,392

Το τρίτο στοιχείο έχει τη μέγιστη πιθανότητα.

Κρατικό Πανεπιστήμιο Τηλεπικοινωνιών και Πληροφορικής της Σιβηρίας

Τμήμα Ανωτάτων Μαθηματικών

στον κλάδο: «Θεωρία Πιθανοτήτων και Μαθηματική Στατιστική»

«Ο τύπος της συνολικής πιθανότητας και ο τύπος του Bayes (Bayes) και η εφαρμογή τους»

Ολοκληρώθηκε το:

Επικεφαλής: Καθηγητής B.P. Zelentsov

Νοβοσιμπίρσκ, 2010


Εισαγωγή 3

1. Τύπος συνολικής πιθανότητας 4-5

2. Φόρμουλα Bayes (Bayes) 5-6

3. Προβλήματα με λύσεις 7-11

4. Οι κύριοι τομείς εφαρμογής του τύπου Bayes (Bayes) 11

Συμπέρασμα 12

Λογοτεχνία 13


Εισαγωγή

Η θεωρία πιθανοτήτων είναι ένας από τους κλασικούς κλάδους των μαθηματικών. Έχει μακρά ιστορία. Τα θεμέλια αυτού του κλάδου της επιστήμης τέθηκαν από μεγάλους μαθηματικούς. Θα ονομάσω, για παράδειγμα, Fermat, Bernoulli, Pascal.
Αργότερα, η ανάπτυξη της θεωρίας πιθανοτήτων προσδιορίστηκε στα έργα πολλών επιστημόνων.
Οι επιστήμονες από τη χώρα μας συνέβαλαν πολύ στη θεωρία των πιθανοτήτων:
P.L.Chebyshev, A.M.Lyapunov, A.A.Markov, A.N.Kolmogorov. Οι πιθανοτικές και στατιστικές μέθοδοι έχουν πλέον διεισδύσει βαθιά στις εφαρμογές. Χρησιμοποιούνται στη φυσική, την τεχνολογία, την οικονομία, τη βιολογία και την ιατρική. Ο ρόλος τους έχει αυξηθεί ιδιαίτερα σε σχέση με την ανάπτυξη της τεχνολογίας των υπολογιστών.

Για παράδειγμα, για τη μελέτη φυσικών φαινομένων, γίνονται παρατηρήσεις ή πειράματα. Τα αποτελέσματά τους καταγράφονται συνήθως με τη μορφή τιμών ορισμένων παρατηρήσιμων ποσοτήτων. Όταν επαναλαμβάνουμε πειράματα, ανακαλύπτουμε μια διασπορά των αποτελεσμάτων τους. Για παράδειγμα, επαναλαμβάνοντας μετρήσεις της ίδιας ποσότητας με την ίδια συσκευή διατηρώντας ορισμένες συνθήκες (θερμοκρασία, υγρασία κ.λπ.), λαμβάνουμε αποτελέσματα που είναι τουλάχιστον ελαφρώς διαφορετικά μεταξύ τους. Ακόμη και οι επαναλαμβανόμενες μετρήσεις δεν καθιστούν δυνατή την ακριβή πρόβλεψη του αποτελέσματος της επόμενης μέτρησης. Με αυτή την έννοια, λένε ότι το αποτέλεσμα μιας μέτρησης είναι μια τυχαία μεταβλητή. Ένα ακόμη πιο προφανές παράδειγμα τυχαίας μεταβλητής είναι ο αριθμός ενός κερδισμένου δελτίου σε μια λοταρία. Πολλά άλλα παραδείγματα τυχαίων μεταβλητών μπορούν να δοθούν. Ωστόσο, στον κόσμο της τύχης, αποκαλύπτονται ορισμένα πρότυπα. Η μαθηματική συσκευή για τη μελέτη τέτοιων προτύπων παρέχεται από τη θεωρία πιθανοτήτων.
Έτσι, η θεωρία πιθανοτήτων ασχολείται με τη μαθηματική ανάλυση τυχαίων γεγονότων και σχετικών τυχαίων μεταβλητών.

1. Τύπος συνολικής πιθανότητας.

Ας υπάρξει μια ομάδα εκδηλώσεων H 1 ,H 2 ,..., Hn, με τις ακόλουθες ιδιότητες:

1) όλα τα συμβάντα είναι ασύμβατα κατά ζεύγη: Γεια

Hj =Æ; Εγώ , ι =1,2,...,n ; Εγώ ¹ ι ;

2) η ένωσή τους σχηματίζει το χώρο των στοιχειωδών αποτελεσμάτων W:

.
Εικ.8

Σε αυτή την περίπτωση θα πούμε ότι H 1 , H 2 ,...,Hnμορφή πλήρη ομάδα εκδηλώσεων. Τέτοια γεγονότα ονομάζονται μερικές φορές υποθέσεις .

Αφήνω ΕΝΑ- κάποια εκδήλωση: ΕΝΑÌW (Το διάγραμμα Venn φαίνεται στο Σχήμα 8). Μετά κρατάει τύπος συνολικής πιθανότητας:

Π (ΕΝΑ) = Π (ΕΝΑ /H 1)Π (H 1) + Π (ΕΝΑ /H 2)Π (H 2) + ...+Π (ΕΝΑ /Hn)Π (Hn) =

Απόδειξη. Προφανώς: Α=

και όλες οι εκδηλώσεις ( Εγώ = 1,2,...,n) είναι ασύμβατα κατά ζεύγη. Από εδώ, χρησιμοποιώντας το θεώρημα της πρόσθεσης των πιθανοτήτων, προκύπτει

Π (ΕΝΑ) = Π (

) + Π () +...+ Π (

Αν λάβουμε υπόψη ότι με το θεώρημα του πολλαπλασιασμού Π (

) = Π (A/HΕγώ) Π (HΕγώ) ( Εγώ = 1,2,...,n), τότε από τον τελευταίο τύπο είναι εύκολο να ληφθεί ο παραπάνω τύπος συνολικής πιθανότητας.

Παράδειγμα. Το κατάστημα πουλά ηλεκτρικούς λαμπτήρες που παράγονται από τρία εργοστάσια, με το μερίδιο του πρώτου εργοστασίου να είναι 30%, το δεύτερο να είναι 50% και το τρίτο να είναι 20%. Τα ελαττώματα στα προϊόντα τους είναι 5%, 3% και 2%, αντίστοιχα. Ποια είναι η πιθανότητα μια τυχαία επιλεγμένη λάμπα σε ένα κατάστημα να αποδειχθεί ελαττωματική;

Αφήστε το γεγονός H 1 είναι ότι η επιλεγμένη λάμπα παράγεται στο πρώτο εργοστάσιο, H 2 στο δεύτερο, H 3 - στο τρίτο εργοστάσιο. Προφανώς:

Π (H 1) = 3/10, Π (H 2) = 5/10, Π (H 3) = 2/10.

Αφήστε το γεγονός ΕΝΑείναι ότι η επιλεγμένη λάμπα αποδείχθηκε ελαττωματική. A/H iσημαίνει το γεγονός που επιλέγεται ένας ελαττωματικός λαμπτήρας από λαμπτήρες που παράγονται στις Εγώ-ο φυτό. Από τη δήλωση προβλήματος προκύπτει:

Π (ΕΝΑ / H 1) = 5/10; Π (ΕΝΑ / H 2) = 3/10; Π (ΕΝΑ / H 3) = 2/10

Χρησιμοποιώντας τον τύπο συνολικής πιθανότητας παίρνουμε

2. Φόρμουλα Bayes (Bayes)

Αφήνω H 1 ,H 2 ,...,Hn- μια πλήρη ομάδα εκδηλώσεων και ΕΝΑМ W – κάποιο συμβάν. Στη συνέχεια, σύμφωνα με τον τύπο για την υπό όρους πιθανότητα

(1)

Εδώ Π (Hk /ΕΝΑ) – υπό όρους πιθανότητα ενός γεγονότος (υπόθεση) Hkή την πιθανότητα ότι Hkυλοποιείται εφόσον η εκδήλωση ΕΝΑσυνέβη.

Σύμφωνα με το θεώρημα του πολλαπλασιασμού πιθανοτήτων, ο αριθμητής του τύπου (1) μπορεί να αναπαρασταθεί ως

Π = Π = Π (ΕΝΑ /Hk)Π (Hk)

Για να αναπαραστήσετε τον παρονομαστή του τύπου (1), μπορείτε να χρησιμοποιήσετε τον τύπο συνολικής πιθανότητας

Π (ΕΝΑ)

Τώρα από το (1) μπορούμε να λάβουμε έναν τύπο που ονομάζεται Φόρμουλα Bayes :

Ο τύπος του Bayes υπολογίζει την πιθανότητα να πραγματοποιηθεί η υπόθεση Hkυπό την προϋπόθεση ότι η εκδήλωση ΕΝΑσυνέβη. Ο τύπος του Bayes ονομάζεται επίσης τύπος για την πιθανότητα των υποθέσεων.Πιθανότητα Π (Hk) ονομάζεται προηγούμενη πιθανότητα της υπόθεσης Hkκαι η πιθανότητα Π (Hk /ΕΝΑ) – μεταγενέστερη πιθανότητα.

Θεώρημα. Η πιθανότητα μιας υπόθεσης μετά τη δοκιμή είναι ίση με το γινόμενο της πιθανότητας της υπόθεσης πριν από τη δοκιμή και την αντίστοιχη υπό όρους πιθανότητα του γεγονότος που συνέβη κατά τη διάρκεια της δοκιμής, διαιρούμενη με τη συνολική πιθανότητα αυτού του γεγονότος.

Παράδειγμα.Ας εξετάσουμε το παραπάνω πρόβλημα σχετικά με τους ηλεκτρικούς λαμπτήρες, απλώς αλλάξτε την ερώτηση του προβλήματος. Ας υποθέσουμε ότι ένας πελάτης αγόρασε μια ηλεκτρική λάμπα σε αυτό το κατάστημα και αποδείχθηκε ότι ήταν ελαττωματική. Βρείτε την πιθανότητα αυτή η λάμπα να κατασκευάστηκε στο δεύτερο εργοστάσιο. Μέγεθος Π (H 2) = 0,5 σε αυτή την περίπτωση είναι η a priori πιθανότητα του γεγονότος ότι ο λαμπτήρας που αγοράσατε κατασκευάστηκε στο δεύτερο εργοστάσιο. Έχοντας λάβει πληροφορίες ότι ο λαμπτήρας που αγοράσαμε είναι ελαττωματικός, μπορούμε να διορθώσουμε την εκτίμησή μας σχετικά με τη δυνατότητα κατασκευής αυτού του λαμπτήρα στο δεύτερο εργοστάσιο, υπολογίζοντας την μετέπειτα πιθανότητα αυτού του συμβάντος.

Κατά την εξαγωγή του τύπου για τη συνολική πιθανότητα, θεωρήθηκε ότι οι πιθανότητες των υποθέσεων ήταν γνωστές πριν από το πείραμα. Ο τύπος του Bayes επιτρέπει την επαναξιολόγηση των αρχικών υποθέσεων υπό το φως νέων πληροφοριών, δηλαδή ότι ένα γεγονός συνέβη. Επομένως, ο τύπος του Bayes ονομάζεται τύπος βελτίωσης της υπόθεσης.

Θεώρημα (Formula Bayes). Αν η εκδήλωση μπορεί να συμβεί μόνο με μία από τις υποθέσεις
, τα οποία αποτελούν μια πλήρη ομάδα γεγονότων, τότε η πιθανότητα των υποθέσεων υπό την προϋπόθεση ότι το γεγονός συνέβη, υπολογίζεται με τον τύπο

,
.

Απόδειξη.

Ο τύπος του Bayes ή η Bayesian προσέγγιση για την αξιολόγηση υποθέσεων παίζει σημαντικό ρόλο στα οικονομικά γιατί καθιστά δυνατή τη διόρθωση αποφάσεων διαχείρισης, εκτιμήσεων άγνωστων παραμέτρων κατανομής των χαρακτηριστικών που μελετώνται στη στατιστική ανάλυση κ.λπ.

Παράδειγμα. Οι ηλεκτρικοί λαμπτήρες κατασκευάζονται σε δύο εργοστάσια. Το πρώτο εργοστάσιο παράγει το 60% του συνολικού αριθμού ηλεκτρικών λαμπτήρων, το δεύτερο - 40%. Τα προϊόντα του πρώτου εργοστασίου περιέχουν 70% τυπικών λαμπτήρων, το δεύτερο - 80%. Το κατάστημα παραλαμβάνει προϊόντα και από τα δύο εργοστάσια. Ο λαμπτήρας που αγοράστηκε στο κατάστημα αποδείχθηκε στάνταρ. Βρείτε την πιθανότητα η λάμπα να κατασκευάστηκε στο πρώτο εργοστάσιο.

Ας γράψουμε την κατάσταση του προβλήματος, εισάγοντας την κατάλληλη σημείωση.

Δεδομένος: Εκδήλωση είναι ότι η λάμπα είναι στάνταρ.

Υπόθεση
είναι ότι η λάμπα κατασκευάστηκε στο πρώτο εργοστάσιο

Υπόθεση
είναι ότι η λάμπα κατασκευάστηκε σε δεύτερο εργοστάσιο

Εύρημα
.

Λύση.

5. Επαναλαμβανόμενες ανεξάρτητες δοκιμές. Ο τύπος του Bernoulli

Ας δούμε το διάγραμμα ανεξάρτητα τεστή Σχέδιο Bernoulli, που έχει σημαντική επιστημονική σημασία και ποικίλες πρακτικές εφαρμογές.

Αφήστε το να παραχθεί ανεξάρτητες δοκιμές, σε καθεμία από τις οποίες μπορεί να συμβεί κάποιο συμβάν .

Ορισμός. Δοκιμές λέγονταιανεξάρτητος , αν σε καθένα από αυτά υπάρχει ένα γεγονός

, ανεξάρτητα από το αν το συμβάν εμφανίστηκε ή όχι
σε άλλες δοκιμές.

Παράδειγμα. Στον πάγκο δοκιμών τοποθετήθηκαν 20 λαμπτήρες πυρακτώσεως, οι οποίοι δοκιμάστηκαν υπό φορτίο για 1000 ώρες. Η πιθανότητα η λάμπα να περάσει τη δοκιμή είναι 0,8 και είναι ανεξάρτητη από το τι συνέβη με τις άλλες λάμπες.

Σε αυτό το παράδειγμα, η δοκιμή αναφέρεται στον έλεγχο της ικανότητας της λάμπας να αντέχει το φορτίο για 1000 ώρες. Επομένως, ο αριθμός των δοκιμών είναι ίσος με
. Σε κάθε μεμονωμένη δοκιμή, μόνο δύο αποτελέσματα είναι δυνατά:


Ορισμός. Μια σειρά από επαναλαμβανόμενες ανεξάρτητες δοκιμές, σε καθεμία από τις οποίες ένα γεγονός
συμβαίνει με την ίδια πιθανότητα
, ανεξάρτητα από τον αριθμό δοκιμής, καλείται
Σχέδιο Bernoulli.

Πιθανότητα αντίθετου γεγονότος δείχνω
και, όπως αποδείχθηκε παραπάνω,

Θεώρημα. Υπό τις συνθήκες του σχήματος Bernoulli, η πιθανότητα ότι στο εκδήλωση ανεξάρτητης δοκιμής θα εμφανιστει
φορές, που καθορίζεται από τον τύπο

Οπου
αριθμός ανεξάρτητων δοκιμών που πραγματοποιήθηκαν·

αριθμός των περιστατικών του συμβάντος
;

πιθανότητα να συμβεί ένα γεγονός
σε χωριστή δίκη?

πιθανότητα να μην συμβεί ένα γεγονός
σε χωριστή δίκη?



Έχετε ερωτήσεις;

Αναφέρετε ένα τυπογραφικό λάθος

Κείμενο που θα σταλεί στους συντάκτες μας: