פרדוקס יום ההולדת

תוצאה בתורת ההסתברות

פרדוקס יום ההולדת הוא שמה של תוצאה בתורת ההסתברות לפיה בקבוצה של 23 אנשים או יותר, שנבחרו באקראי, הסיכוי לכך שלפחות שניים מהם נולדו באותו יום בשנה עולה על 50%. תוצאה זו אינה פרדוקס במובן המקובל של המילה, שכן אין בה סתירה לוגית, אך היא סותרת את האינטואיציה של מרבית האנשים, הסבורים כי ההסתברות תהיה קטנה בהרבה מחצי משום שמספר הימים שבהם אפשר להיוולד (365) גדול בהרבה מ-23.

ההסתברות לכך ששני אנשים בקבוצה נולדו באותו יום בשנה, כפונקציה של גודל הקבוצה

תוצאה זו היא מקרה פרטי של עובדה כללית יותר, שיש לה חשיבות רבה ביישומים של תורת ההסתברות, ובפרט בהתקפת יום הולדת בקריפטוגרפיה: אם בוחרים ערכים בעלי סיכוי שווה מבין אפשרויות, אז החזרות הראשונות תופענה כבר כאשר מספר הערכים הוא מסדר גודל של .

פרדוקס יום ההולדת תואר לראשונה במאמר על ידי הסטטיסטיקאי ריצ'רד פון מיזס ב-1939, אם כי סביר להניח שגרסאות קודמות של הבעיה היו ידועות ונחקרו על ידי מתמטיקאים אחרים. הפרדוקס היה נושא למחקר ודיונים רבים בתחומי ההסתברות והסטטיסטיקה, ויש לו יישומים רבים במדעי המחשב, בקריפטוגרפיה ובתחומים נוספים.

תיאור התופעה

עריכה

פרדוקס יום ההולדת עוסק בסדרה של ערכים אקראיים המוגרלים ממרחב סופי. במקרה של ימי הולדת, הערכים האפשריים הם 365 ימי השנה. בניתוח התופעה נניח שהאוכלוסייה מפוזרת באופן אחיד בין ימי ההולדת האפשריים. לבסוף, מניחים שתאריכי הלידה של האנשים שנבחרו בלתי תלויים זה בזה – הפרדוקס מאבד את עוקצו אם בין הנבחרים זוג תאומים.

כדי להבטיח שני אנשים שנולדו באותו יום, יש לבחור לפחות 366 אנשים – זהו עקרון שובך היונים. אולם, הדרישה הסטטיסטית להימנע מימי הולדת משותפים הולכת ומכבידה. בבחירה של 23 הסיכוי שכל ימי ההולדת שונים יורד ל-49.3%, בבחירה של 41 אנשים הסיכוי שכל ימי ההולדת שונים הוא 9.7%, וסיכוי זה יורד אל מתחת לאחוז אחד כאשר בוחרים 57 אנשים.

ניתוח מפורט

עריכה

את תופעת יום ההולדת, או החֲזרה בבחירה מתוך מרחב גדול בעל התפלגות אחידה, אפשר לנתח משלוש זוויות שונות, המביאות, בקירוב, לאותה מסקנה. נניח שזורקים   כדורים באקראי ל-  תאים, שההסתברות ליפול לכל אחד מהם שווה.

מספר ההתנגשויות

עריכה

אפשר להתייחס לכל זוג כדורים כאל ניסוי עצמאי. הסיכוי שזוג הכדורים   ייפלו לאותו תא הוא בדיוק  , ולכן, כשעוברים על פני כל   הזוגות, התוחלת של מספר הזוגות שיפלו לאותו תא שווה ל-  . כל עוד מספר הכדורים   הוא קטן, התוחלת קטנה מ-1 ולכן אפשר להניח שלא תהיה אף התנגשות אחת. התוחלת של מספר ההתנגשויות עולה ל-1 כאשר  .

ההסתברות לאי-חזרה

עריכה

את התנאי לחוסר חזרה אפשר להבין כך: הכדור הראשון אינו מוגבל. הכדור השני יכול ליפול לאחד מבין   תאים, כדי לא לפגוע בראשון; הסיכוי לכך בזריקה אקראית הוא  . הכדור השלישי צריך ליפול לאחד מבין   התאים שנותרו לאחר פסילת שני התאים הראשונים, והסיכוי לכך הוא  ; וכן הלאה. לאחר שנזרקו   כדורים שנכנסו כולם לתאים שונים, הסיכוי לכך שגם הכדור הבא ייפול לתא משלו הוא  .

אם כך, ההסתברות לכך ש-   הכדורים הראשונים יפלו לתאים שונים, ללא התנגשות, שווה למכפלה  . כדי להעריך מספר זה, אפשר להיעזר בחסם   (הנובע מפיתוח פונקציית האקספוננט לטור טיילור, ותקף לכל  ). לפי חסם זה,  , ובקירוב,  . הסיכוי לאי-חזרה יורד לחצי, אם-כן, כאשר  . ככל שהיחס   גדול יותר כך הסיכוי לאי-חזרה קטן יותר, ובסימון אסימפטוטי: עבור   ההסתברות לאי חזרה היא  . מצד שני, לא קשה להראות שאם   אז ההסתברות היא  .

זמן ההמתנה להתנגשות הראשונה

עריכה

נסמן ב-   את המשתנה המקרי הסופר כמה כדורים נזרקו, באקראי, עד להתנגשות הראשונה. זהו משתנה העשוי לקבל כל ערך שלם מ-   ועד  . ידוע שהתוחלת של משתנה כזה שווה לסכום ההסתברויות  , שאותו אפשר להעריך בעזרת אינטגרל מתאים. התוצאה מחישוב מדויק היא שכאשר   גדול, תוחלת זמן ההמתנה עד להתנגשות הראשונה היא  .

קישורים חיצוניים

עריכה
  מדיה וקבצים בנושא פרדוקס יום ההולדת בוויקישיתוף

ביאורים

עריכה