מבחן כי בריבוע
מִבְחַן כִי בָּרִבּוּעַ (, נהגה בכ' רפה, לעיתים נכתב חי בריבוע) הוא למעשה אוסף של מבחנים סטטיסטיים שמטרתם לבדוק את טיב ההתאמה של מודל התפלגותי לנתונים איכותיים או בדידים. המשותף לכל המבחנים האלה הוא שההתפלגות של סטטיסטי המבחן היא התפלגות כי בריבוע (במדויק או בקירוב). מבחנים אלה משמשים גם כבסיס למגוון מקדמי קשר (או מתאם), כגון מקדם הקשר של קראמר.
השם "כי בריבוע" מקורו באות היוונית , כי.
היסטוריה
עריכהלאחר שקרל פירסון פיתח את המדד הידוע כ-"מתאם פירסון" למדידת עוצמת הקשר בין משתנים כמותיים, הוא פנה לפיתוח מקדם דומה למדידת הקשר בין שני משתנים איכותיים (קטגוריים), שנתוניהם מוצגים בלוח שכיחות דו־ממדי. בשנת 1900 הציג את סטטיסטי כי-בריבוע, שמבטא רעיון דומה לרעיון של מקדם המתאם.[1] בעוד שמקדם המתאם התבסס על ההפרשים בין התצפיות והממוצע שלהן. סטטיסטי כי בריבוע מבוסס על ההפרש בין מספר התצפיות בתא מסוים בלוח השכיחות הדו־ממדי, והמספר הצפוי של התצפיות באותו תא בהנחה כי יש אי תלות בין משתנים. פירסון הראה כי ההתפלגות האסימפטוטית של המדד שפיתח היא אכן התפלגות כי בריבוע, ומכאן שמו של המדד.
תוחלת | 1σ | 1.28 | 1.64 | 1.96 | 2σ | 2.58 | 3σ | 3.29 | 4σ |
---|---|---|---|---|---|---|---|---|---|
רמת סמך CI | 68.3% | 80% | 90% | 95% | 95.45% | 99% | 99.73% | 99.9% | 99.99% |
ערך-p רמת מובהקות |
0.317 | 0.20 | 0.10 | 0.05 | 0.0455 | 0.01 | 0.0027 | 0.001 | 0.00006 |
k=1 | 1.00 | 1.64 | 2.71 | 3.84 | 4.00 | 6.63 | 9.00 | 10.83 | 16.00 |
k=2 | 2.30 | 3.22 | 4.61 | 5.99 | 6.18 | 9.21 | 11.83 | 13.82 | 19.33 |
k=3 | 3.53 | 4.64 | 6.25 | 7.81 | 8.02 | 11.34 | 14.16 | 16.27 | 22.06 |
k=4 | 4.72 | 5.99 | 7.78 | 9.49 | 9.72 | 13.28 | 16.25 | 18.47 | 24.50 |
k=5 | 5.89 | 7.29 | 9.24 | 11.07 | 11.31 | 15.09 | 18.21 | 20.52 | 26.77 |
k=6 | 7.04 | 8.56 | 10.64 | 12.59 | 12.85 | 16.81 | 20.06 | 22.46 | 28.91 |
k=7 | 8.18 | 9.80 | 12.02 | 14.07 | 14.34 | 18.48 | 21.85 | 24.32 | 30.96 |
k=8 | 9.30 | 11.03 | 13.36 | 15.51 | 15.79 | 20.09 | 23.57 | 26.12 | 32.93 |
k=9 | 10.42 | 12.24 | 14.68 | 16.92 | 17.21 | 21.67 | 25.26 | 27.88 | 34.85 |
k=10 | 11.54 | 13.44 | 15.99 | 18.31 | 18.61 | 23.21 | 26.90 | 29.59 | 36.72 |
תאוריה
עריכהמבחן כי בריבוע לבדיקת השערת אי תלות
עריכהיהיו ו- שני משתנים איכותיים (כלומר נמדדים בסולם מדידה שמי או סודר). נסמן את הערכים שהמשתנה יכול לקבל ב- ואת הערכים שהמשתנה יכול לקבל ב- .
בהינתן מדגם בגודל , נסמן ב- את מספר התצפיות במדגם עבורן ו- .
אם ו- הם משתנים בלתי תלויים הרי שמתקיים לכל ולכל . תחת הנחה זו, ניתן לאמוד את הערך הצפוי של מספר התצפיות עבורן ו- , שנסמן ב- על ידי:
כאשר
- הוא גודל המדגם
- הוא מספר התצפיות עבורן
- הוא מספר התצפיות עבורן
סטטיסטי כי בריבוע לבדיקת ההשערה כי ו- הם בלתי תלויים מוגדר כ-
והתפלגותו האסימפטוטית היא התפלגות כי בריבוע עם דרגות חופש.
השערת אי התלות תידחה אם הערך המחושב של גדול מערך קריטי הנקבע על פי רמת המובהקות α שנקבעה מראש, או אם ערך ה-p המחושב קטן מרמת המובהקות הזו.
מבחן כי בריבוע לבדיקת טיב ההתאמה של מודל מולטינומי
עריכהיהי משתנה איכותי שיכול לקבל את הערכים . התפלגותו של היא התפלגות מולטינומית. נסמן .
בהינתן מדגם בגודל , נסמן ב- את מספר התצפיות במדגם עבורן .
מודל מולטינומי עבור הוא מפרט (ספציפיקציה) של על ידי פרמטר (שיכול להיות גם וקטור של פרמטרים, או וקטור ממימד 0, כלומר מפרט אי פרמטרי). בהינתן המודל , ניתן לאמוד את , ובעזרת אמדן זה אפשר לאמוד את הערך הצפוי של מספר התצפיות עבורן , שנסמן ב- , על ידי .
סטטיסטי כי בריבוע לבדיקת ההשערה כי המודל מתאים לנתונים מוגדר כ- , והתפלגותו האסימפטוטית היא התפלגות כי בריבוע עם דרגות חופש.
מבחן כי בריבוע לבדיקת השערת אי התלות בין שני משתנים הוא מקרה פרטי של מבחן כי בריבוע לבדיקת טיב ההתאמה של מודל מולטינומי.
מבחן יחס הנראות
עריכהמבחן כי בריבוע לבדיקת השערת אי התלות פותח על ידי פירסון תוך שימוש בשיקולי מומנטים. עם זאת, ניתן לבדוק את השערת אי התלות בפרט, ואת טיב ההתאמה של מודל מולטינומי בכלל, על ידי שימוש במבחן יחס הנראות, על פי הלמה של ניימן ופירסון. סטטיסטי מבחן יחס הנראות שונה מסטטיסטי מבחן כי בריבוע, אך שני המבחנים שקולים אסימפטוטית.
מבחן יחס הנראות לבדיקת השערת אי התלות הוא והתפלגותו האסימפטוטית היא התפלגות כי בריבוע עם דרגות חופש.
באופן דומה, מבחן יחס הנראות לבדיקת טיב ההתאמה של מודל מולטינומי הוא , והתפלגותו האסימפטוטית היא התפלגות כי בריבוע עם דרגות חופש.
ניתן להראות כי סטטיסטי הוא קירוב של סטטיסטי על ידי פיתוח טור טיילור של פונקציית הלוגריתם הטבעי סביב 1 והשמטת האיברים מסדר 3 ומעלה.
דוגמאות לשימושים
עריכההשערת אי תלות - קשר בין מין להעדפה פוליטית
עריכהבסקר שנערך בארצות הברית בשנת 2000 נשאלו 2,757 איש לגבי העדפתם הפוליטית.[3] הנתונים המקובצים לפי מין מופיעים בטבלה הבאה:
העדפה פוליטית | |||||
---|---|---|---|---|---|
רפובליקני | עצמאי | דמוקרט | סך הכל | ||
מין | גבר | 468 (533.7) |
327 (319.6) |
762 (703.7) |
1557 |
אשה | 477 (411.3) |
239 (246.4) |
484 (542.3) |
1200 | |
סך הכל | 945 | 566 | 1246 | 2757 |
לדוגמה, 468 גברים הביעו תמיכה במפלגה הרפובליקנית ו-484 נשים הביעו תמיכה במפלגה הדמוקרטית.
נסמן ב- את משתנה המין, כאשר 1 מסמל גבר ו-2 מסמל אישה, ומכאן שמספר הערכים שמשתנה זה מקבל הוא . כמו כן נסמן ב- את משתנה ההעדפה הפוליטית כאשר 1, 2, ו-3 מסמלים העדפה של המפלגה הרפובליקנית, העדפה עצמאית או העדפה של המפלגה הדמוקרטית בהתאמה, וכאן . על פי סימול זה, ו- .
הערכים הצפויים מופיעים בטבלה בסוגריים. לדוגמה: מספר הנשים במדגם הוא , ומספר התומכים במפלגה הדמוקרטית הוא . לכן המספר הצפוי של נשים התומכות במפלגה הדמוקרטית תחת ההנחה כי אין קשר בין המין וההעדפה הפוליטית הוא .
בחישוב הערך של נקבל כי
לאחר שנבצע חישובים דומים עבור כל ששת הצירופים האפשריים של ערכי ו- , החישוב הסופי יראה כי . בחישוב מבחן יחס הנראות נקבל כי . מספר דרגות החופש הוא . ערך ה-p עבור הוא ולכן אם קבענו מראש כי רמת המובהקות של המבחן תהיה נדחה את השערת האפס האומרת כי אין קשר בין המין וההעדפה הפוליטית.
קובייה הוגנת – טיב התאמה להתפלגות אחידה
עריכהקוביית משחק הוגנת היא כזו שהסיכויים שלה ליפול על כל פאה הם שווים, כלומר ההסתברות כי תוצאת ההטלה תהיה 1 שווה להסתברות כי תוצאת ההטלה תהיה 2 וכן הלאה. כל אחת מההסתברויות האלה שווה ל-1/6.
השערת האפס היא כי הקוביה הוגנת. השערה זו מתורגמת לאמירה המתמטית כי המודל הוא מודל התפלגות אחידה על המספרים , כלומר זוהי התפלגות מולטינומית עם לכל . מודל זה אינו תלוי בפרמטר.
נניח כי הטלנו את הקוביה 100 פעמים והתקבלו התוצאות: 18,16,16,15,22,13 (כלומר, התוצאה "1" התקבלה 18 פעמים, התוצאה "2" התקבלה 16 פעמים, וכן הלאה). תחת ההנחה כי הקוביה הוגנת השכיחויות הצפויות שוות כולן 100/6, כלומר כ-16.7 עבור כל אחת מהתוצאות. החישובים של מבחן כי בריבוע מוצגים בטבלה הבאה:
תוצאת ההטלה | השכיחות | הערך הצפוי | כי בריבוע
|
---|---|---|---|
1 | 18 | 16.67 | 0.107 |
2 | 16 | 16.67 | 0.027 |
3 | 16 | 16.67 | 0.027 |
4 | 15 | 16.67 | 0.167 |
5 | 22 | 16.67 | 1.707 |
6 | 13 | 16.67 | 0.807 |
סך הכל | 100 | 100.00 | 2.84 |
קיבלנו כי . מספר דרגות החופש כאן הוא , מכיוון ש- ו- , מכיוון שההסתברויות לא היו תלויות בפרמטר.
ניתן לחשב כי ערך ה-p הוא . בהנחה שקבענו מראש כי רמת המובהקות של המבחן היא , לא נדחה את השערת האפס.
בשפת פייתון ניתן לחשב את המבחן על ידי הפקודה:
import numpy as np
from scipy.stats import chisquare
f_exp = np.ones(6)*100/6
f_obs = np.array([18, 16, 16, 15,22,13])
chisquare(f_obs=f_obs, f_exp=f_exp)
השוואת התפלגויות - הבדלי העדפה בין גברים ונשים
עריכהלצורך סקר על העדפת מוצרים נערך מדגם שכלל 110 אנשים, שנתבקשו לדווח איזה מוצר הם מעדיפים מבין שלושה מוצרים. תוצאות הסקר (העדפה ומין הנשאל) נתונות בטבלה:
העדפת מוצר | |||||
---|---|---|---|---|---|
מוצר 1 | מוצר 2 | מוצר 3 | סך הכל | ||
מין | גבר | 20 | 19 | 18 | 57 |
אשה | 13 | 29 | 11 | 53 | |
סך הכל | 33 | 48 | 29 | 110 |
עורכי הסקר מעוניינים לדעת האם יש הבדלים בין ההעדפות של הגברים וההעדפות של הנשים, ולכן השערת האפס אומרת כי אין הבדל בין התפלגות ההעדפות של הגברים והתפלגות ההעדפות של הנשים.
בהנחה כי השערת האפס נכונה עלינו לאמוד כאן שני פרמטרים: את ההסתברות כי אדם (גבר או אשה) מעדיף את מוצר 1 ואת ההסתברות כי אדם (גבר או אשה) מעדיף את מוצר 2. האמדן להסתברות כי אדם מעדיף את מוצר 3 מתקבל על ידי השלמה ל-1. האמדנים האלה הם ו- . מכאן נקבל כי האמדן ל- הוא .
כמו כן נניח כי ההסתברות שאדם במדגם הוא גבר שווה להסתברות כי האדם הוא אשה, ולכן שתי הסתברויות אלה שוות ל-0.5.
על סמך האמדנים האלה נוכל לחשב כי (כאשר מסמל גבר): , וכן הלאה לכל התאים בלוח השכיחות. החישוב הסופי מעלה כי .
נאמדו 2 פרמטרים ( ), ולכן נקבל כי . שימו לב כי מספר דרגות החופש כאן שונה ממספר דרגות החופש בבדיקת השערת אי תלות.
חישוב ערך ה-p מעלה כי . בהנחה שקבענו מראש כי רמת המובהקות של המבחן היא לא נדחה את השערת האפס, ונסיק כי לא נצפו הבדלים בהעדפות בין גברים ונשים.
ראו גם
עריכהקישורים חיצוניים
עריכה- מבחן כי בריבוע, באתר MathWorld (באנגלית)
הערות שוליים
עריכה- ^ Karl Pearson, On the criterion that a given system of deviations from the probable in the case of a correlated system of variables is such that it can be reasonably supposed to have arisen from random sampling, Philosophical Magazine, 5 50, 1900, עמ' 157–175 doi: doi:10.1080/14786440009463897
- ^ Chi-squared distribution table with sigma values
- ^ Agresti, Alan, 2, An Introduction to Categorical Data Analysis, Hoboken, New Jersey: JohnWiley & Sons, Inc., 2007, עמ' 37-38, ISBN 978-0-471-22618-5