מבחן כי בריבוע

מִבְחַן כִי בָּרִבּוּעַ ( $\chi ^{2}$ , נהגה בכ' רפה, לעיתים נכתב חי בריבוע) הוא למעשה אוסף של מבחנים סטטיסטיים שמטרתם לבדוק את טיב ההתאמה של מודל התפלגותי לנתונים איכותיים או בדידים. המשותף לכל המבחנים האלה הוא שההתפלגות של סטטיסטי המבחן היא התפלגות כי בריבוע (במדויק או בקירוב). מבחנים אלה משמשים גם כבסיס למגוון מקדמי קשר (או מתאם), כגון מקדם הקשר של קראמר.

השם "כי בריבוע" מקורו באות היוונית $\chi$ , כי.

היסטוריה

לאחר שקרל פירסון פיתח את המדד הידוע כ-"מתאם פירסון" למדידת עוצמת הקשר בין משתנים כמותיים, הוא פנה לפיתוח מקדם דומה למדידת הקשר בין שני משתנים איכותיים (קטגוריים), שנתוניהם מוצגים בלוח שכיחות דו־ממדי. בשנת 1900 הציג את סטטיסטי כי-בריבוע, שמבטא רעיון דומה לרעיון של מקדם המתאם.^[1] בעוד שמקדם המתאם התבסס על ההפרשים בין התצפיות והממוצע שלהן. סטטיסטי כי בריבוע מבוסס על ההפרש בין מספר התצפיות בתא מסוים בלוח השכיחות הדו־ממדי, והמספר הצפוי של התצפיות באותו תא בהנחה כי יש אי תלות בין משתנים. פירסון הראה כי ההתפלגות האסימפטוטית של המדד שפיתח היא אכן התפלגות כי בריבוע, ומכאן שמו של המדד.

טבלת ערכי כי ריבוע^[2]

ערכי כי בריבוע לפי רמות סמך ומספר דרגות החופש k
תוחלת	1σ	1.28	1.64	1.96	2σ	2.58	3σ	3.29	4σ
רמת סמך CI	68.3%	80%	90%	95%	95.45%	99%	99.73%	99.9%	99.99%
ערך-p רמת מובהקות	0.317	0.20	0.10	0.05	0.0455	0.01	0.0027	0.001	0.00006
k=1	1.00	1.64	2.71	3.84	4.00	6.63	9.00	10.83	16.00
k=2	2.30	3.22	4.61	5.99	6.18	9.21	11.83	13.82	19.33
k=3	3.53	4.64	6.25	7.81	8.02	11.34	14.16	16.27	22.06
k=4	4.72	5.99	7.78	9.49	9.72	13.28	16.25	18.47	24.50
k=5	5.89	7.29	9.24	11.07	11.31	15.09	18.21	20.52	26.77
k=6	7.04	8.56	10.64	12.59	12.85	16.81	20.06	22.46	28.91
k=7	8.18	9.80	12.02	14.07	14.34	18.48	21.85	24.32	30.96
k=8	9.30	11.03	13.36	15.51	15.79	20.09	23.57	26.12	32.93
k=9	10.42	12.24	14.68	16.92	17.21	21.67	25.26	27.88	34.85
k=10	11.54	13.44	15.99	18.31	18.61	23.21	26.90	29.59	36.72

תאוריה

מבחן כי בריבוע לבדיקת השערת אי תלות

יהיו $X$ ו- $Y$ שני משתנים איכותיים (כלומר נמדדים בסולם מדידה שמי או סודר). נסמן את הערכים שהמשתנה $X$ יכול לקבל ב- $i=1,...,I$ ואת הערכים שהמשתנה $Y$ יכול לקבל ב- $j=1,...,J$ .

בהינתן מדגם בגודל $n$ , נסמן ב- $O_{ij}$ את מספר התצפיות במדגם עבורן $X=i$ ו- $Y=j$ .

אם $X$ ו- $Y$ הם משתנים בלתי תלויים הרי שמתקיים $P(X=i,Y=j)=P(X=i)P(Y=j)$ לכל $i$ ולכל $j$ . תחת הנחה זו, ניתן לאמוד את הערך הצפוי של מספר התצפיות עבורן $X=i$ ו- $Y=j$ , שנסמן ב- $E_{ij}$ על ידי:

$E_{ij}={\frac {n_{i}\cdot n_{j}}{n}}$

כאשר

$n$ הוא גודל המדגם
$n_{i}$ הוא מספר התצפיות עבורן $X=i$
$n_{j}$ הוא מספר התצפיות עבורן $Y=j$

סטטיסטי כי בריבוע לבדיקת ההשערה כי $X$ ו- $Y$ הם בלתי תלויים מוגדר כ-

$\chi ^{2}=\sum _{ij}{\frac {(O_{ij}-E_{ij})^{2}}{E_{ij}}}$

והתפלגותו האסימפטוטית היא התפלגות כי בריבוע עם $(I-1)(J-1)$ דרגות חופש.

השערת אי התלות תידחה אם הערך המחושב של $\chi ^{2}$ גדול מערך קריטי הנקבע על פי רמת המובהקות α שנקבעה מראש, או אם ערך ה-p המחושב קטן מרמת המובהקות הזו.

מבחן כי בריבוע לבדיקת טיב ההתאמה של מודל מולטינומי

יהי $X$ משתנה איכותי שיכול לקבל את הערכים $i=1,...,I$ . התפלגותו של $X$ היא התפלגות מולטינומית. נסמן $p_{i}=P(x=i)$ .

בהינתן מדגם בגודל $n$ , נסמן ב- $O_{i}$ את מספר התצפיות במדגם עבורן $X=i$ .

מודל מולטינומי עבור $X$ הוא מפרט (ספציפיקציה) של $\mathbf {p} =(p_{1},\dots ,p_{I})$ על ידי פרמטר $\theta$ (שיכול להיות גם וקטור של פרמטרים, או וקטור ממימד 0, כלומר מפרט אי פרמטרי). בהינתן המודל $\mathbf {p} =\mathbf {p(\theta )}$ , ניתן לאמוד את $\theta$ , ובעזרת אמדן זה אפשר לאמוד את הערך הצפוי של מספר התצפיות עבורן $X=i$ , שנסמן ב- $E_{i}$ , על ידי $E_{i}=np_{i}$ .

סטטיסטי כי בריבוע לבדיקת ההשערה כי המודל מתאים לנתונים מוגדר כ- $\chi ^{2}=\sum _{i}{\frac {(O_{i}-E_{i})^{2}}{E_{i}}}$ , והתפלגותו האסימפטוטית היא התפלגות כי בריבוע עם $\mathrm {df} =I-1-\dim(\theta )$ דרגות חופש.

מבחן כי בריבוע לבדיקת השערת אי התלות בין שני משתנים הוא מקרה פרטי של מבחן כי בריבוע לבדיקת טיב ההתאמה של מודל מולטינומי.

מבחן יחס הנראות

מבחן כי בריבוע לבדיקת השערת אי התלות פותח על ידי פירסון תוך שימוש בשיקולי מומנטים. עם זאת, ניתן לבדוק את השערת אי התלות בפרט, ואת טיב ההתאמה של מודל מולטינומי בכלל, על ידי שימוש במבחן יחס הנראות, על פי הלמה של ניימן ופירסון. סטטיסטי מבחן יחס הנראות שונה מסטטיסטי מבחן כי בריבוע, אך שני המבחנים שקולים אסימפטוטית.

מבחן יחס הנראות לבדיקת השערת אי התלות הוא $G^{2}=\sum _{ij}O_{ij}\log {\frac {O_{ij}}{E_{ij}}}$ והתפלגותו האסימפטוטית היא התפלגות כי בריבוע עם $(I-1)(J-1)$ דרגות חופש.

באופן דומה, מבחן יחס הנראות לבדיקת טיב ההתאמה של מודל מולטינומי הוא $G^{2}=\sum _{i}O_{i}\log {\frac {O_{i}}{E_{i}}}$ , והתפלגותו האסימפטוטית היא התפלגות כי בריבוע עם $\mathrm {df} =I-1-\dim(\theta )$ דרגות חופש.

ניתן להראות כי סטטיסטי $\chi ^{2}$ הוא קירוב של סטטיסטי $G^{2}$ על ידי פיתוח טור טיילור של פונקציית הלוגריתם הטבעי סביב 1 והשמטת האיברים מסדר 3 ומעלה.

דוגמאות לשימושים

השערת אי תלות - קשר בין מין להעדפה פוליטית

בסקר שנערך בארצות הברית בשנת 2000 נשאלו 2,757 איש לגבי העדפתם הפוליטית.^[3] הנתונים המקובצים לפי מין מופיעים בטבלה הבאה:

		העדפה פוליטית
		רפובליקני	עצמאי	דמוקרט	סך הכל
מין	גבר	468 (533.7)	327 (319.6)	762 (703.7)	1557
	אשה	477 (411.3)	239 (246.4)	484 (542.3)	1200
	סך הכל	945	566	1246	2757

לדוגמה, 468 גברים הביעו תמיכה במפלגה הרפובליקנית ו-484 נשים הביעו תמיכה במפלגה הדמוקרטית.

נסמן ב- $X$ את משתנה המין, כאשר 1 מסמל גבר ו-2 מסמל אישה, ומכאן שמספר הערכים שמשתנה זה מקבל הוא $I=2$ . כמו כן נסמן ב- $Y$ את משתנה ההעדפה הפוליטית כאשר 1, 2, ו-3 מסמלים העדפה של המפלגה הרפובליקנית, העדפה עצמאית או העדפה של המפלגה הדמוקרטית בהתאמה, וכאן $J=3$ . על פי סימול זה, $O_{11}=468$ ו- $O_{23}=484$ .

הערכים הצפויים $E_{ij}$ מופיעים בטבלה בסוגריים. לדוגמה: מספר הנשים במדגם הוא $n_{2\cdot }=1200$ , ומספר התומכים במפלגה הדמוקרטית הוא $n_{\cdot 3}=1246$ . לכן המספר הצפוי של נשים התומכות במפלגה הדמוקרטית תחת ההנחה כי אין קשר בין המין וההעדפה הפוליטית הוא $E_{23}={\frac {n_{2\cdot }\cdot n_{\cdot 3}}{n}}={\frac {1200\cdot 1246}{2757}}=542.3$ .

בחישוב הערך של $\chi ^{2}$ נקבל כי ${\frac {(E_{23}-O_{23})^{2}}{E_{23}}}={\frac {(484-542.3)^{2}}{542.3}}=6.27$

לאחר שנבצע חישובים דומים עבור כל ששת הצירופים האפשריים של ערכי $X$ ו- $Y$ , החישוב הסופי יראה כי $\chi ^{2}=30.07$ . בחישוב מבחן יחס הנראות נקבל כי $G^{2}=30.0$ . מספר דרגות החופש הוא $\mathrm {df} =(I-1)(J-1)=(2-1)\cdot (3-1)=2$ . ערך ה-p עבור $\chi ^{2}$ הוא $p{\mbox{-value}}=0.0000029$ ולכן אם קבענו מראש כי רמת המובהקות של המבחן תהיה $\alpha =0.05$ נדחה את השערת האפס האומרת כי אין קשר בין המין וההעדפה הפוליטית.

קובייה הוגנת – טיב התאמה להתפלגות אחידה

קוביית משחק הוגנת היא כזו שהסיכויים שלה ליפול על כל פאה הם שווים, כלומר ההסתברות כי תוצאת ההטלה תהיה 1 שווה להסתברות כי תוצאת ההטלה תהיה 2 וכן הלאה. כל אחת מההסתברויות האלה שווה ל-1/6.

השערת האפס היא כי הקוביה הוגנת. השערה זו מתורגמת לאמירה המתמטית כי המודל הוא מודל התפלגות אחידה על המספרים $1,...,6$ , כלומר זוהי התפלגות מולטינומית עם $p_{i}={\frac {1}{6}}$ לכל $i$ . מודל זה אינו תלוי בפרמטר.

נניח כי הטלנו את הקוביה 100 פעמים והתקבלו התוצאות: 18,16,16,15,22,13 (כלומר, התוצאה "1" התקבלה 18 פעמים, התוצאה "2" התקבלה 16 פעמים, וכן הלאה). תחת ההנחה כי הקוביה הוגנת השכיחויות הצפויות שוות כולן 100/6, כלומר כ-16.7 עבור כל אחת מהתוצאות. החישובים של מבחן כי בריבוע מוצגים בטבלה הבאה:

תוצאת ההטלה	השכיחות $O_{i}$	הערך הצפוי $\ E_{i}$	כי בריבוע $\ {\frac {(O_{i}-E_{i})^{2}}{E_{i}}}$
1	18	16.67	0.107
2	16	16.67	0.027
3	16	16.67	0.027
4	15	16.67	0.167
5	22	16.67	1.707
6	13	16.67	0.807
סך הכל	100	100.00	2.84

קיבלנו כי $\chi ^{2}=2.84$ . מספר דרגות החופש כאן הוא $\mathrm {df} =5$ , מכיוון ש- $I=6$ ו- $\dim(\theta )=0$ , מכיוון שההסתברויות $p_{i}$ לא היו תלויות בפרמטר.

ניתן לחשב כי ערך ה-p הוא $p{\mbox{-value}}=0.7246$ . בהנחה שקבענו מראש כי רמת המובהקות של המבחן היא $\alpha =0.05$ , לא נדחה את השערת האפס.

בשפת פייתון ניתן לחשב את המבחן על ידי הפקודה:

import numpy as np
from scipy.stats import chisquare
f_exp = np.ones(6)*100/6 
f_obs = np.array([18, 16, 16, 15,22,13])
chisquare(f_obs=f_obs, f_exp=f_exp)

השוואת התפלגויות - הבדלי העדפה בין גברים ונשים

לצורך סקר על העדפת מוצרים נערך מדגם שכלל 110 אנשים, שנתבקשו לדווח איזה מוצר הם מעדיפים מבין שלושה מוצרים. תוצאות הסקר (העדפה ומין הנשאל) נתונות בטבלה:

		העדפת מוצר
		מוצר 1	מוצר 2	מוצר 3	סך הכל
מין	גבר	20	19	18	57
	אשה	13	29	11	53
	סך הכל	33	48	29	110

עורכי הסקר מעוניינים לדעת האם יש הבדלים בין ההעדפות של הגברים וההעדפות של הנשים, ולכן השערת האפס אומרת כי אין הבדל בין התפלגות ההעדפות של הגברים והתפלגות ההעדפות של הנשים.

בהנחה כי השערת האפס נכונה עלינו לאמוד כאן שני פרמטרים: את ההסתברות כי אדם (גבר או אשה) מעדיף את מוצר 1 ואת ההסתברות כי אדם (גבר או אשה) מעדיף את מוצר 2. האמדן להסתברות כי אדם מעדיף את מוצר 3 מתקבל על ידי השלמה ל-1. האמדנים האלה הם $\theta _{1}=p_{1}=33/110=0.3$ ו- $\theta _{2}=p_{2}=48/110=0.436$ . מכאן נקבל כי האמדן ל- $p_{3}$ הוא $0.264$ .

כמו כן נניח כי ההסתברות שאדם במדגם הוא גבר שווה להסתברות כי האדם הוא אשה, ולכן שתי הסתברויות אלה שוות ל-0.5.

על סמך האמדנים האלה נוכל לחשב כי (כאשר $X=1$ מסמל גבר): $E_{11}=110\cdot 0.3\cdot 0.5=16.5$ , וכן הלאה לכל התאים בלוח השכיחות. החישוב הסופי מעלה כי $\chi ^{2}=5.26$ .

נאמדו 2 פרמטרים ( $\dim(\theta )=2$ ), ולכן נקבל כי $\mathrm {df} =6-1-2=3$ . שימו לב כי מספר דרגות החופש כאן שונה ממספר דרגות החופש בבדיקת השערת אי תלות.

חישוב ערך ה-p מעלה כי $p{\mbox{-value}}=0.1537$ . בהנחה שקבענו מראש כי רמת המובהקות של המבחן היא $\alpha =0.05$ לא נדחה את השערת האפס, ונסיק כי לא נצפו הבדלים בהעדפות בין גברים ונשים.

ראו גם

המבחן המדויק של פישר

קישורים חיצוניים

מבחן כי בריבוע, באתר MathWorld (באנגלית)

הערות שוליים

^ Karl Pearson, On the criterion that a given system of deviations from the probable in the case of a correlated system of variables is such that it can be reasonably supposed to have arisen from random sampling, Philosophical Magazine, 5 50, 1900, עמ' 157–175 doi: doi:10.1080/14786440009463897
^ Chi-squared distribution table with sigma values
^ Agresti, Alan, 2, An Introduction to Categorical Data Analysis, Hoboken, New Jersey: JohnWiley & Sons, Inc., 2007, עמ' 37-38, ISBN 978-0-471-22618-5

[1] Karl Pearson, On the criterion that a given system of deviations from the probable in the case of a correlated system of variables is such that it can be reasonably supposed to have arisen from random sampling, Philosophical Magazine, 5 50, 1900, עמ' 157–175 doi: doi:10.1080/14786440009463897

[2] Chi-squared distribution table with sigma values

[3] Agresti, Alan, 2, An Introduction to Categorical Data Analysis, Hoboken, New Jersey: JohnWiley & Sons, Inc., 2007, עמ' 37-38, ISBN 978-0-471-22618-5

[1]

[2]

[3]