התפלגות t

התפלגות $t$
	פונקציית צפיפות ההסתברות
פונקציית ההסתברות המצטברת
מאפיינים
פרמטרים	דרגות חופש.
תומך
פונקציית צפיפות הסתברות; (pdf)
פונקציית ההסתברות המצטברת; (cdf)
תוחלת	עבור , אחרת לא מוגדרת
חציון
ערך שכיח
שונות	עבור , עבור , אחרת לא מוגדרת
אנטרופיה
פונקציה אופיינית	עבור
צידוד	עבור , אחרת לא מוגדר
גבנוניות	עבור , עבור , אחרת לא מוגדר

בתורת ההסתברות, התפלגות t של סטודנט (Student's t-distribution), או בפשטות התפלגות t, היא משפחה של התפלגויות רציפות שמהווה הכללה של ההתפלגות הנורמלית. כמו ההתפלגות הנורמלית, התפלגות t היא סימטרית סביב אפס, ובעלת צורה דמוית פעמון, אך יש לה זנב עבה. מסת ההסתברות בזנבות נשלט על ידי הפרמטר $\nu$ . כאשר $\nu =1$ התפלגות t ההיא התפלגות קושי, שהזנבות שלה "עבים". עבור $\nu \rightarrow \infty$ ההתפלגות שואפת להתפלגות הנורמלית $\ {\mathcal {N}}(0,1)\,$ שהזנבות שלה "דקים" מאוד.

ההתפלגות מתארת את הערכים הצפויים למדגם מתוך אוכלוסייה המתפלגת נורמלית, כאשר השונות של האוכלוסייה אינה ידועה. התפלגות t היא הבסיס למבחן t, המשמש לבדיקת מובהקות ההפרש בין הממוצעים של שני מדגמים של אוכלוסייה וכן לניתוח רגרסיה ליניארית.

היסטוריה

בסטטיסטיקה, התפלגות t נגזרה לראשונה כהסתברות פוסטריורית ב-1876 על ידי המתמטיקאים הגרמנים הלמרט(אנ') ולורות'(אנ').^[2]^[3]

בספרות האנגלית, ההתפלגות קיבלה שמה מהמאמר של ויליאם גוסט(אנ') מ-1908 בכתב העת Biometrika (אנ') תחת השם הבדוי "סטודנט".^[4] גוסט עבד באותו זמן ככימאי במבשלת הבירה של גינס בדבלין, אירלנד והתעניין בבעיות של דגימות קטנות. למשל, התכונות הכימיות של שעורה בדגימות שגודלן קטן. המאמר של גוסט מתייחס להתפלגות כ"התפלגות התדירות של סטיות תקן של דגימות שנלקחו מאוכלוסייה נורמלית". העבודה התפרסמה בזכות עבודתו של רונלד פישר, שכינה את ההתפלגות "התפלגות סטודנט" וייצג את ערך המבחן באות t.^[5]^[6]

אחת הגרסאות לשימוש בשם הבדוי בפרסום המאמר היא שהמעסיק של גוסט, העדיף שהצוות ישתמש בשמות עט בפרסום מאמרים מדעיים במקום בשמם האמיתי ולכן גוסט בשם הבדוי "סטודנט". גרסה אחרת היא שגינס לא רצו שהמתחרים שלהם ידעו שהם משתמשים במבחן t כדי לקבוע את איכות חומר הגלם.^[7]

הגדרה

פונקציית הצפיפות

פונקציית צפיפות ההסתברות של התפלגות t היא:

f(t)={\frac {\Gamma ({\frac {\nu +1}{2}})}{{\sqrt {\nu \pi }}\,\Gamma ({\frac {\nu }{2}})}}\left(1+{\frac {t^{2}}{\nu }}\right)^{-({\frac {\nu +1}{2}})}\!

כאשר $\nu$ הוא מספר דרגות החופש ו- $\Gamma$ היא פונקציית גמא.

אלטרנטיבית ניתן לכתוב

$f(t)\ =\ {\frac {1}{\ {\sqrt {\nu \ }}\ {\mathrm {B} }\!\left({\frac {\ 1\ }{2}},\ {\frac {\ \nu \ }{2}}\right)\ }}\;\left(\ 1+{\frac {\ t^{2}\ }{\nu }}\ \right)^{-(\nu +1)/2}\ ,$

כאשר $\ {\mathrm {B} }\$ היא פונקציית בטא. בפרט כאשר $\ \nu \$ הוא מספר שלם מתקבל:

כאשר $\ \nu >1\$ וזוגי,

\ {\frac {\ \Gamma \!\left({\frac {\ \nu +1\ }{2}}\right)\ }{\ {\sqrt {\pi \ \nu \ }}\;\Gamma \!\left({\frac {\ \nu \ }{2}}\right)\ }}\ =\ {\frac {1}{\ 2{\sqrt {\nu \ }}\ }}\ \cdot \ {\frac {\ (\nu -1)\cdot (\nu -3)\cdots 5\cdot 3\ }{\ (\nu -2)\cdot (\nu -4)\cdots 4\cdot 2\ }}~.

כאשר $\ \nu >1\$ ואי-זוגי,

\ {\frac {\ \Gamma \!\left({\frac {\ \nu +1\ }{2}}\right)\ }{\ {\sqrt {\pi \ \nu \ }}\ \Gamma \!\left({\frac {\ \nu \ }{2}}\right)}}\ =\ {\frac {1}{\ \pi {\sqrt {\nu \ }}\ }}\ \cdot \ {\frac {(\nu -1)\cdot (\nu -3)\cdots 4\cdot 2\ }{\ (\nu -2)\cdot (\nu -4)\cdots 5\cdot 3\ }}~.

פונקציית צפיפות ההסתברות היא סימטרית, וצורתה הכללית דומה לצורת הפעמון של משתנה מתפלג נורמלית עם ממוצע 0 ושונות 1, אלא שהיא מעט נמוכה ורחבה יותר. ככל שגדל מספר דרגות החופש, התפלגות t מתקרבת להתפלגות נורמלית עם ממוצע 0 ושונות 1. מסיבה זו $\nu$ ידוע גם בתור פרמטר הנורמליות.

האיורים הבאים מציגים את פונקציית הצפיפות של התפלגות t עבור ערכי $\nu$ הולכים וגדלים. ההתפלגות הנורמלית מוצגת כקו כחול להשוואה. שימו לב שהתפלגות t (קו אדום) מתקרבת להתפלגות הנורמלית כאשר $\nu$ עולה.

פונקציית הצפיפות של התפלגות

t

(אדום) עבור

\nu =1,2,3,5,10,30

דרגות חופש, יחד עם צפיפות ההתפלגות הנורמלית הסטנדרטית (כחול). הגרפים הקודמים מופיעים בירוק.

\nu =1

\nu =2

\nu =3

\nu =5

\nu =10

\nu =30

פונקציית הצפיפות המצטברת

ניתן לכתוב את פונקציית הצפיפות המצטברת בעזרת $I$ , פונקציית בטא הלא שלמה הרגולרית. עבור $t>0$

F(t)=\int _{-\infty }^{t}\ f(u)\ \operatorname {d} u~=~1-{\frac {1}{2}}I_{x(t)}\!\left({\frac {\ \nu \ }{2}},\ {\frac {\ 1\ }{2}}\right)\ ,

כאשר

x(t)={\frac {\nu }{\ t^{2}+\nu \ }}~.

ביטוי אחר שתקף למקרה $\ t^{2}<\nu \ ,$ :

\int _{-\infty }^{t}f(u)\ \operatorname {d} u~=~{\frac {1}{2}}+t\ {\frac {\ \Gamma \!\left({\frac {\ \nu +1\ }{2}}\right)\ }{\ {\sqrt {\pi \ \nu \ }}\ \Gamma \!\left({\frac {\nu }{\ 2\ }}\right)\ }}\ {}_{2}F_{1}\!\left(\ {\frac {1}{2}},{\frac {\ \nu +1\ }{2}}\ ;{\frac {3}{\ 2\ }}\ ;\ -{\frac {~t^{2}\ }{\nu }}\ \right)\ ,

כאשר $\ {}_{2}F_{1}(\ ,\ ;\ ;\ )\$ הוא מקרה פרטי של הפונקציה ההיפרגאומטרית.

מומנטים

עבור $\nu >1$ המומנטים של התפלגות t הם

\operatorname {\mathbb {E} } \left\{\ T^{k}\ \right\}={\begin{cases}\quad 0&k{\text{ odd }},\quad 0<k<\nu \,\\{}\\{\frac {1}{\ {\sqrt {\pi \ }}\ \Gamma \left({\frac {\ \nu \ }{2}}\right)}}\ \left[\ \Gamma \!\left({\frac {\ k+1\ }{2}}\right)\ \Gamma \!\left({\frac {\ \nu -k\ }{2}}\right)\ \nu ^{\frac {\ k\ }{2}}\ \right]&k{\text{ even }},\quad 0<k<\nu ~.\\\end{cases}}

מומנטים מסדר $\ \nu \$ או מסדר גבוה יותר אינם קיימים.^[8]

עבור k זוגי ניתן לפשט את האיבר ל $\ 0<k<\nu \,$ באמצעות התכונות של פונקציית גמא

\operatorname {\mathbb {E} } \left\{\ T^{k}\ \right\}=\nu ^{\frac {\ k\ }{2}}\ \prod _{j=1}^{k/2}\ {\frac {~2j-1~}{\nu -2j}}\qquad k{\text{ even}},\quad 0<k<\nu ~

תוחלת, שונות, צידוד, גבנוניות

עבור התפלגות t עם $\ \nu \$ דרגות חופש:

התוחלת היא $\ 0\$ עבור $\ \nu >1\$ .
השונות היא $\ {\frac {\nu }{\ \nu -2\ }}\$ עבור אחרת השונות אינה מוגדרת.
הצידוד הוא 0 עבור $\ \nu >3\$ , אחרת הצידוד אינו מוגדר.
הגבנוניות היא $\ {\frac {6}{\ \nu -4\ }}\$ עבור $\ \nu >4$ , $\infty$ עבור $4\geq \nu >2$ , אחרת הגבנוניות אינה מוגדרת.

כיצד נוצרת התפלגות t

התפלגות של משתנה מקרי

ניתן להגדיר את התפלגות t עם $\ \nu \$ דרגות חופש באמצעות משתנה מקרי T

$T={\frac {Z}{\sqrt {V/\nu }}}=Z{\sqrt {\frac {\nu }{V}}},$

כאשר Z הוא משתנה מקרי מתפלג נורמלית עם תוחלת אפס ושונות 1, V משתנה מקרית עם התפלגות כי בריבוע עם $\ \nu \$ דרגות חופש ו-Z ו-V הם בלתי תלויים.

דגימה של התפלגות t

התפלגות t עשויה להתקבל באמצעות דגימה של משתנה מקרי נורמלי. יהיו $\ x_{1},\ldots ,x_{n}\sim {\mathcal {N}}(\mu ,\sigma ^{2})$ דגימות בלתי תלויות ושוות התפלגות מתוך התפלגות נורמלית עם תוחלת $\mu$ ושונות $\ \sigma ^{2}$ . ממוצע המדגם ואומד חסר הטיה לשונות נתונים על ידי

{\begin{aligned}{\bar {x}}&={\frac {\ x_{1}+\cdots +x_{n}\ }{n}}\ ,\\[5pt]s^{2}&={\frac {1}{\ n-1\ }}\ \sum _{i=1}^{n}(x_{i}-{\bar {x}})^{2}~.\end{aligned}}

הסטטיסטי $t={\frac {{\bar {x}}-\mu }{\ {\sqrt {s^{2}/n\ }}\ }}\sim t_{n-1}$ יהיה בעל התפלגות t עם $n-1\$ דרגות חופש.

קישורים חיצוניים

מדיה וקבצים בנושא התפלגות t בוויקישיתוף

התפלגות t, באתר MathWorld (באנגלית)

הערות שוליים

^ Hurst, Simon. "The characteristic function of the Student $t$ distribution". Financial Mathematics Research Report. Statistics Research Report No. SRR044-95. אורכב מ-המקור ב-18 בפברואר 2010. {{cite web}}: (עזרה)
^ Oscar Sheynin, Helmert's work in the theory of errors, Archive for History of Exact Sciences 49, 1995-03-01, עמ' 73–104 doi: 10.1007/BF00374700
^ J. Lüroth, Vergleichung von zwei Werthen des wahrscheinlichen Fehlers, 1876-01-01 doi: 10.1002/asna.18760871402
^ Student, The Probable Error of a Mean, Biometrika 6, 1908, עמ' 1–25 doi: 10.2307/2331554
^ Fisher RA, "Applications of 'Student's' distribution, Metron. 5, 1925, עמ' 41
^ Walpole RE, Myers R, Myers S, Ye K, Probability & Statistics for Engineers & Scientists, New Delhi, Pearson, עמ' 237, ISBN 9788177584042.
^ Michael C. Wendl, Pseudonymous fame, Science 351, 2016-03-25, עמ' 1406–1406 doi: 10.1126/science.351.6280.1406
^ Casella G, Berger RL (1990). Statistical Inference. Duxbury Resource Center. p. 56. ISBN 9780534119584.

[1] Hurst, Simon. "The characteristic function of the Student $t$ distribution". Financial Mathematics Research Report. Statistics Research Report No. SRR044-95. אורכב מ-המקור ב-18 בפברואר 2010. {{cite web}}: (עזרה)

[2] Oscar Sheynin, Helmert's work in the theory of errors, Archive for History of Exact Sciences 49, 1995-03-01, עמ' 73–104 doi: 10.1007/BF00374700

[3] J. Lüroth, Vergleichung von zwei Werthen des wahrscheinlichen Fehlers, 1876-01-01 doi: 10.1002/asna.18760871402

[4] Student, The Probable Error of a Mean, Biometrika 6, 1908, עמ' 1–25 doi: 10.2307/2331554

[5] Fisher RA, "Applications of 'Student's' distribution, Metron. 5, 1925, עמ' 41

[6] Walpole RE, Myers R, Myers S, Ye K, Probability & Statistics for Engineers & Scientists, New Delhi, Pearson, עמ' 237, ISBN 9788177584042.

[7] Michael C. Wendl, Pseudonymous fame, Science 351, 2016-03-25, עמ' 1406–1406 doi: 10.1126/science.351.6280.1406

[8] Casella G, Berger RL (1990). Statistical Inference. Duxbury Resource Center. p. 56. ISBN 9780534119584.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

פונקציית ההסתברות המצטברת
פונקציית צפיפות ההסתברות


מאפיינים
פרמטרים	$\ \nu >0\$ דרגות חופש.
תומך	$\ x\in (-\infty ,\infty )$
פונקציית צפיפות הסתברות (pdf)	$\textstyle \ {\frac {\Gamma \left({\frac {\ \nu +1\ }{2}}\right)}{{\sqrt {\pi \ \nu \ }}\ \Gamma \left({\frac {\nu }{\ 2\ }}\right)}}\ \left(\ 1+{\frac {~x^{2}\ }{\nu }}\ \right)^{-{\frac {\ \nu +1\ }{2}}}\$
פונקציית ההסתברות המצטברת (cdf)	${\begin{matrix}\ {\frac {\ 1\ }{2}}+x\ \Gamma \left({\frac {\ \nu +1\ }{2}}\right)\times \\[0.5em]{\frac {\ {{}_{2}F_{1}}\!\left(\ {\frac {\ 1\ }{2}},\ {\frac {\ \nu +1\ }{2}};\ {\frac {3}{\ 2\ }};\ -{\frac {~x^{2}\ }{\nu }}\ \right)\ }{\ {\sqrt {\pi \nu }}\ \Gamma \left({\frac {\ \nu \ }{2}}\right)\ }}\ ,\end{matrix}}$
תוחלת	$\ 0\$ עבור $\ \nu >1\$ , אחרת לא מוגדרת
חציון	$\ 0\$
ערך שכיח	$\ 0\$
שונות	$\textstyle \ {\frac {\nu }{\ \nu -2\ }}\$ עבור $\ \nu >2$ , $\infty$ עבור $\ 1<\nu \leq 2\$ , אחרת לא מוגדרת
אנטרופיה	$\ {\begin{matrix}{\frac {\ \nu +1\ }{2}}\left[\ \psi \left({\frac {\ \nu +1\ }{2}}\right)-\psi \left({\frac {\ \nu \ }{2}}\right)\ \right]\\[0.5em]+\ln \left[{\sqrt {\nu \ }}\ {\mathrm {B} }\left(\ {\frac {\ \nu \ }{2}},\ {\frac {\ 1\ }{2}}\ \right)\right]\ {\scriptstyle {\text{(nats)}}}\ \end{matrix}}$
פונקציה אופיינית	$\textstyle {\frac {\ \left(\ {\sqrt {\nu \ }}\ \|t\|\ \right)^{\nu /2}\ K_{\nu /2}\left(\ {\sqrt {\nu \ }}\ \|t\|\ \right)\ }{\ \Gamma (\nu /2)\ 2^{\nu /2-1}\ }}$ עבור $\nu >0$ ^[1]
צידוד	$\ 0\$ עבור $\ \nu >3\$ , אחרת לא מוגדר
גבנוניות	$\textstyle \ {\frac {6}{\ \nu -4\ }}$ עבור $\ \nu >4\,$ , $\infty$ עבור $\ 2<\nu \leq 4\$ , אחרת לא מוגדר