בתורת האמידה הסטטיסטית, רווח בר-סֶמֶך (או רווח סֶמֶך) עבור פרמטר לא ידוע של התפלגות ממשפחה ידועה של התפלגויות, הוא קטע המחושב מתוך תוצאות של מדגם, באופן כזה שהסיכוי הא-פריורי (טרם לקיחת המדגם) שהקטע שנקבל יכלול את הפרמטר הוא קבוע, הקרוי "רמת הסמך" של הרווח. משמעות הדבר היא, שאם נבצע מספר אינסופי של דגימות, אחוז הדגימות שהקטע שיחושב עבורן יכלול את הפרמטר שווה לרמת הסמך. "רמת המובהקות" של הרווח היא המשלים של רמת הסמך (למשל, אם רמת הסמך היא 95%, אז רמת המובהקות היא 5%).

בין הגורמים המשפיעים על אורכו של רווח הסמך: גודל המדגם (מספר התצפיות), השונות של הפרמטר (האמיתית אם ידועה, או אומד לשונות על סמך המדגם אם לא ידועה) ורמת הסמך. ככל שהמדגם גדול יותר, השונות נמוכה יותר ורמת הסמך קטנה יותר, כך רווח הסמך יהיה קצר יותר, ולהפך.

רווחי סמך הוצגו לראשונה על ידי ג'רזי ניימן במאמר שפורסם בשנת 1937.

הצורך בבניית רווח בר-סמך עולה כאשר ההתפלגות של משתנה מקרי מסוים אינה ידועה באופן מלא; ידוע שההתפלגות שייכת למשפחה מוכרת של התפלגויות, אבל לא ידוע איזו מבין החברות במשפחה היא ההתפלגות הנכונה. למשל, ידוע משיקולים תאורטיים שמספר השקדים המרים בחבילה גדולה הוא בעל התפלגות פואסונית - אבל ללא מדידה מעשית של החבילות, לא ניתן לקבוע באיזו התפלגות מדובר, מבין אינסוף ההתפלגויות השונות הקרויות בשם זה, הנבדלות זו מזו בערכה של התוחלת  . (מספר, כגון  , המבדיל בין חברות שונות במשפחה של התפלגויות, קרוי פרמטר).

תורת האמידה עוסקת בחילוץ מידע על ערכו של הפרמטר, מתוך נתונים שנאספו במדגם (מתוך ההתפלגות שאינה ידועה). את תורת האמידה אפשר לחלק באופן גס לשני תחומים - אמידה נקודתית, בה מנסים לקלוע לערכו המדויק של הפרמטר, ואמידת רווח, שבה בונים רווח בר-סמך לפרמטר, שגם אם אינו מדויק, יש סיכוי טוב לכך שהוא מכיל את הפרמטר.

תיאור מתמטי

עריכה

נתון מדגם   מהתפלגות  , הידועה למעט ערכו של הפרמטר  . רווח בר-סמך בעל רמת מובהקות   עבור הפרמטר   הוא קטע  , ששני קצותיו הם "סטטיסטים" (כלומר, פונקציות של המדגם, שאינן תלויות בפרמטר), כך שההסתברות למאורע   היא  .

אם כך, הסיכוי לכך שהפרמטר שייך לרווח שווה ל-  , והסיכוי לכך שהטענה "הפרמטר שייך לרווח זה" תהיה שגויה, הוא  . ביישומים שונים מקובל לדרוש שהסיכוי לטעות יהיה   או  .

לאחר ביצוע הליך הדגימה בפועל, המשתנים המקריים   מקבלים ערכים מספריים, וכך הופכים גם קצות הקטע   למספרים, נאמר  .

מכשלה נפוצה היא לומר שבמקרה זה, "הסיכוי לכך שהפרמטר   נמצא בין   ל-   הוא  ". ניסוח זה שגוי בתכלית, משום שלפרמטר אין התפלגות - הוא מספר (וגם אם הוא נקבע על-פי התפלגות כלשהי, התפלגות זו אינה נלקחת בחשבון בחישוב הרווח). אם כך, הסיכוי לכך שהפרמטר יהיה בין שני מספרים הוא אפס, או אחד (גם אם איננו יודעים איזו אפשרות היא הנכונה). מה שכן נכון לומר, הוא שא-פריורית לביצוע הניסוי, הסיכוי לכך שהפרמטר האמיתי יהיה שייך לקטע אותו נקבל כרווח בר-סמך הוא בדיוק   (וסיכוי של   שיהיה מחוץ לו); אבל לאחר שהניסוי כבר בוצע, רווח הסמך כבר נקבע, ולכן המאורע שהפרמטר האמיתי בתוך או לא בתוך הקטע איננו מאורע הסתברותי (כלומר, או שהוא בוודאות בתוך הקטע או בוודאות מחוץ לו)[דרושה הבהרה].

חישוב רווחים בני-סמך

עריכה

דוגמה

עריכה

מבקשים לאמוד את הפרמטר הלא ידוע   בהתפלגות אחידה  , באמצעות דגימה בודדת, X. לכל מספר  , הסיכוי למאורע   שווה ל- ; ואם כך, זהו בדיוק הסיכוי (טרם הדגימה) לכך ש-   ייפול בקטע   (שקצותיו תלויים במשתנה המקרי X). כל אלו (עבור כל ערך של t) הם רווחי סמך לפרמטר, בעלי אותה רמת מובהקות.

בחירה בין רווחים שונים

עריכה

בדרך כלל אפשר לבנות רווחים בני-סמך רבים לאותו פרמטר, מאותו מדגם, כבדוגמה לעיל. יש כמה קריטריונים להעדפה (א-פריורי) של רווח מסוים על-פני רווח אחר:

  • אורך הרווח: מעדיפים רווח קצר על-פני רווח ארוך; למשל, נעדיף לדעת שהפרמטר נמצא, בסיכוי 0.95, בקטע  , מאשר שהוא נמצא באותו סיכוי בקטע   (גם אם שתי הטענות נכונות).
  • סימטריה: מעדיפים רווח   שהסיכוי (א-פריורי) ליפול מקצהו האחד שווה לסיכוי ליפול מקצהו האחר.

שיקולים אלה עשויים להיות סותרים (וישנם גם שיקולים אחרים). בדוגמה שניתנה לאמידה של פרמטר בהתפלגות אחידה, השיקול הראשון יציע את הרווח  , ואילו השני את הרווח  .

שיטת הכמות הצירית

עריכה

בחישוב תאורטי של רווחים בני-סמך עושים שימוש בפונקציה הקרויה כמות צירית, שהיא מזיגה של המדגם ושל הפרמטר, שהתפלגותה ידועה ואינה תלויה בפרמטר.

לדוגמה, עבור מדגם   של משתנים מהתפלגות אחידה, היחס   הוא כמות צירית, משום שההתפלגות שלו (אחידה בין אפס לאחת) אינה תלויה בפרמטר. עבור מדגם   של משתנים מהתפלגות נורמלית (בעלת תוחלת לא ידועה ושונות 1), ההפרש   הוא כמות צירית, משום שההתפלגות שלו נורמלית סטנדרטית.

אם Q היא כמות צירית, והסיכוי לטעות,  , נתון, אפשר למצוא קבועים   כך ש-  . מכיוון ש- Q תלוי בפרמטר, אפשר (לעיתים קרובות) לחלץ משוויון זה רווח סמך לפרמטר.

רווח בר-סמך לתוחלת של התפלגות נורמלית

עריכה

להתפלגות הנורמלית חשיבות רבה בסטטיסטיקה, בזכות משפט הגבול המרכזי. בתרחיש הפשוט ביותר בהקשר זה, נתון מדגם  , ומבקשים לבנות רווח בר-סמך עבור הפרמטר  , השווה לתוחלת ההתפלגות. ישנם שני מקרים:

  • אם השונות   ידועה, אז הגודל   הוא כמות צירית בעלת התפלגות נורמלית סטנדרטית (כאשר   הוא הממוצע), ומכאן אפשר לבנות את הרווח  . הערך   הוא מספר המקיים   כאשר Q משתנה נורמלי סטנדרטי. למשל, עבור  , מתקבל  .
  • אם השונות אינה ידועה, לא ניתן להיעזר בה בבניית כמות צירית, ויש להחליף אותה באומד לשונות,  . במקרה זה לכמות הצירית   יש התפלגות t עם n-1 דרגות חופש, ומכאן אפשר לבנות את הרווח  , שבו הערך   מקיים   כאשר Q משתנה בעל התפלגות t עם n-1 דרגות חופש.

הקשר לבדיקת השערות

עריכה

בנייה של רווח בר-סמך שקולה לבעיות רבות בבדיקת השערות סטטיסטית, גם אם המטרות בשני המקרים שונות בתכלית. בבניית רווח, המטרה היא להציג תחום שבו סביר למצוא את הפרמטר. בבדיקת השערות, מעוניינים לפסול (או שלא לפסול) השערה מסוימת על ערכו המדויק של הפרמטר.

אם למשל משערים שערכו של פרמטר מסוים הוא אפס, וקיים רווח בר-סמך (בעל רמת מובהקות מסוימת) שאינו כולל את הערך הזה, אז אפשר לפסול את ההשערה ברמת מובהקות זהה (או גבוהה יותר).

ראו גם

עריכה

קישורים חיצוניים

עריכה
  מדיה וקבצים בנושא רווח בר-סמך בוויקישיתוף