מבחן כי בריבוע

מבחן כי בריבוע הוא מבחן סטטיסטי המבוסס על סטטיסטיים בעלי התפלגות כי בריבוע (במדויק או בקירוב), שיש לו שלושה שימושים בסיסיים: השוואת הפרופורציות של תכונה מסוימת באוכלוסייה להסתברויות נתונות; השוואת הפרופורציות של תכונה בשתי אוכלוסיות שונות; ובדיקת התלות של שתי תכונות באוכלוסייה. לשימושים אלה יש מגוון רחב של הכללות.

בהשוואה למבחנים סטטיסטיים מקובלים אחרים, מבחן כי בריבוע מיועד להתפלגויות בדידות (ובפרט לגרסאות של ההתפלגות המולטינומית). הסטטיסטי מתקבל בכל המקרים מסיכום ערכים מהצורה , כאשר O הוא מספר ההופעות הנצפה (Observed), ו- E הוא המספר הצפוי (Expected).

דוגמאות

  • קוביית משחק הוגנת היא כזו שהסיכויים שלה ליפול על כל פאה הם שווים. אם מטילים את הקוביה 100 פעמים ומתקבלת ההתפלגות 13,17,25,12,10,23 (כלומר, הקוביה מציגה את הפאה "1" 13 פעמים, וכן הלאה), מבחן כי בריבוע קובע ברמת מובהקות של 5% שהקוביה אינה הוגנת. פורמלית, המשתנה המקרי המציג את תוצאת הקוביה מתפלג מולטינומית (עם הסתברויות לא ידועות), והשערת האפס קובעת שזו התפלגות אחידה. המבחן בודק את ההשערה על ידי בניה של סטטיסטי מתאים, כפי שיוסבר בהמשך.
  • בסקר על העדפת מוצרים מתברר שמבין 57 המשיבים הגברים מעדיפים 20, 19 ו-18 את המוצרים א', ב' ו-ג', בהתאמה, ואילו בין 53 המשיבות הנשים, ההתפלגות היא 13, 29 ו-11. במקרה זה קובע מבחן כי בריבוע שאין הבדל בין העדפות הגברים לנשים. השערת האפס אינה מתייחסת כאן להתפלגות של הגברים או הנשים בנפרד, אלא רק לכך שההתפלגויות שוות זו לזו.
  • בשמורת טבע גדולה לוכדים עורבים כדי להשוות בין צבע הנוצות (שחור, לבן או ירוק) לצורת המקור (ארוך, קצר או מפוצל). חוקר הטבע יאסוף את הנתונים במטריצה בת שלוש שורות ושלושה טורים, וישתמש במבחן כי בריבוע כדי לקבוע שיש קשר בין הצבע לצורת המקור, או שאין די נתונים להוכיח קשר כזה. כמו בדוגמה הקודמת, השערת האפס אינה עוסקת בהתפלגות של הצבע בין ארוכי המקור, או בהתפלגות של צורת המקור בין ירוקי הנוצות, אלא רק בטענה ששני הפרמטרים אינם תלויים זה בזה.

תאוריה

התפלגות כי בריבוע מתקבלת מסיכום הריבועים של משתנים מקריים נורמליים סטנדרטיים. אם עיבוד הנוסחה נכשל (MathML עם גיבוי SVG או PNG (מומלץ לדפדפנים מודרניים ולכלי נגישות): תגובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://en.wikipedia.org/api/rest_v1/":): {\displaystyle \ Z_i \sim N(0,1)} עבור עיבוד הנוסחה נכשל (MathML עם גיבוי SVG או PNG (מומלץ לדפדפנים מודרניים ולכלי נגישות): תגובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://en.wikipedia.org/api/rest_v1/":): {\displaystyle \ i =1,\dots,n} והם בלתי תלויים, אז למשתנה עיבוד הנוסחה נכשל (MathML עם גיבוי SVG או PNG (מומלץ לדפדפנים מודרניים ולכלי נגישות): תגובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://en.wikipedia.org/api/rest_v1/":): {\displaystyle \ X = \sum Z_i^2} יש התפלגות כי בריבוע עם n דרגות חופש. מבחני כי בריבוע מבוססים כולם על בניית סטטיסטיים המתפלגים כך, בקירוב, ואת אלו בונים באמצעות סיכום של ריבועי משתנים שהם בלתי תלויים (בקירוב) ומתפלגים (בקירוב) נורמלית.

לדוגמה, אם תוצאת הקוביה מתפלגת מולטינומית עם סיכוי ליפול על הערך i, ובמדגם בן n הטלות התקבלה התוצאה i עיבוד הנוסחה נכשל (MathML עם גיבוי SVG או PNG (מומלץ לדפדפנים מודרניים ולכלי נגישות): תגובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://en.wikipedia.org/api/rest_v1/":): {\displaystyle \ X_i} פעמים, אז . לפי הקירוב הנורמלי להתפלגות בינומית, עיבוד הנוסחה נכשל (MathML עם גיבוי SVG או PNG (מומלץ לדפדפנים מודרניים ולכלי נגישות): תגובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://en.wikipedia.org/api/rest_v1/":): {\displaystyle \ (X_i-np_i)/\sqrt{p_i(1-p_i)}} מתפלג, בקירוב, נורמלית. בשקלול מתאים, סכום המשתנים האלה הוא אפס, ולכן סכום הריבועים שלהם מתפלג, בקירוב, כי בריבוע עם n-1 (ולא n) דרגות חופש. כדי לבחון את השערת האפס עיבוד הנוסחה נכשל (MathML עם גיבוי SVG או PNG (מומלץ לדפדפנים מודרניים ולכלי נגישות): תגובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://en.wikipedia.org/api/rest_v1/":): {\displaystyle \ (p_1,\dots,p_6) = (a_1,\dots,a_6)} (כאשר עיבוד הנוסחה נכשל (MathML עם גיבוי SVG או PNG (מומלץ לדפדפנים מודרניים ולכלי נגישות): תגובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://en.wikipedia.org/api/rest_v1/":): {\displaystyle \ a_1,\dots,a_6} הם מספרים כלשהם שסכומם 1), בונים את הסטטיסטי עיבוד הנוסחה נכשל (MathML עם גיבוי SVG או PNG (מומלץ לדפדפנים מודרניים ולכלי נגישות): תגובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://en.wikipedia.org/api/rest_v1/":): {\displaystyle \ X = \sum \frac{(X_i-a_i n)^2}{a_in}} , ומשווים את הערך שהוא מקבל להתפלגות עיבוד הנוסחה נכשל (שגיאת המרה. השרת ("https://en.wikipedia.org/api/rest_") השיב: "Cannot get mml. Server problem."): {\displaystyle \ \chi _{n-1}^{2}} (אם הערך הוא גבוה במידה כזו שהסיכוי לקבל אותו נמוך מ-5%, נאמר, אז דוחים את ההשערה ופוסקים שהקוביה אינה מתפלגת לפי הווקטור ).

כשבודקים את התלות בין שני משתנים מקריים בדידים A,B (שהם א-פריורי תלויים), העשויים לקבל a ו-b ערכים, בהתאמה, אז ידוע שההתפלגות המשותפת היא מולטינומית, המוגדרת על ידי מטריצה של הסתברויות (שסכומן 1). השערת האפס (שלפיה המשתנים בלתי תלויים) אינה מתארת באופן חד-משמעי את ההסתברויות, אלא קובעת שאפשר לחשב אותן מן ההתפלגויות של A ו-B. במלים אחרות, לפי השערת האפס קיימים וקטורים ו- (שסכום כל אחד מהם 1, והמתארים את ההתפלגויות של A ו-B בהתאמה), כך ש- . כדי לאמוד את הערכים יש לסכם את השורות והעמודות במטריצת התצפיות , כלומר, להשתמש בערכים ו- ; לפי אותו מינוח, . הערך הצפוי במשבצת ה-i,j, בהנחה של אי-תלות, הוא , והסטטיסטי הוא, בקירוב, בעל התפלגות כי-בריבוע, עם דרגות חופש.

This article is issued from Hamichlol. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.