דרכים לחישוב שונות

מְחַבֵּר: Robert Simon
תאריך הבריאה: 21 יוני 2021
תאריך עדכון: 1 יולי 2024
Anonim
דרכים שונות לחישוב שונות משותפת
וִידֵאוֹ: דרכים שונות לחישוב שונות משותפת

תוֹכֶן

שונות מודדת את פיזור מערך הנתונים. זה מאוד שימושי בבניית מודלים סטטיסטיים: שונות נמוכה יכולה להוות אינדיקציה לכך שאתה מתאר שגיאה או רעש אקראיים במקום הקשר הבסיסי בנתונים. באמצעות מאמר זה, wikiHow מלמד כיצד לחשב שונות.

צעדים

שיטה 1 מתוך 2: חשב את השונות של מדגם

  1. כתוב את קבוצת הנתונים לדוגמה שלך. ברוב המקרים, לסטטיסטיקאים יש רק מידע על מדגם, או תת קבוצה של האוכלוסייה שהם לומדים. לדוגמא, במקום לבצע ניתוח כללי של "עלות כל מכונית בגרמניה", סטטיסטיקאי עשוי למצוא את העלות של מדגם אקראי של כמה אלפי מכוניות. הסטטיסטיקאי יכול להשתמש במדגם זה כדי לקבל הערכה טובה של עלות המכוניות בגרמניה. עם זאת, סביר להניח שהוא לא יתאים בדיוק למספרים בפועל.
    • לדוגמה: בעת ניתוח מספר המאפינס שנמכרו ביום בבית קפה, לקחת מדגם אקראי של שישה ימים וקיבלת את התוצאות הבאות: 38, 37, 36, 28, 18, 14, 12, 11, 10.7, 9.9. זהו מדגם ולא אוכלוסייה מכיוון שאין לך נתונים לכל יום בו החנות פתוחה.
    • אם כֹּל נקודות נתונים במאסטר, אנא עברו לשיטה למטה.

  2. רשמו את נוסחת השונות לדוגמא. השונות של מערך נתונים מצביעה על מידת הפיזור של נקודות הנתונים. ככל שהשונות קרובה לאפס, כך נקודות הנתונים מקובצות קרוב יותר. בעבודה עם ערכות נתונים לדוגמה, השתמש בנוסחה הבאה לחישוב השונות:
    • = /(n - 1)
    • הוא השונות. השונות מחושבת תמיד ביחידות בריבוע.
    • מייצג ערך במערכת הנתונים שלך.
    • ∑, שפירושו "סכום", אומר לך לחשב את הפרמטרים הבאים עבור כל ערך ואז להוסיף אותם יחד.
    • x̅ הוא הממוצע של המדגם.
    • n הוא מספר נקודות הנתונים.

  3. חשב את ממוצע הדגימה. הסמל x̅ או "x אופקי" משמש לציון ממוצע המדגם. חשב כמו בכל ממוצע: הוסף את כל נקודות הנתונים וחלק אותו למספר הנקודות.
    • לדוגמה: ראשית, הוסף את נקודות הנתונים שלך: 17 + 15 + 23 + 7 + 9 + 13 = 84
      לאחר מכן, חלק את התוצאה במספר נקודות הנתונים, במקרה זה שש: 84 ÷ 6 = 14.
      ממוצע לדוגמא = x̅ = 14.
    • אתה יכול לחשוב על הממוצע כ"נקודת המרכז "של הנתונים. אם הנתונים מרוכזים סביב הממוצע, השונות נמוכה. אם הם מפוזרים רחוק מהממוצע, השונות גבוהה.

  4. הפחת את הממוצע מכל נקודת נתונים. זה הזמן לחשב - x̅, כאשר כל נקודה בערכת הנתונים שלך נמצאת. כל תוצאה תציין סטייה מהממוצע של כל נקודה מקבילה, או במילים פשוטות, את המרחק ממנה לממוצע.
    • לדוגמה:
      - x̅ = 17 - 14 = 3
      - x̅ = 15 - 14 = 1
      - x̅ = 23 - 14 = 9
      - x̅ = 7 - 14 = -7
      - x̅ = 9 - 14 = -5
      - x̅ = 13 - 14 = -1
    • קל מאוד לבדוק את החישובים שלך מכיוון שהתוצאות חייבות להסתכם באפס. זאת מכיוון שבממוצע הממוצע, התוצאות השליליות (המרחק מהממוצע למספרים קטנים). תוצאות חיוביות (מרחק מממוצע למספרים גדולים יותר) מסולקות לחלוטין.
  5. ריבוע כל התוצאות. כפי שצוין לעיל, לרשימת הסטיות הנוכחית (- x̅) יש סכום של אפס. כלומר, "הסטייה הממוצעת" תמיד תהיה אפס ולא ניתן לומר דבר על פיזור הנתונים. כדי לפתור בעיה זו, אנו מוצאים את הריבוע של כל סטייה. כתוצאה מכך, כולם מספרים חיוביים, ערכים שליליים וערכים חיוביים כבר אינם מבטלים זה את זה ונותנים את הסכום אפס.
    • לדוגמה:
      (- איקס)
      - איקס)
      9 = 81
      (-7) = 49
      (-5) = 25
      (-1) = 1
    • כעת יש לך (- x̅) לכל נקודת נתונים במדגם.
  6. מצא את סכום הערכים בריבוע. זה הזמן לחשב את כל המונים של הנוסחה: ∑. הציקלו הגדול, ∑, מחייב להוסיף את ערך האלמנט הבא לכל ערך. חישבתם (- x̅) עבור כל ערך במדגם, כך שכל שעליכם לעשות הוא פשוט להוסיף את התוצאות יחד.
    • לדוגמה: 9 + 1 + 81 + 49 + 25 + 1 = 166.
  7. חלקו ב- n - 1, כאשר n הוא מספר נקודות הנתונים. לפני זמן רב, בעת חישוב שונות הדגימה, הסטטיסטיקאים מחולקים רק ל- n. חלוקה זו תתן לך את ממוצע הסטייה בריבוע, שתואמת בדיוק את השונות של המדגם. עם זאת, זכור כי המדגם הוא הערכה בלבד של אוכלוסייה גדולה יותר. אם תיקח מדגם אקראי אחר ותעשה את אותו חישוב, תקבל תוצאה אחרת. כפי שמתברר, חלוקה ב- n -1 במקום ב- n נותנת לך אומדן טוב יותר לשונות של אוכלוסייה גדולה יותר - שממש אכפת לך ממנה. תיקון זה נפוץ כל כך עד כי זוהי ההגדרה המקובלת של שונות מדגם.
    • לדוגמה: ישנן שש נקודות נתונים במדגם, לכן n = 6.
      שונות לדוגמא = 33,2
  8. להבין שונות וסטיית תקן. שים לב, מכיוון שיש נוסחות בנוסחה, השונות נמדדת בריבוע היחידות של הנתונים המקוריים. זה מבלבל ויזואלית. במקום זאת, לעתים קרובות סטיית התקן שימושית למדי. אך אין טעם לבזבז מאמץ, מכיוון שסטיית התקן נקבעת על ידי השורש הריבועי של השונות. זו הסיבה ששונות המדגם נכתבת במונחים, וסטיית התקן של מדגם היא.
    • לדוגמא, סטיית התקן של המדגם הנ"ל = s = √33.2 = 5.76.
    פרסומת

שיטה 2 מתוך 2: חישוב שונות של אוכלוסייה

  1. החל ממערכת נתוני האב. המונח "אוכלוסיה" משמש להתייחס לכל התצפיות הרלוונטיות. לדוגמא, אם אתם חוקרים את גילם של תושבי האנוי, האוכלוסייה הכוללת שלכם תכלול את הגילאים של כל האנשים החיים בהאנוי. בדרך כלל היית יוצר גיליון אלקטרוני עבור מערך נתונים גדול כזה, אך הנה ערכת נתונים לדוגמא קטנה יותר:
    • לדוגמה: בחדר של אקווריום יש בדיוק שישה אקווריומים. ששת הטנקים הללו מכילים את המספר הבא של דגים:





  2. כתוב את הנוסחה לשונות הכוללת. מכיוון שאוכלוסייה מכילה את כל הנתונים הדרושים לנו, נוסחה זו נותנת לנו את השונות המדויקת של האוכלוסייה. כדי להבדיל אותו משונות המדגם (שהיא הערכה בלבד), הסטטיסטים משתמשים במשתנים אחרים:
    • σ = /נ
    • σ = שונות מדגם. זו הנקניקיה בריבוע בדרך כלל. השונות נמדדת ביחידות בריבוע.
    • מייצג אלמנט במערכת הנתונים שלך.
    • האלמנט ב- ∑ מחושב עבור כל ערך ואז מוסיף אותו.
    • μ הוא הממוצע הכללי.
    • n הוא מספר נקודות הנתונים באוכלוסייה.
  3. מצא את ממוצע האוכלוסייה. בעת ניתוח אוכלוסיה, הסמל μ ("מו") מייצג את הממוצע החשבוני. כדי למצוא את הממוצע, הוסף את כל נקודות הנתונים ואז חלק עם מספר הנקודות.
    • אתה יכול לחשוב על אומר כ"ממוצע ", אך היזהר מכיוון שלמילה ישנן הגדרות מתמטיות רבות.
    • לדוגמה: ערך ממוצע = μ = = 10,5
  4. הפחת את הממוצע מכל נקודת נתונים. לנקודות נתונים קרובות יותר לממוצע יש הבדל קרוב יותר לאפס. חזור על בעיית החיסור של כל נקודות הנתונים, וכנראה שתתחיל להרגיש את פיזור הנתונים.
    • לדוגמה:
      - μ = 5 – 10,5 = -5,5
      - μ = 5 – 10,5 = -5,5
      - μ = 8 – 10,5 = -2,5
      - μ = 12 - 10., = 1,5
      - μ = 15 – 10,5 = 4,5
      - μ = 18 – 10,5 = 7,5
  5. ריבוע כל שלט. בשלב זה, חלק מהתוצאות המתקבלות מהשלב הקודם יהיו שליליות וחלקן יהיו חיוביות.אם אתה מדמיין את הנתונים על קו איזומורפי, שני פריטים אלה מייצגים את המספרים משמאל לימין לממוצע. זה לא יועיל לחישוב השונות, מכיוון ששתי הקבוצות הללו יבטלו זו את זו. במקום זאת, כיכר את כולם כך שכולם יהיו חיוביים.
    • לדוגמה:
      (- μ) לכל ערך של אני פועל בין 1 ל -6:
      (-5,5) = 30,25
      (-5,5) = 30,25
      (-2,5) = 6,25
      (1,5) = 2,25
      (4,5) = 20,25
      (7,5) = 56,25
  6. מצא את הממוצע של התוצאות שלך. כעת יש לך ערך עבור כל נקודת נתונים, הקשור (לא ישירות) עד כמה נקודת הנתונים רחוקה מהממוצע. ממוצע על ידי הוספתם יחד וחלוקת לפי מספר הערכים שיש לכם.
    • לדוגמה:
      שונות כוללת = 24,25
  7. מתכון ליצירת קשר. אם אינך בטוח כיצד זה מתאים לנוסחה המתוארת בתחילת השיטה, כתוב את כל הבעיה בידיים ואל תקצר:
    • לאחר מציאת ההבדל מהממוצע והריבוע, תקבל (- μ), (- μ) וכן הלאה עד (- μ), איפה נקודת הנתונים הסופית. בערכת הנתונים.
    • כדי למצוא את הממוצע של הערכים הללו, הוסיפו אותם יחד וחלקו ב- n: ((- μ) + (- μ) + ... + (- μ)) / n
    • לאחר שכתוב את המונה בסימון סיגמואיד, יש לך /נ, שונות פורמולה.
    פרסומת

עֵצָה

  • מכיוון שקשה לפרש את השונות, ערך זה מחושב לעתים קרובות כנקודת המוצא למציאת סטיית התקן.
  • השימוש ב- "n-1" במקום ב- "n" במכנה הוא טכניקה הנקראת תיקון Bessel. המדגם הוא אומדן של אוכלוסיה מלאה בלבד, ולממוצע המדגם יש הטיה מסוימת שתתאים לאומדן זה. תיקון זה מבטל את ההטיה הנ"ל. זה נוגע לעובדה שברגע שנמנו 1 נקודות נתונים, הנקודה השלישית האחרונה נ היה קבוע, מכיוון שרק ערכים מסוימים שימשו לחישוב ממוצע המדגם (x̅) בנוסחת השונות.