כיצד לחשב פליטות

מְחַבֵּר: Janice Evans
תאריך הבריאה: 23 יולי 2021
תאריך עדכון: 1 יולי 2024
Anonim
מחשבון לחישוב פליטות גזי חממה
וִידֵאוֹ: מחשבון לחישוב פליטות גזי חממה

תוֹכֶן

בסטטיסטיקה, חריגים הם ערכים השונים באופן חד מערכים אחרים במערך הנתונים שנאסף. חריג יכול להצביע על חריגות בהפצת הנתונים או בשגיאות המדידה, כך שלעתים קרובות חריגים אינם נכללים במערך הנתונים. על ידי ביטול חריגים ממערך הנתונים, תוכל להגיע למסקנות בלתי צפויות או מדויקות יותר. לכן, יש צורך לחשב ולהעריך חריגים על מנת להבטיח הבנה נכונה של הנתונים הסטטיסטיים.

צעדים

  1. 1 למד לזהות חריגים פוטנציאליים. יש לזהות חריגים פוטנציאליים לפני אי הכללת חריגים ממערך הנתונים. חריגים הם ערכים השונים מאוד מרוב הערכים במערך הנתונים; במילים אחרות, חריגים נמצאים מחוץ למגמה של רוב הערכים. קל למצוא זאת בטבלאות ערכים או (במיוחד) בגרפים. אם הערכים במערך הנתונים מתואמים, החריגים יהיו רחוקים מרוב הערכים האחרים. אם, למשל, רוב הערכים נופלים על קו ישר, אזי החריגים מונחים משני צדי קו ישר כזה.
    • לדוגמה, שקול מערך נתונים המייצג את הטמפרטורות של 12 אובייקטים שונים בחדר. אם 11 אובייקטים הם בערך 70 מעלות, אבל האובייקט השניים (אולי תנור) הוא 300 מעלות, אז מבט מהיר על הערכים יכול להצביע על כך שהתנור הוא התפרצות סבירה.
  2. 2 מיין את הנתונים בסדר עולה. השלב הראשון בקביעת חריגים הוא חישוב החציון של מערך הנתונים. משימה זו מתפשטת מאוד אם הערכים במערך הנתונים מסודרים בסדר עולה (מהקטן לגדול ביותר).
    • בהמשך לדוגמה לעיל, שקול את מערך הנתונים הבא המייצג את הטמפרטורות של אובייקטים מרובים: {71, 70, 73, 70, 70, 69, 70, 72, 71, 300, 71, 69}. יש להזמין קבוצה זו כדלקמן: {69, 69, 70, 70, 70, 70, 71, 71, 71, 72, 73, 300}.
  3. 3 חשב את החציון של מערך הנתונים. החציון של מערך הנתונים הוא הערך באמצע מערך הנתונים. אם מערך הנתונים מכיל מספר אי זוגי של ערכים, החציון הוא הערך שלפני ואחריו יש אותו מספר ערכים במערך הנתונים. אבל אם מערך הנתונים מכיל מספר שווה של ערכים, עליך למצוא את הממוצע האריתמטי של שני האמצעים. שים לב שבחישוב חריגים, החציון מכונה בדרך כלל Q2, שכן הוא שוכן בין Q1 ו- Q3, הרבעונים התחתונים והעליונים, אותם נגדיר מאוחר יותר.
    • אל תפחדו לעבוד עם מערכי נתונים בעלי מספר שווה של ערכים- הממוצע האריתמטי של שני האמצעים יהיה מספר שאינו במערך הנתונים; זה נורמלי. אך אם שני ערכי הממוצע הם אותו מספר, אזי הממוצע האריתמטי שווה למספר זה; זה גם בסדר הדברים.
    • בדוגמה למעלה, 2 הערכים האמצעיים הם 70 ו -71, כך שהחציון הוא ((70 + 71) / 2) = 70.5.
  4. 4 חשב את הרבעון התחתון. ערך זה, המכונה Q1, נמצא מתחתיו 25% מערכי ערכי הנתונים. במילים אחרות, זה חצי מהערכים עד החציון. אם יש מספר שווה של ערכים ממערך הנתונים לפני החציון, עליך למצוא את הממוצע האריתמטי של שני האמצעים על מנת לחשב את Q1 (הדבר דומה לחישוב החציון).
    • בדוגמה שלנו, 6 ערכים ממוקמים אחרי החציון ו -6 ערכים- לפניו. המשמעות היא שכדי לחשב את הרבעון התחתון, עלינו למצוא את הממוצע האריתמטי של שני האמצעים של ששת הערכים הנמצאים לפני החציון. כאן הערכים הממוצעים הם 70 ו -70. לפיכך, Q1 = ((70 + 70) / 2) = 70.
  5. 5 חשב את הרבעון העליון. ערך זה, המכונה Q3, נמצא מעליו 25% מערכי מערכי הנתונים. תהליך חישוב Q3 דומה לתהליך חישוב Q1, אך כאן נשקלים הערכים לאחר החציון.
    • בדוגמה שלמעלה, שני הממוצעים של השישה אחרי החציון הם 71 ו -72. אז Q3 = ((71 + 72) / 2) = 71.5.
  6. 6 חשב את הטווח בין רבעוני. לאחר חישוב Q1 ו- Q3, יש צורך למצוא את המרחק בין ערכים אלה. לשם כך, הפחת את Q1 מ- Q3. ערך הטווח הבין -רבעוני חשוב ביותר לקביעת גבולות הערכים שאינם חריגים.
    • בדוגמה שלנו, Q1 = 70 ו- Q3 = 71.5. הטווח בין רבעוני הוא 71.5 - 70 = 1.5.
    • שים לב שזה חל גם על ערכי Q1 ו- Q3 שליליים. לדוגמה, אם Q1 = -70, אז הטווח בין רבעוני הוא 71.5 -(-70) = 141.5.
  7. 7 מצא את "הגבולות הפנימיים" של הערכים במערך הנתונים. חריגים נקבעים על ידי ניתוח הערכים- בין אם הם נופלים בתוך מה שנקרא "גבולות פנימיים" ו"גבולות חיצוניים ". ערך מחוץ ל"גבולות הפנימיים "מסווג כ"חריג קטין", בעוד שערך מחוץ ל"גבולות החיצוניים "מסווג כ"חריג משמעותי". כדי למצוא את הגבולות הפנימיים, עליך להכפיל את הטווח הבין -רבעוני ב -1.5; יש להוסיף את התוצאה לרבעון השלישי ולגרוע מ- Q1. שני המספרים שנמצאו הם הגבולות הפנימיים של מערך הנתונים.
    • בדוגמה שלנו, הטווח הבין -רבעוני הוא (71.5 - 70) = 1.5. יתר על כן: 1.5 * 1.5 = 2.25. יש להוסיף מספר זה לרבע השלישי ולחסר אותו משאלה 1 כדי למצוא את הגבולות הפנימיים:
      • 71,5 + 2,25 = 73,75
      • 70 - 2,25 = 67,75
      • לפיכך, הגבולות הפנימיים הם 67.75 ו -73.75.
    • בדוגמה שלנו, רק טמפרטורת התנור - 300 מעלות - נמצאת מחוץ לגבולות אלה ויכולה להיחשב פליטה לא משמעותית. אך אל תקפצו למסקנות - עלינו לקבוע אם הטמפרטורה הזו היא חריגה משמעותית.
  8. 8 מצא את "הגבולות החיצוניים" של מערך הנתונים. הדבר נעשה באותו אופן כמו לגבי גבולות פנים, אלא שהטווח הבין -רבעוני מוכפל ב -3 במקום 1.5. יש להוסיף את התוצאה לרבעון השלישי ולגרוע מרבעון ראשון. שני המספרים שנמצאו הם הגבולות החיצוניים של מערך הנתונים.
    • בדוגמה שלנו, הכפל את הטווח הבין -רבעוני ב -3: 1.5 * 3 = 4.5. חשב את הגבולות החיצוניים:
      • 71,5 + 4,5 = 76
      • 70 - 4,5 = 65,5
      • אז הגבולות החיצוניים הם 65.5 ו -76.
    • כל ערכים הנופלים מחוץ לגבולות החיצוניים נחשבים לפליטות משמעותיות. בדוגמה שלנו, טמפרטורת תנור של 300 מעלות נחשבת לתקיפה משמעותית.
  9. 9 השתמש באומדן איכותי כדי לקבוע אם יש להוציא חריגים ממערך הנתונים. השיטה המתוארת לעיל מאפשרת לך לקבוע אם ערכים מסוימים הם חריגים (מינוריים או משמעותיים). עם זאת, אל תטעו - ערך המסווג כחריג הוא רק "מועמד" לחריג, כלומר אין צורך להוציא אותו מהכלל. הסיבה לחריגה היא הגורם העיקרי המשפיע על ההחלטה להוציא את החריגה. ככלל, חריגים המתרחשים עקב שגיאות (במדידות, הקלטות וכו ') אינם נכללים. מצד שני, חריגים הקשורים לא לשגיאות אלא למידע או מגמה חדשה בדרך כלל נותרים במערך הנתונים.
    • לא פחות חשוב להעריך את ההשפעה של חריגים על החציון של מערך הנתונים (בין אם הם מעוותים אותו או לא). זה חשוב במיוחד כאשר אתה מסיק מסקנות מחציון של מערך נתונים.
    • בדוגמה שלנו, אין זה סביר ביותר שהתנור יתחמם לטמפרטורה של 300 מעלות (אלא אם ניקח בחשבון חריגות טבעיות). לכן ניתן להסיק (ברמת ודאות גבוהה) שטמפרטורה כזו היא טעות מדידה שצריך להוציא ממערך הנתונים. יתר על כן, אם לא תשלול את החריגה החציונית של מערך הנתונים תהיה (69 + 69 + 70 + 70 + 70 + 70 + 71 + 71 + 71 + 72 + 73 + 300) / 12 = 89.67 מעלות, אבל אם לא תכלול את החריגה החציונית תהיה (69 + 69 + 70 + 70 + 70 + 70 + 71 + 71 + 71 + 72 + 73) / 11 = 70.55 מעלות.
      • חריגים הם בדרך כלל תוצאה של טעויות אנוש, ולכן יש להוציא חריגים ממערכי נתונים.
  10. 10 הבן את חשיבותם של החריגים (לפעמים) שנותרו במערך הנתונים. יש להוציא כמה חריגים ממערך הנתונים מכיוון שהם נובעים משגיאות ובעיות טכניות; יש להשאיר חריגים אחרים במערך הנתונים. אם, למשל, חריג אינו תוצאה של שגיאה ו / או מספק הבנה חדשה של התופעה הנבדקת, יש להשאיר אותה במערך הנתונים. ניסויים מדעיים רגישים במיוחד לבלטים יוצאי דופן - על ידי ביטול בטעות של חריג, ייתכן שתפספס איזה טרנד או תגלית חדשים.
    • לדוגמה, אנו מפתחים תרופה חדשה להגדלת גודל הדגים בדיג. נשתמש במערך הנתונים הישן ({71, 70, 73, 70, 70, 69, 70, 72, 71, 300, 71, 69}), אך הפעם כל ערך ייצג את משקל הדג (בגרמים) לאחר בליעה תרופה ניסיונית. במילים אחרות, התרופה הראשונה מביאה לעלייה במשקל הדגים עד 71 גרם, התרופה השנייה - עד 70 גרם וכן הלאה. במצב זה, 300 הוא חריג משמעותי, אך אסור לשלול זאת; אם נניח שלא היו טעויות מדידה, אז חריגה כזו היא הצלחה משמעותית בניסוי. התרופה, שהעלתה את משקל הדג ל -300 גרם, עובדת הרבה יותר טוב מתרופות אחרות; לכן 300 הוא הערך החשוב ביותר במערך הנתונים.

טיפים

  • כאשר נמצאו חריגים, נסה להסביר את נוכחותם לפני שתחסל אותם ממערך הנתונים. הם יכולים להצביע על טעויות מדידה או חריגות הפצה.

מה אתה צריך

  • מַחשְׁבוֹן