חשב את סכום הריבועים (SSE)

מְחַבֵּר: Charles Brown
תאריך הבריאה: 9 פברואר 2021
תאריך עדכון: 1 יולי 2024
Anonim
11 ii. Sum of Square Error using scientific calculator. SSE, SST
וִידֵאוֹ: 11 ii. Sum of Square Error using scientific calculator. SSE, SST

תוֹכֶן

סכום הריבועים, או SSE, הוא חישוב סטטיסטי ראשוני המוביל לערכי נתונים שונים. כשיש לך קבוצה של ערכי נתונים, כדאי לדעת לקבוע עד כמה ערכים אלה קשורים זה לזה. עליכם לארגן את הנתונים בטבלה ואז לבצע חישובים פשוטים למדי. לאחר שתמצא את ה- SSE עבור מערך נתונים, תוכל למצוא את השונות וסטיית התקן.

לדרוך

שיטה 1 מתוך 3: חשב את ה- SSE ביד

  1. צור טבלה בת שלוש עמודות. הדרך הברורה ביותר לחישוב SSE היא להתחיל בטבלת שלוש עמודות. תייג את שלוש העמודות ערך{ displaystyle { text {Value}}}מלא את הפרטים. העמודה הראשונה מכילה את ערכי המדידות שלך. מלא את העמודה ערך{ displaystyle { text {Value}}}חשב את הממוצע. לפני שתוכל לחשב את השגיאה עבור כל מדידה, עליך לחשב את ממוצע מערך הנתונים כולו.
    • הממוצע של מערך נתונים הוא סכום הערכים חלקי מספר הערכים בערכה. ניתן לייצג זאת באופן סמלי, עם המשתנה μ{ displaystyle mu}חשב את ערכי השגיאה הבודדים. בעמודה השנייה בטבלה שלך, עליך להזין את ערכי השגיאה עבור כל ערך נתונים. השגיאה היא ההבדל בין המדידה לממוצע.
      • עבור מערך הנתונים הנתון, הפחת את הממוצע, 98.87, מכל ערך מדוד ומלא את העמודה השנייה עם התוצאות. עשרת החישובים הללו מתנהלים כדלקמן:
        • 99,098,87=0,13{ displaystyle 99.0-98.87 = 0.13}חשב את ה- SSE. בעמודה השלישית של הטבלה, מצא את הריבוע של כל אחד מהערכים שהתקבלו בעמודה האמצעית. אלה מייצגים את ריבועי הסטייה מהממוצע עבור כל ערך נתונים שנמדד.
          • עבור כל ערך בעמודה האמצעית, השתמש במחשבון כדי לחשב את הריבוע. רשום את התוצאות בעמודה השלישית באופן הבא:
            • 0,132=0,0169{ displaystyle 0.13 ^ {2} = 0.0169}הוסף את ריבועי השגיאות. השלב האחרון הוא למצוא את סכום הערכים בעמודה השלישית. התוצאה הרצויה היא SSE, או סכום ריבועי השגיאות.
              • עבור קבוצת נתונים זו, ה- SSE מחושב על ידי הוספת עשרת הערכים בעמודה השלישית:
              • ש.ש.ה=6,921{ displaystyle SSE = 6.921}תייג את העמודות של הגיליון האלקטרוני. אתה יוצר טבלה עם שלוש עמודות ב- Excel, עם אותן שלוש כותרות כמו לעיל.
                • בתא A1 הקלד "ערך" ככותרת.
                • בתיבה B1, הקלד "סטייה" ככותרת.
                • בתיבה C1, הקלד "סטייה בריבוע" ככותרת.
              • הזן את פרטיך. בעמודה הראשונה עליך להזין את ערכי המדידות שלך. אם הסט קטן, תוכלו להקליד אותו בקלות ביד. אם יש לך מערך נתונים גדול, ייתכן שיהיה עליך להעתיק ולהדביק את הנתונים בעמודה.
              • קבע את הממוצע של נקודות הנתונים. ל- Excel יש פונקציה המחשבת את הממוצע עבורך. בתא ריק מתחת לטבלת הנתונים שלך (לא משנה באיזה תא תבחר), הזן את הדברים הבאים:
                • = ממוצע (A2: ___)
                • אל תיכנס למרחב ריק. מלא את החלל הזה עם שם התא של נקודת הנתונים האחרונה שלך. לדוגמה, אם יש לך 100 נקודות נתונים, תשתמש בפונקציה:
                  • = ממוצע (A2: A101)
                  • פונקציה זו מכילה את הנתונים מתאי A2 עד A101, מכיוון שהשורה העליונה מכילה את כותרות העמודות.
                • כאשר אתה לוחץ על Enter או כאשר אתה לוחץ לתא אחר בטבלה, התא המתוכנן החדש מתמלא אוטומטית בממוצע של ערכי הנתונים שלך.
              • הזן את הפונקציה למדידות השגיאה. בתא הריק הראשון בעמודה "סטייה", הזן פונקציה לחישוב ההפרש בין כל נקודת נתונים לממוצע. לשם כך, השתמש בשם התא שבו הממוצע נמצא. נניח שהשתמשת בתא A104 לעת עתה.
                • פונקציית חישוב השגיאה שאתה מזין בתא B2 היא:
                  • = A2- $ A $ 104. יש צורך בסימני הדולר כדי לוודא שאתה נועל את תיבת A104 לכל חישוב.
              • הזן את הפונקציה עבור השגיאות בריבוע. בעמודה השלישית תוכלו להורות ל- Excel לחשב את הריבוע הרצוי.
                • בתא C2, הזן את הפונקציה הבאה:
                  • = B2 ^ 2
              • העתק את הפונקציות למילוי הטבלה כולה. לאחר הזנת הפונקציות בתא העליון של כל עמודה, B2 ו- C2 בהתאמה, עליך למלא את הטבלה כולה. אתה יכול להקליד מחדש את הפונקציה בכל שורה בטבלה, אבל זה ייקח הרבה יותר מדי זמן. בעזרת העכבר, סמן את התאים B2 ו- C2 יחד, ומבלי לשחרר את לחצן העכבר, גרור לתא התחתון של כל עמודה.
                • בהנחה שיש לך 100 נקודות נתונים בטבלה שלך, גרור את העכבר לתאים B101 ו- C101.
                • כשאתה משחרר את לחצן העכבר, הנוסחאות מועתקות לכל תאי הטבלה. יש למלא את הטבלה באופן אוטומטי עם הערכים המחושבים.
              • מצא את ה- SSE. עמודה C בטבלה שלך מכילה את כל ערכי השגיאות בריבוע. השלב האחרון הוא לאפשר ל- Excel לחשב את סכום הערכים הללו.
                • בתא שמתחת לטבלה, כנראה C102 בדוגמה זו, הזן את הפונקציה הבאה:
                  • = סכום (C2: C101)
                • אם תלחץ על Enter או תלחץ משם בתא אחר בטבלה, תקבל את ערך ה- SSE של הנתונים שלך.

שיטה 3 מתוך 3: קשר SSE לסטטיסטיקה אחרת

  1. חשב את הסטייה מה- SSE. מציאת ה- SSE עבור מערך נתונים היא בדרך כלל אבן בניין למציאת ערכים אחרים, שימושיים יותר. הראשון שבהם הוא שונות. השונות היא מדד עד כמה הנתונים הנמדדים חורגים מהממוצע. זהו למעשה ממוצע ההבדלים בריבוע מהממוצע.
    • מכיוון שה- SSE הוא סכום השגיאות בריבוע, אתה יכול למצוא את הממוצע (זה השונות) רק על ידי חלוקה במספר הערכים. עם זאת, אם אתה מחשב את השונות של סדרת מדגם, ולא אוכלוסייה שלמה, אתה מחלק את השונות ב- (n-1) במקום ב- n. כך:
      • שונות = SSE / n, אם מחשבים את השונות של אוכלוסייה שלמה.
      • שונות = SSE / (n-1), בעת חישוב השונות של מדגם נתונים.
    • לבעיית הדגימה של טמפרטורת החולים, אנו יכולים להניח כי 10 חולים הם רק מדגם. לכן, השונות מחושבת באופן הבא:
      • שׁוֹנוּת=SSE(נ1){ displaystyle { text {Variance}} = { frac { text {SSE}} {(n-1)}}חשב את סטיית התקן של ה- SSE. סטיית תקן היא ערך נפוץ המציין עד כמה הערכים של מערך נתונים חורגים מהממוצע. סטיית התקן היא שורש הריבוע של השונות. זכור כי השונות היא הממוצע של מדידות השגיאות בריבוע.
        • לכן, לאחר חישוב ה- SSE, אתה יכול למצוא את סטיית התקן כך:
          • סטיית תקן=SSEנ1{ displaystyle { text {סטיית תקן}} = { sqrt { frac { text {SSE}} {n-1}}}השתמש ב- SSE כדי לקבוע את המשתנות. מאמר זה התמקד במערכי נתונים המודדים רק ערך יחיד בכל פעם. עם זאת, במחקרים רבים ניתן להשוות בין שני ערכים נפרדים. לדוגמה, אתה רוצה לדעת כיצד שני הערכים קשורים זה לזה, לא רק לממוצע של מערך הנתונים. ערך זה הוא המשותף.
            • החישובים לשונות משתנות מפורטים מכדי שיתוארו כאן, למעט לציין שתשתמש ב- SSE עבור כל סוג נתונים ואז תשווה אותו. לתיאור מפורט יותר של המשתנות והחישובים הכרוכים בכך, תוכלו למצוא מאמרים בנושא זה ב- wikiHow.
            • כדוגמה לשימוש במשתנות, ניתן להשוות בין גיל החולים במחקר רפואי לבין יעילות התרופה בהורדת טמפרטורת חום. אז יש לך מערך נתונים אחד של גילאים ומערך נתונים שני של טמפרטורות. לאחר מכן תמצא את ה- SSE עבור כל מערך נתונים, ומשם השונות, סטיות התקן וההשתנות.