(!LANG:שיטות ניתוח רגרסיה. שיטות סטטיסטיקה מתמטית. ניתוח רגרסיה

ביצירותיו מתוארכות לשנת 1908. הוא תיאר זאת באמצעות הדוגמה של עבודתו של סוכן מוכר נדל"ן. ברישומים שלו, סוחר הבית ניהל רישום של טווח רחבנתוני מקור עבור כל מבנה ספציפי. על סמך תוצאות המכרז, נקבע לאיזה גורם הייתה ההשפעה הגדולה ביותר על מחיר העסקה.

אָנָלִיזָה מספר גדולעסקאות הניבו תוצאות מעניינות. גורמים רבים השפיעו על המחיר הסופי, ולעתים הובילו למסקנות פרדוקסליות ואף ל"חריגים" מוחלטים כאשר בית עם פוטנציאל ראשוני גבוה נמכר במדד מחיר נמוך יותר.

הדוגמה השנייה ליישום ניתוח כזה היא העבודה שהופקדה על קביעת שכר העובדים. מורכבות המשימה הייתה שנדרשה לא לחלק סכום קבוע לכולם, אלא להתאים בקפדנות את ערכה לעבודה הספציפית שבוצעה. הופעתן של בעיות רבות עם פתרונות דומים כמעט דרשה מחקר מפורט יותר שלהן ברמה המתמטית.

מקום משמעותי ניתן לסעיף "ניתוח רגרסיה", הוא שילב שיטות מעשיותמשמש לחקר תלות שנופלות תחת המושג רגרסיה. קשרים אלה נצפים בין הנתונים שהתקבלו במהלך מחקרים סטטיסטיים.

בין המשימות הרבות שיש לפתור, הוא מציב לעצמו שלוש מטרות עיקריות: ההגדרה למשוואת הרגרסיה השקפה כללית; בניית אומדנים של פרמטרים שאינם ידועים, שהם חלק ממשוואת הרגרסיה; בדיקת השערות רגרסיה סטטיסטית. במהלך לימוד הקשר הנוצר בין זוג כמויות המתקבלות כתוצאה מתצפיות ניסיוניות ומהווים סדרה (סט) מהסוג (x1, y1), ..., (xn, yn), הם מסתמכים על את הוראות תיאוריית הרגרסיה ומניחים שעבור כמות אחת Y, נצפית התפלגות הסתברות מסוימת, בעוד שה-X השני נשאר קבוע.

התוצאה Y תלויה בערך המשתנה X, תלות זו יכולה להיקבע על ידי דפוסים שונים, בעוד שדיוק התוצאות המתקבלות מושפע מאופי התצפיות וממטרת הניתוח. המודל הניסיוני מבוסס על הנחות מסוימות שהן פשטניות אך סבירות. התנאי העיקרי הוא שהפרמטר X הוא ערך מבוקר. ערכיו נקבעים לפני תחילת הניסוי.

אם במהלך הניסוי נעשה שימוש בזוג ערכי XY בלתי מבוקרים, ניתוח רגרסיה מתבצע באותו אופן, אך לצורך פרשנות התוצאות, שבמהלכו נלמד הקשר בין המשתנים האקראיים הנחקרים, נעשה שימוש בשיטות שיטות של סטטיסטיקה מתמטית אינן נושא מופשט. הם מוצאים את יישומם בחיים בתחומים שונים של פעילות אנושית.

בספרות המדעית, המונח ניתוח רגרסיה ליניארי מצא שימוש נרחב כדי להגדיר את השיטה לעיל. עבור המשתנה X משתמשים במונח רגרסטור או מנבא, ומשתני ה-Y התלויים נקראים גם משתני קריטריון. מינוח זה משקף רק את התלות המתמטית של משתנים, אך לא את הקשרים הסיבתיים-סיבתיים.

ניתוח רגרסיה הוא השיטה הנפוצה ביותר בעיבוד תוצאות של מגוון רחב של תצפיות. תלות פיזית וביולוגית נחקרת באמצעות שיטה זו, היא מיושמת הן בכלכלה והן בטכנולוגיה. שורה של תחומים אחרים משתמשים במודלים של ניתוח רגרסיה. ניתוח שונות, ניתוח סטטיסטי רב משתני עובדים בשיתוף פעולה הדוק עם שיטת מחקר זו.

ניתוח רגרסיה הוא שיטה לביסוס ביטוי אנליטי של קשר סטוכסטי בין המאפיינים הנחקרים. משוואת הרגרסיה מראה כיצד, בממוצע, משתנה בְּ-כאשר משנים כל אחד מהם איקס אני , ונראה כמו:

איפה י -משתנה תלוי (הוא תמיד אחד);

איקס אני - משתנים בלתי תלויים (גורמים) (יכולים להיות כמה מהם).

אם יש רק משתנה בלתי תלוי אחד, זהו ניתוח רגרסיה פשוט. אם יש כמה פ 2), אז ניתוח כזה נקרא רב משתנים.

במהלך ניתוח הרגרסיה נפתרות שתי משימות עיקריות:

    בניית משוואת הרגרסיה, כלומר. מציאת סוג הקשר בין מדד התוצאה לגורמים בלתי תלויים איקס 1 , איקס 2 , …, איקס נ .

    הערכת המשמעות של המשוואה המתקבלת, כלומר. קביעה של כמה תכונות הגורם שנבחרו מסבירות את הווריאציה של התכונה y.

ניתוח רגרסיה משמש בעיקר לתכנון, כמו גם לפיתוח מסגרת רגולטורית.

בניגוד לניתוח מתאם, שעונה רק על השאלה האם יש קשר בין התכונות המנותחות, ניתוח הרגרסיה נותן גם את הביטוי הרשמי שלו. בנוסף, אם ניתוח המתאם חוקר קשר כלשהו של גורמים, אז ניתוח הרגרסיה חוקר תלות חד-צדדית, כלומר. קשר המראה כיצד שינוי בסימני הגורמים משפיע על הסימן שנוצר.

ניתוח רגרסיה הוא אחת השיטות המפותחות ביותר של סטטיסטיקה מתמטית. באופן קפדני, יישום ניתוח רגרסיה דורש מילוי של מספר דרישות מיוחדות (בפרט, איקסל ,איקס 2 ,...,איקס נ ;yחייב להיות עצמאי, מופץ בצורה נורמלית משתנים אקראייםעם סטיות קבועות). בְּ החיים האמיתייםעמידה קפדנית בדרישות של ניתוח רגרסיה וקורלציה היא נדירה מאוד, אך שתי השיטות הללו נפוצות מאוד במחקר כלכלי. התלות בכלכלה יכולה להיות לא רק ישירות, אלא גם הפוכה ולא ליניארית. ניתן לבנות מודל רגרסיה בנוכחות כל תלות, אולם בניתוח רב-משתני משתמשים רק במודלים ליניאריים של הצורה:

בניית משוואת הרגרסיה מתבצעת, ככלל, בשיטת הריבועים הקטנים, שעיקרה היא למזער את סכום הסטיות בריבוע של הערכים בפועל של התכונה המתקבלת מהערכים המחושבים שלה, כלומר:

איפה לא -מספר תצפיות;

י =א+ב 1 איקס 1 י 2 איקס 2 י + ... + ב נ איקס נ י - ערך מחושב של גורם התוצאה.

מקדמי רגרסיה מומלץ לקבוע באמצעות חבילות אנליטיות למחשב אישי או מחשבון פיננסי מיוחד. במקרה הפשוט ביותר, מקדמי הרגרסיה החד משתנים משוואה לינאריתסוג רגרסיה y = a + bxניתן למצוא באמצעות הנוסחאות:

ניתוח אשכולות

ניתוח אשכולות הוא אחת משיטות הניתוח הרב-משתני, המיועדת לקיבוץ (אשכול) אוכלוסייה, שמרכיביה מאופיינים במאפיינים רבים. הערכים של כל אחת מהתכונות משמשות כקואורדינטות של כל יחידה מהאוכלוסייה הנחקרת במרחב הרב-ממדי של תכונות. כל תצפית, המאופיינת בערכים של מספר אינדיקטורים, יכולה להיות מיוצגת כנקודה במרחב של אינדיקטורים אלה, שערכיה נחשבים כקואורדינטות במרחב רב ממדי. מרחק בין נקודות רו שעם קקואורדינטות מוגדרות כ:

הקריטריון העיקרי לאשכול הוא שההבדלים בין אשכולות צריכים להיות משמעותיים יותר מאשר בין תצפיות המוקצות לאותו אשכול, כלומר. במרחב רב מימדי, יש לשים לב לאי השוויון:

איפה ר 1, 2 - מרחק בין אשכולות 1 ו-2.

כמו גם הליכי ניתוח הרגרסיה, הליך האשכולות די מייגע, רצוי לבצע אותו במחשב.

שיטת ניתוח הרגרסיה משמשת לקביעת הפרמטרים הטכניים והכלכליים של מוצרים הקשורים לסדרה פרמטרית ספציפית, על מנת לבנות וליישר קשרי ערך. שיטה זו משמשת לניתוח והצדקה של רמת ויחסי מחיר של מוצרים המאופיינים בנוכחות של פרמטר טכני וכלכלי אחד או יותר המשקפים את מאפייני הצרכן העיקריים. ניתוח רגרסיה מאפשר לנו למצוא נוסחה אמפירית המתארת ​​את התלות של המחיר בפרמטרים הטכניים והכלכליים של מוצרים:

P=f(X1X2,...,Xn),

כאשר P הוא הערך של מחיר היחידה של המוצר, שפשוף; (X1, X2, ... Xp) - פרמטרים טכניים וכלכליים של מוצרים.

שיטת ניתוח הרגרסיה - המתקדמת ביותר מבין השיטות הנורמטיביות והפרמטריות בהן נעשה שימוש - יעילה בביצוע חישובים המבוססים על שימוש מודרני טכנולוגיות מידעומערכות. היישום שלה כולל את השלבים העיקריים הבאים:

  • הגדרת סיווג קבוצות פרמטריות של מוצרים;
  • בחירת פרמטרים בעלי ההשפעה הגדולה ביותר על מחיר המוצר;
  • בחירה והצדקה של צורת התקשורת של שינויים במחיר בעת שינוי פרמטרים;
  • בניית מערכת משוואות נורמליות וחישוב מקדמי רגרסיה.

קבוצת ההסמכה העיקרית של מוצרים, שמחירם כפוף להשוואה, היא טווח פרמטרי, שבתוכו ניתן לקבץ מוצרים לפי עיצובים שונים בהתאם ליישומם, תנאי ההפעלה והדרישות וכו' בעת יצירת סדרות פרמטריות, סיווג אוטומטי ניתן ליישם שיטות המאפשרות מתוך המסה הכוללת של מוצרים להקצות את הקבוצות ההומוגניות שלה. בחירת הפרמטרים הטכניים והכלכליים מבוססת על הדרישות הבסיסיות הבאות:

  • הרכב הפרמטרים הנבחרים כולל את הפרמטרים הקבועים בתקנים ובמפרטים; חוץ מזה פרמטרים טכניים(כוח, כושר נשיאה, מהירות וכו') נעשה שימוש באינדיקטורים של ייצור סדרתי, גורמי מורכבות, איחוד וכו';
  • קבוצת הפרמטרים הנבחרים צריכה לאפיין במידה מספקת את המאפיינים העיצוביים, הטכנולוגיים והתפעוליים של המוצרים הכלולים בסדרה, ולהיות בעלי מתאם קרוב למדי עם המחיר;
  • פרמטרים לא צריכים להיות תלויים זה בזה.

כדי לבחור פרמטרים טכניים וכלכליים המשפיעים באופן משמעותי על המחיר, מחושבת מטריצה ​​של מקדמי מתאם של זוג. לפי גודל מקדמי המתאם בין הפרמטרים, ניתן לשפוט את אטימות הקשר ביניהם. יחד עם זאת, מתאם קרוב לאפס מראה השפעה קלה של הפרמטר על המחיר. הבחירה הסופית של פרמטרים טכניים וכלכליים מתבצעת בתהליך של ניתוח רגרסיה מדורג באמצעות טכנולוגיית מחשבותוכניות סטנדרטיות קשורות.

בתרגול התמחור, נעשה שימוש בסט הפונקציות הבא:

ליניארי

P = ao + alXl + ... + antXn,

כוח ליניארי

P \u003d ao + a1X1 + ... + anXp + (an + 1Xp) (an + 1Xp) + ... + (an + nXp2) (an + nXp2)

לוגריתם הפוך

P \u003d a0 + a1: ב-X1 + ... + an: ב-Xn,

כּוֹחַ

P = a0 (X1^a1) (X2^a2) .. (Xn^an)

הפגנה

P = e^(a1+a1X1+...+anXn)

היפרבולי

P \u003d ao + a1: X1 + a2: X2 + ... + an: Xn,

כאשר P - השוואת מחירים; X1 X2,..., Xn - ערך הפרמטרים הטכניים והכלכליים של מוצרי הסדרה; a0, a1 ..., an - מקדמים מחושבים של משוואת הרגרסיה.

בְּ עבודה מעשיתלתמחור, בהתאם לצורת קשר המחיר ולפרמטרים טכניים וכלכליים, ניתן להשתמש במשוואות רגרסיה אחרות. סוג פונקציית היחס בין המחיר למערך הפרמטרים הטכניים והכלכליים ניתן להגדיר מראש או לבחור אוטומטית במהלך עיבוד במחשב. אטימות המתאם בין המחיר למכלול הפרמטרים נאמדת לפי ערך מקדם המתאם המרובה. קרבתו לאחדות מעידה על קשר קרוב. על פי משוואת הרגרסיה, מתקבלים הערכים המיושרים (מחושבים) של מחירי המוצרים מסדרה פרמטרית זו. כדי להעריך את תוצאות היישור, מחושבות הסטיות היחסיות של ערכי המחיר המחושבים מאלה בפועל:

Tsr \u003d Rf - Rr: R x 100

איפה Рф, Рр - מחירים בפועל ואומדנים.

הערך של Cr לא יעלה על 8-10%. במקרה של חריגות משמעותיות של הערכים המחושבים מהערכים בפועל, יש צורך לחקור:

  • נכונות היווצרות הסדרה הפרמטרית, שכן הרכבה עשוי לכלול מוצרים הנבדלים מאוד בפרמטרים שלהם ממוצרים אחרים בסדרה. יש להחריג אותם;
  • בחירה נכונה של פרמטרים טכניים וכלכליים. תיתכן קבוצה של פרמטרים המתואמים באופן חלש למחיר. במקרה זה, יש צורך להמשיך בחיפוש ובחירת הפרמטרים.

ההליך והמתודולוגיה לביצוע ניתוח רגרסיה, מציאת פרמטרים לא ידועים של המשוואה וההערכה הכלכלית של התוצאות המתקבלות מתבצעות בהתאם לדרישות הסטטיסטיקה המתמטית.

אפיון תלות סיבתיות

מערכת יחסים מזדמנת- זהו חיבור של תופעות ותהליכים, כאשר שינוי באחד מהם - הגורם - מביא לשינוי באחר - ההשפעה.

סימנים לפי חשיבותם לחקר הקשר מתחלקים לשתי כיתות.

סימנים הגורמים לשינויים בסימנים קשורים אחרים נקראים גורם (או גורמים).

סימנים המשתנים בהשפעת סימני גורמים הם פּרוּדוּקטִיבִי.

ישנן את צורות התקשורת הבאות: פונקציונלית וסטוכסטית. פוּנקצִיוֹנָלִיהם קוראים לקשר כזה שבו ערך מסוים של תכונת גורם מתאים לערך אחד ויחיד של התכונה המתקבלת. הקשר התפקודי בא לידי ביטוי בכל מקרי התצפית ולכל יחידה ספציפית של האוכלוסייה הנחקרת.

הקשר הפונקציונלי יכול להיות מיוצג על ידי המשוואה הבאה:
y i =f(x i),איפה: y i - סימן יעיל; f(x i) - הפונקציה הידועה של הקשר בין הסימנים היעילים לגורם; x i - סימן גורם.
בטבע האמיתי, אין קשרים פונקציונליים. הם רק הפשטות, שימושיות בניתוח תופעות, אך מפשטות את המציאות.

סטוכסטי (סטטיסטי או אקראי)חיבורהוא קשר בין כמויות שבהן מגיב אחת מהן לשינוי בכמות אחרת או בכמויות אחרות בשינוי חוק החלוקה. במילים אחרות, עם הקשר הזה ערכים שוניםמשתנה אחד מתאים להתפלגות שונות של משתנה אחר. זאת בשל העובדה שהמשתנה התלוי, בנוסף לבלתי תלויים הנחשבים, נתון להשפעה של מספר גורמים אקראיים בלתי מבוקרים או בלתי מבוקרים, כמו גם כמה טעויות בלתי נמנעות במדידת המשתנים. בשל העובדה שהערכים של המשתנה התלוי נתונים לפיזור אקראי, לא ניתן לחזות אותם בדיוק מספיק, אלא ניתן לציין אותם רק בהסתברות מסוימת.

בשל אי הבהירות של התלות הסטוכסטית בין Y ו-X, בפרט, סכימת התלות הממוצעת על x היא מעניינת, כלומר. דפוס בשינוי בערך הממוצע - התוחלת המתמטית המותנית Mx (Y) (התוחלת המתמטית של משתנה אקראי Y, שנמצא בתנאי שהמשתנה X קיבל את הערך x) בהתאם ל-x.

מתאם הוא מקרה מיוחד של קשר סטוכסטי. מתאם(מ-lat. מתאם- יחס, קשר). פרשנות ישירה של המונח מתאם - סטוכסטי, סביר, אפשרי חיבור בין שני (זוג) או מספר משתנים אקראיים (מרובים).

מתאם בין שני משתנים נקרא גם קשר סטטיסטי בין משתנים אלו, שבו כל ערך של משתנה אחד מתאים לערך ממוצע מסוים, כלומר. ציפייה מותנית היא אחרת. תלות בקורלציה היא מקרה מיוחד של תלות סטוכסטית, שבה שינוי בערכי סימני הגורמים (x 1 x 2 ..., x n) גורר שינוי בערך הממוצע של הסימן האפקטיבי.



נהוג להבחין הסוגים הבאיםמתאמים:

1. מתאם זוג - הקשר בין שני סימנים (אפקטיבי ופקטוריאלי או שני גורמים).

2. מתאם חלקי - הקשר בין מאפייני הגורם המתקבל לאחד עם ערך קבוע של מאפייני גורם אחרים שנכללו במחקר.

3. מתאם מרובה - התלות של המאפיינים המתקבלים ושני גורמים או יותר שנכללו במחקר.

מטרת ניתוח רגרסיה

מודלים של רגרסיה הם צורה אנליטית של ייצוג של קשרים סיבתיים. התקפות המדעית והפופולריות של ניתוח רגרסיה הופכות אותו לאחד הכלים המתמטיים העיקריים למידול התופעה הנחקרת. שיטה זו משמשת כדי להחליק נתונים ניסיוניים ולהשיג הערכות כמותיותהשפעה השוואתית של גורמים שונים על המשתנה המתקבל.

ניתוח רגרסיה הואבהגדרה של ביטוי אנליטי של מערכת יחסים, שבה שינוי בערך אחד (משתנה תלוי או תכונה תוצאה) נובע מהשפעה של משתנה בלתי תלוי אחד או יותר (גורמים או מנבאים), ומקבוצת כל הגורמים האחרים גם להשפיע על הערך התלוי נלקח כערכים קבועים וממוצעים.

מטרות של ניתוח רגרסיה:

הערכת התלות הפונקציונלית של הערך הממוצע המותנה של התכונה האפקטיבית y על הגורמים הפקטוריים (x 1, x 2, ..., x n);

חיזוי הערך של המשתנה התלוי באמצעות המשתנים הבלתי תלויים.

קביעת התרומה של משתנים בלתי תלויים בודדים לשונות של המשתנה התלוי.

לא ניתן להשתמש בניתוח רגרסיה כדי לקבוע אם יש קשר בין משתנים, שכן קיומו של קשר כזה הוא תנאי מוקדם ליישום הניתוח.

בניתוח הרגרסיה, נוכחותם של קשרי סיבה ותוצאה בין הסימנים היעילים (Y) וגורם x 1, x 2 ..., x n נרמז מראש.

פוּנקצִיָה , אופשבודקת את התלות של המחוון בפרמטרים, נקראת משוואת הרגרסיה (פונקציה)אחד . משוואת הרגרסיה מציגה את הערך הצפוי של המשתנה התלוי עבור ערכים מסוימים של המשתנים הבלתי תלויים.
תלוי במספר הגורמים הכלולים במודל איקסמודלים מחולקים לגורם יחיד (מודל רגרסיה זוגי) ולרב גורמים (מודל רגרסיה מרובה). בהתאם לסוג הפונקציה, המודלים מחולקים לליניארי ולא ליניארי.

מודל רגרסיה זוגי

עקב ההשפעה של גורמים וסיבות אקראיות לא מטופלים, תצפיות בודדות y יחרגו במידה רבה יותר או פחות מפונקציית הרגרסיה f(x). במקרה זה, משוואת הקשר של שני משתנים (מודל רגרסיה זוגית) יכולה להיות מיוצגת כך:

Y=f(X) + ɛ,

כאשר ɛ הוא משתנה אקראי המאפיין את הסטייה מפונקציית הרגרסיה. משתנה זה נקרא הפרעה או הפרעה (שארית או שגיאה). לפיכך, במודל הרגרסיה, המשתנה התלוי ייש פונקציה כלשהי f(X)עד להפרעה אקראית ɛ.

שקול את מודל הרגרסיה הקלאסי של זוג ליניארי (CLPR). היא נראית כמו

y i \u003d β 0 + β 1 x i + ɛ i (i \u003d 1,2, ..., n),(1)

איפה אני-מוסבר (משתנה מתקבל, תלוי, אנדוגני); x i– משתנה מסביר (מנבא, פקטוריאלי, אקסוגני); β 0 , β 1- מקדמים מספריים; ɛi– רכיב או שגיאה אקראית (סטוכסטית).

תנאים בסיסיים (דרישות מוקדמות, השערות) של KLMPR:

1) x i- ערך דטרמיניסטי (לא אקראי), ההנחה היא שבין הערכים של x i - לא כולם זהים.

2) תוחלת מתמטית (ערך ממוצע) של ההפרעה ɛiשווה לאפס:

М[ɛ i ]=0 (i=1,2, …, n).

3) פיזור ההפרעות קבוע עבור כל ערכים של i (מצב הומוסקדסטיות):

D[ɛ i ]=σ 2 (i=1,2, …, n).

4) הפרעות לתצפיות שונות אינן מתואמות:

cov[ɛ i , ɛ j ]=M[ɛ i , ɛ j ]=0 עבור i≠j,

כאשר cov[ɛ i , ɛ j ] הוא מקדם השונות (מומנט המתאם).

5) הפרעות הן משתנים אקראיים מפוזרים נורמליים עם אפס ממוצע ושונות σ 2:

ɛ i ≈ N(0, σ 2).

כדי לקבל משוואת רגרסיה, מספיקות ארבע ההנחות הראשונות. הדרישה למלא את הנחת היסוד החמישית נחוצה כדי להעריך את הדיוק של משוואת הרגרסיה והפרמטרים שלה.

תגובה:תשומת הלב לקשרים ליניאריים מוסברת על ידי השונות המוגבלת של משתנים והעובדה שברוב המקרים, צורות לא ליניאריות של קשרים מומרות (על ידי נטילת לוגריתמים או שינוי משתנים) לצורה לינארית לביצוע חישובים.

שיטה מסורתיתהריבועים הקטנים ביותר (LSM)

אומדן המדגם של המודל הוא המשוואה

ŷ i = a 0 + a 1 x i(i=1,2, …, n), (2)

כאשר ŷ i הם הערכים התיאורטיים (בקירוב) של המשתנה התלוי המתקבל ממשוואת הרגרסיה; a 0 , a 1 - מקדמים (פרמטרים) של משוואת הרגרסיה (אומדנים סלקטיביים של המקדמים β 0 , β 1 בהתאמה).

לפי הריבועים הקטנים, הפרמטרים הלא ידועים a 0 , a 1 נבחרים כך שסכום הסטיות בריבוע של ערכי ŷ i מהערכים האמפיריים של y i (הסכום השיורי של ריבועים) הוא מינימלי:

Q e =∑e i 2 = ∑(y i – ŷ i) 2 = ∑(yi – (a 0 + a 1 x i)) 2 → min, (3)

כאשר e i = y i - ŷ i הוא אומדן המדגם של ההפרעה ɛ i, או שארית הרגרסיה.

הבעיה מצטמצמת למציאת ערכים כאלה של הפרמטרים a 0 ו-1 שעבורם הפונקציה Q e לוקחת את הערך הקטן ביותר. שימו לב שהפונקציה Q e = Q e (a 0, a 1) היא פונקציה של שני משתנים a 0 ו-1 עד שמצאנו ואז תיקנו את ערכי ה"טובים" שלהם (במובן של שיטת הריבועים הקטנים ביותר), ו х i , y i הם מספרים קבועים שנמצאו בניסוי.

תנאי הקיצון הדרושים (3) נמצאים על ידי השוואת לאפס הנגזרות החלקיות של פונקציה זו של שני משתנים. כתוצאה מכך, אנו מקבלים מערכת של שתי משוואות ליניאריות, הנקראת מערכת של משוואות נורמליות:

(4)

מקדם a 1 - מקדם רגרסיה מדגם y על x, המראה כמה יחידות משתנה המשתנה y בממוצע כאשר המשתנה x משתנה ביחידת מדידה אחת שלו, כלומר הווריאציה של y ליחידת וריאציה x. סִימָן א 1מציין את כיוון השינוי הזה. מקדם a 0 - תזוזה, לפי (2) שווה לערך של ŷ i ב-x=0 וייתכן שאין לו פרשנות משמעותית. לשם כך, המשתנה התלוי נקרא לפעמים התגובה.

מאפיינים סטטיסטיים של אומדנים של מקדמי רגרסיה:

האומדנים של המקדמים a 0 , a 1 אינם מוטים;

השונות של האומדנים a 0 , ירידה של 1 (דיוק האומדנים עולה) ככל שגודל המדגם n גדל;

שונות אומדן מִדרוֹן a 1 יורד עם העלייה ולכן רצוי לבחור x i כך שהפיזור שלהם סביב הערך הממוצע יהיה גדול;

עבור x¯ > 0 (מה שמעניין ביותר), יש קשר סטטיסטי שלילי בין 0 ל-1 (עלייה ב-1 מובילה לירידה ב-0).

ניתוח רגרסיה עומד בבסיס יצירתם של רוב המודלים האקונומטריים, ביניהם יש לכלול את המודלים של הערכת עלויות. כדי לבנות מודלים של הערכת שווי, ניתן להשתמש בשיטה זו אם מספר האנלוגים (אובייקטים הניתנים להשוואה) ומספר גורמי העלות (מרכיבי השוואה) מתואמים זה עם זה באופן הבא: פ> (5 -g-10) x ל,הָהֵן. צריכים להיות פי 5-10 יותר אנלוגים מגורמי עלות. אותה דרישה ליחס בין כמות הנתונים ומספר הגורמים חלה על משימות אחרות: יצירת קשר בין העלות והפרמטרים הצרכניים של אובייקט; הצדקת הליך חישוב מדדי תיקון; בירור מגמות המחירים; ביסוס קשר בין בלאי לשינויים בגורמים משפיעים; השגת תלות לחישוב תקני עלות וכו'. ביצועים דרישה זוהכרחי על מנת להקטין את ההסתברות לעבוד עם מדגם נתונים שאינו עונה על הדרישה להתפלגות נורמלית של משתנים אקראיים.

קשר הרגרסיה משקף רק את המגמה הממוצעת של המשתנה המתקבל, למשל, עלות, משינויים במשתנה גורם אחד או יותר, למשל, מיקום, מספר חדרים, שטח, קומה וכו'. זהו ההבדל בין קשר רגרסיה לבין קשר פונקציונלי, שבו הערך של המשתנה המתקבל מוגדר בקפדנות עבור ערך נתון של משתני גורמים.

נוכחות של קשר רגרסיה / בין המתקבל בְּ-ומשתני גורמים x p ..., x k(גורמים) מצביע על כך שקשר זה נקבע לא רק על ידי השפעתם של משתני הגורמים שנבחרו, אלא גם על ידי השפעתם של משתנים, שחלקם אינם ידועים בדרך כלל, אחרים לא ניתנים להערכה ולקחת בחשבון:

ההשפעה של משתנים לא מטופלים מסומנת במונח השני של משוואה זו ?, מה שנקרא שגיאת הקירוב.

ישנם סוגים הבאים של תלות רגרסיה:

  • ? רגרסיה זוגית - הקשר בין שני משתנים (תוצאתי ופקטוריאלי);
  • ? רגרסיה מרובה - תלות של משתנה אחד שנוצר ושל שני משתני גורמים או יותר הכלולים במחקר.

המשימה העיקרית של ניתוח רגרסיה היא כימותאטימות הקשר בין משתנים (ברגרסיה זוגית) למשתנים מרובים (ברגרסיה מרובה). ההידוק של הקשר נכמת על ידי מקדם המתאם.

השימוש בניתוח רגרסיה מאפשר לך לקבוע את סדירות ההשפעה של הגורמים העיקריים (מאפיינים נהנתניים) על האינדיקטור הנחקר, הן במכלול שלהם והן בכל אחד מהם בנפרד. בעזרת ניתוח רגרסיה, כשיטת סטטיסטיקה מתמטית, ניתן, ראשית, למצוא ולתאר את צורת התלות האנליטית של המשתנה (הרצוי) המתקבל בגורמים הפקטוראליים, ושנית, לאמוד את הקרבה של התלות הזו.

על ידי פתרון הבעיה הראשונה מתקבל מודל רגרסיה מתמטי, בעזרתו מחושב לאחר מכן המדד הרצוי עבור ערכי גורמים נתונים. פתרון הבעיה השנייה מאפשר לקבוע את מהימנות התוצאה המחושבת.

לפיכך, ניתן להגדיר ניתוח רגרסיה כמכלול של פרוצדורות פורמליות (מתמטיות) שנועדו למדוד את הקרבה, הכיוון והביטוי האנליטי של צורת הקשר בין המשתנים המתקבלים והגורמים, כלומר. הפלט של ניתוח כזה צריך להיות מודל סטטיסטי מוגדר מבחינה מבנית וכמותית של הצורה:

איפה י -הערך הממוצע של המשתנה המתקבל (המדד הרצוי, למשל, עלות, שכר דירה, שיעור היוון) מעל פהתצפיות שלה; x הוא הערך של משתנה הפקטור (/-th factor cost); ל -מספר משתני גורמים.

פוּנקצִיָה f(x l ,...,x lc),תיאור התלות של המשתנה המתקבל בגורמים הפקטוראליים נקרא משוואת הרגרסיה (פונקציה). המונח "רגרסיה" (רגרסיה (lat.) - נסיגה, חזרה למשהו) קשור לפרטים הספציפיים של אחד מה משימות ספציפיותנפתר בשלב היווצרות השיטה, וכרגע אינו משקף את כל מהות השיטה, אלא ממשיך להיות מיושם.

ניתוח רגרסיה כולל בדרך כלל את השלבים הבאים:

  • ? יצירת מדגם של אובייקטים הומוגניים ואיסוף מידע ראשוני על אובייקטים אלה;
  • ? בחירת הגורמים העיקריים המשפיעים על המשתנה המתקבל;
  • ? בדיקת תקינות המדגם באמצעות איקס 2 או קריטריון בינומי;
  • ? קבלת ההשערה לגבי צורת התקשורת;
  • ? עיבוד נתונים מתמטי;
  • ? קבלת מודל רגרסיה;
  • ? הערכת האינדיקטורים הסטטיסטיים שלה;
  • ? חישובי אימות באמצעות מודל רגרסיה;
  • ? ניתוח תוצאות.

רצף הפעולות שצוין מתרחש במחקר של קשר זוגי בין משתנה גורם למשתנה אחד שנוצר, והן קשר מרובה בין המשתנה המתקבל למספר משתני גורמים.

השימוש בניתוח רגרסיה מטיל דרישות מסוימות על המידע הראשוני:

  • ? מדגם סטטיסטי של אובייקטים צריך להיות הומוגני במונחים פונקציונליים ובונים-טכנולוגיים;
  • ? די רבים;
  • ? יש להפחית את מדד העלות הנבדק - המשתנה המתקבל (מחיר, עלות, עלויות) לאותם תנאים לחישובו עבור כל האובייקטים במדגם;
  • ? יש למדוד משתני גורמים במדויק מספיק;
  • ? משתני גורמים חייבים להיות בלתי תלויים או תלויים מינימליים.

הדרישות להומוגניות ושלמות המדגם עומדות בסתירה: ככל שהבחירה של החפצים מתבצעת בצורה קפדנית יותר בהתאם להומוגניות שלהם, כך המדגם מתקבל קטן יותר, ולהפך, כדי להגדיל את המדגם, יש צורך לכלול חפצים. שלא מאוד דומים זה לזה.

לאחר איסוף הנתונים עבור קבוצה של אובייקטים הומוגניים, הם מנותחים כדי לקבוע את צורת הקשר בין המשתנים המתקבלים והגורמים בצורה של קו רגרסיה תיאורטי. תהליך מציאת קו רגרסיה תיאורטי מורכב מבחירה סבירה של עקומה בקירוב וחישוב מקדמי המשוואה שלו. קו הרגרסיה הוא עקומה חלקה (במקרה מסוים, קו ישר) המתארת ​​בעזרת פונקציה מתמטית את המגמה הכללית של התלות הנחקרת ומחליקה חריגים לא סדירים ואקראיים מהשפעת גורמי צד.

כדי להציג תלות רגרסיה זוגית במשימות הערכה, לרוב נעשה שימוש בפונקציות הבאות: ליניארי - y - a 0 + ars + sכוח - y - aj&i + cהפגנתי - י -מעריכי ליניארי - y - a 0 + ar * + s.כאן - השגיאת קירוב עקב פעולתם של גורמים אקראיים לא מטופלים.

בפונקציות אלה, y הוא המשתנה המתקבל; x - משתנה גורם (גורם); א 0 , א ר א 2 -פרמטרים של מודל רגרסיה, מקדמי רגרסיה.

המודל האקספוננציאלי הליניארי שייך למחלקה של מה שנקרא מודלים היברידיים של הצורה:

איפה

איפה x (אני = 1, /) - ערכי גורמים;

b t (i = 0, /) הם המקדמים של משוואת הרגרסיה.

במשוואה זו, הרכיבים א, בו זתואמים לעלות של רכיבים בודדים של הנכס המוערך, למשל, עלות חלקת קרקע ועלות השיפורים, והפרמטר שהוא נפוץ. הוא נועד להתאים את הערך של כל מרכיבי הנכס המוערך על ידי גורם משותףהשפעות, כגון מיקום.

ערכי הגורמים שנמצאים בדרגת המקדמים המתאימים הם משתנים בינאריים (0 או 1). הגורמים שנמצאים בבסיס התואר הם משתנים בדידים או מתמשכים.

גם גורמים הקשורים למקדמי סימני הכפל הם רציפים או בדידים.

המפרט מתבצע, ככלל, בגישה אמפירית וכולל שני שלבים:

  • ? שרטוט נקודות של שדה הרגרסיה על הגרף;
  • ? ניתוח גרפי (ויזואלי) של סוג עקומה מתקרבת אפשרית.

סוג עקומת הרגרסיה לא תמיד ניתן לבחירה מידית. כדי לקבוע זאת, נקודות שדה הרגרסיה משורטטות תחילה על הגרף לפי הנתונים הראשוניים. לאחר מכן נמשך קו חזותי לאורך מיקום הנקודות, תוך ניסיון לגלות את הדפוס האיכותי של החיבור: צמיחה אחידה או ירידה אחידה, צמיחה (ירידה) עם עלייה (ירידה) בקצב הדינמיקה, גישה חלקה ל רמה מסוימת.

גישה אמפירית זו משלימה על ידי ניתוח לוגי, החל מרעיונות ידועים כבר על הכלכלי וה טבע פיזינחקרו גורמים והשפעתם ההדדית.

כך למשל, ידוע כי התלות של המשתנים המתקבלים - אינדיקטורים כלכליים (מחירים, שכר דירה) במספר משתני גורמים - גורמים מעצבי מחיר (מרחק ממרכז היישוב, אזור וכו') אינן ליניאריות. , וניתן לתאר אותם בקפדנות רבה על ידי כוח, פונקציה מעריכית או ריבועית. אבל עם טווחים קטנים של גורמים, ניתן להשיג תוצאות מקובלות גם באמצעות פונקציה לינארית.

אם זה עדיין בלתי אפשרי לבצע מיד בחירה בטוחה של כל פונקציה אחת, אז שתיים או שלוש פונקציות נבחרות, הפרמטרים שלהן מחושבים, ולאחר מכן, באמצעות הקריטריונים המתאימים לאטימות החיבור, הפונקציה נבחרת לבסוף.

בתיאוריה, תהליך הרגרסיה של מציאת צורה של עקומה נקרא מִפרָטהמודל, והמקדמים שלו - כִּיוּלדגמים.

אם נמצא שהמשתנה המתקבל y תלוי במספר משתנים פקטוריאליים (גורמים) x ( , x 2 , ..., x k,ואז הם פונים לבניית מודל רגרסיה מרובה. בדרך כלל משתמשים בשלוש צורות של תקשורת מרובה: לינארית - y - a 0 + a x x x + a^x 2 + ... + a k x k,הפגנתי - y - a 0 א*אני a x t- a x b,כוח - y - a 0 x x ix 2 a 2. .x^ או שילובים שלהם.

הפונקציות האקספוננציאליות והמעריכיות הן אוניברסליות יותר, מכיוון שהן מתקרבות ליחסים לא ליניאריים, שהם רוב התלות שנלמדו בהערכה. בנוסף, ניתן ליישם אותם בהערכת אובייקטים ובשיטת המודלים הסטטיסטיים להערכת המונים, ובשיטת ההשוואה הישירה בהערכה פרטנית בעת קביעת גורמי תיקון.

בשלב הכיול, הפרמטרים של מודל הרגרסיה מחושבים בשיטת הריבועים הקטנים, שעיקרה הוא שסכום הסטיות בריבוע של הערכים המחושבים של המשתנה המתקבל בְּ-., כלומר. מחושב על פי משוואת היחסים שנבחרה, מהערכים בפועל צריכים להיות מינימליים:

ערכים j) (. ו y.ידוע, לכן שהוא פונקציה של המקדמים של המשוואה בלבד. כדי למצוא את המינימום סלקחת נגזרות חלקיות שלפי המקדמים של המשוואה ושווה אותם לאפס:

כתוצאה מכך, אנו מקבלים מערכת של משוואות נורמליות, שמספרן שווה למספר המקדמים שנקבעו של משוואת הרגרסיה הרצויה.

נניח שעלינו למצוא את המקדמים של המשוואה הליניארית y - a 0 + ars.סכום הסטיות בריבוע הוא:

/=1

הבדיל פונקציה שלפי מקדמים לא ידועים א 0והשוו את הנגזרות החלקיות לאפס:

לאחר טרנספורמציות נקבל:

איפה פ -מספר הערכים המקוריים בפועל בְּ-אותם (מספר האנלוגים).

ההליך הנ"ל לחישוב המקדמים של משוואת הרגרסיה ישים גם עבור תלות לא ליניארית, אם תלות אלו ניתנות ללינאריות, כלומר. להביא לצורה לינארית באמצעות שינוי של משתנים. כוח ו פונקציה מעריכיתלאחר לקיחת לוגריתם ושינוי מתאים של משתנים, הם רוכשים צורה לינארית. לדוגמה, פונקציית חזקה לאחר לקיחת לוגריתם לובשת את הצורה: ב-y \u003d 1n 0 +a x 1ph. לאחר שינוי המשתנים Y-ב y, L 0 -ב ומס' X-ב-x נקבל פונקציה לינארית

Y=A0 + cijX,שמקדמים נמצאים כמתואר לעיל.

שיטת הריבועים הקטנים משמשת גם לחישוב המקדמים של מודל רגרסיה מרובה. אז, מערכת המשוואות הנורמליות לחישוב פונקציה לינארית עם שני משתנים Xjו x 2לאחר סדרה של טרנספורמציות, זה נראה כך:

בְּדֶרֶך כְּלַל המערכת הזאתמשוואות נפתרות באמצעות שיטות אלגברה לינארית. מרובות פונקציית כוחלהוביל לצורה לינארית על ידי לקיחת לוגריתמים ושינוי משתנים באותו אופן כמו פונקציית חזקות זוג.

כאשר משתמשים במודלים היברידיים, מוצאים מקדמי רגרסיה מרובים תוך שימוש בפרוצדורות מספריות של שיטת הקירוב הרציף.

כדי לבצע את הבחירה הסופית ממספר משוואות רגרסיה, יש צורך לבדוק בכל משוואה את אטימות החיבור, הנמדדת לפי מקדם המתאם, השונות ומקדם השונות. להערכה, אתה יכול גם להשתמש בקריטריונים של Student ופישר. ככל שהאטימות של החיבור חושפת את העקומה, כך היא עדיפה יותר, כל שאר הדברים שווים.

אם נפתרת בעיה של מחלקה כזו, כאשר יש צורך לקבוע את התלות של אינדיקטור עלות בגורמי עלות, אזי הרצון לקחת בחשבון כמה שיותר גורמים משפיעים ובכך לבנות מודל רגרסיה מרובה מדויק יותר הוא מובן. עם זאת, שתי מגבלות אובייקטיביות מעכבות את הרחבת מספר הגורמים. ראשית, בניית מודל רגרסיה מרובה דורשת מדגם גדול בהרבה של אובייקטים מאשר בניית מודל זוגי. מקובל בדרך כלל שמספר האובייקטים במדגם צריך לעלות על המספר פגורמים, לפחות 5-10 פעמים. מכאן נובע שכדי לבנות מודל עם שלושה גורמים משפיעים, יש צורך לאסוף מדגם של כ-20 אובייקטים עם קבוצות שונות של ערכי גורמים. שנית, הגורמים שנבחרו עבור המודל בהשפעתם על מדד הערך צריכים להיות מספיק בלתי תלויים זה בזה. לא קל להבטיח זאת, שכן המדגם משלב בדרך כלל חפצים השייכים לאותה משפחה, בהם יש שינוי קבוע בגורמים רבים מחפץ לחפץ.

איכות מודלים של רגרסיה נבדקת בדרך כלל באמצעות הנתונים הסטטיסטיים הבאים.

סטיית תקן של שגיאת משוואת הרגרסיה (שגיאת הערכה):

איפה פ -גודל המדגם (מספר אנלוגים);

ל -מספר גורמים (גורמי עלות);

שגיאה לא מוסברת על ידי משוואת הרגרסיה (איור 3.2);

y. -הערך האמיתי של המשתנה המתקבל (לדוגמה, עלות); y t -ערך מחושב של המשתנה המתקבל.

מחוון זה נקרא גם שגיאת הערכה סטנדרטית (שגיאת RMS). באיור, הנקודות מצביעות על ערכים ספציפיים של המדגם, הסמל מציין את קו הערכים הממוצעים של המדגם, הקו המקווקו המשופע הוא קו הרגרסיה.


אורז. 3.2.

סטיית התקן של טעות האומדן מודדת את כמות הסטייה של הערכים האמיתיים של y מהערכים המחושבים המתאימים. בְּ-( , מתקבל באמצעות מודל הרגרסיה. אם המדגם שעליו בנוי המודל כפוף לחוק ההתפלגות הנורמלית, אזי ניתן לטעון כי 68% ערכים אמיתיים בְּ-נמצאים בטווח בְּ- ± & המקו הרגרסיה, ו-95% - בטווח בְּ- ± 2d ה. מחוון זה נוח בגלל יחידות המידה sg?להתאים את יחידות המידה בְּ-,. בהקשר זה, ניתן להשתמש בו כדי לציין את הדיוק של התוצאה שהושגה בתהליך ההערכה. לדוגמה, בתעודת ערך ניתן לציין כי ערך שווי השוק המתקבל באמצעות מודל הרגרסיה Vעם הסתברות של 95% נמצא בטווח מ (V-2d,.)לפני (בְּ + 2ds).

מקדם השונות של המשתנה המתקבל:

איפה י -הערך הממוצע של המשתנה המתקבל (איור 3.2).

בניתוח רגרסיה, מקדם השונות var הוא סטיית התקן של התוצאה, מבוטאת כאחוז מהממוצע של משתנה התוצאה. מקדם השונות יכול לשמש קריטריון לאיכויות הניבוי של מודל הרגרסיה המתקבל: ככל שהערך קטן יותר var, ככל שתכונות הניבוי של המודל גבוהות יותר. השימוש במקדם הווריאציה עדיף על המעריך ו-e, שכן הוא כן אינדיקטור יחסי. בְּ שימוש מעשיעבור מדד זה, ניתן להמליץ ​​שלא להשתמש במודל שמקדם השונות שלו עולה על 33%, שכן במקרה זה לא ניתן לומר שנתוני המדגם כפופים לחוק ההתפלגות הנורמלית.

מקדם קביעה (מקדם מתאם מרובה בריבוע):

אינדיקטור זה משמש לניתוח האיכות הכוללת של מודל הרגרסיה המתקבל. הוא מציין איזה אחוז מהשונות במשתנה המתקבל נובע מהשפעת כל משתני הגורמים הכלולים במודל. מקדם הקביעה נמצא תמיד בטווח שבין אפס לאחד. ככל שערך מקדם הקביעה קרוב יותר לאחדות, ה דגם טוב יותרמתאר את סדרת הנתונים המקורית. ניתן לייצג את מקדם הקביעה בדרך אחרת:

הנה השגיאה שמוסברת על ידי מודל הרגרסיה,

א - שגיאה לא מוסברת

מודל רגרסיה. מנקודת מבט כלכלית, קריטריון זה מאפשר לשפוט איזה אחוז מהשינוי במחיר מוסבר על ידי משוואת הרגרסיה.

מגבלת הקבלה המדויקת של המחוון R2אי אפשר לפרט עבור כל המקרים. יש לקחת בחשבון גם את גודל המדגם וגם את הפרשנות המשמעותית של המשוואה. ככלל, כאשר לומדים נתונים על אובייקטים מאותו סוג, שהושגו בערך באותו זמן, הערך R2אינו עולה על הרמה של 0.6-0.7. אם כל שגיאות החיזוי הן אפס, כלומר. כאשר הקשר בין המשתנים המתקבלים והגורמים הוא פונקציונלי, אז R2 =1.

מקדם קביעה מתוקן:

הצורך בהכנסת מקדם קביעה מותאם מוסבר בכך שעם עלייה במספר הגורמים למקדם הקביעה הרגיל עולה כמעט תמיד, אך מספר דרגות החופש פוחת (נ - ק- אחד). ההתאמה שהוכנסה תמיד מפחיתה את הערך R2,בגלל ה (עמ' - 1) > (n- ל-אחד). כתוצאה מכך, הערך R 2 CKOf)עלול אפילו להפוך לשלילי. זה אומר שהערך R2היה קרוב לאפס לפני ההתאמה ושיעור השונות מוסבר על ידי משוואת הרגרסיה של המשתנה בְּ-קטן מאוד.

מבין שתי הווריאציות של מודלים של רגרסיה הנבדלים בערך מקדם הקביעה המתואם, אך בעלי קריטריוני איכות אחרים טובים באותה מידה, הווריאציה עם ערך רבמקדם קביעה מותאם. מקדם הקביעה אינו מותאם אם (n - k): k> 20.

יחס פישר:

קריטריון זה משמש להערכת המשמעות של מקדם הקביעה. סכום שיורי של ריבועים הוא מדד לשגיאת חיזוי באמצעות רגרסיה של ערכי עלות ידועים בְּ..ההשוואה שלו לסכום הרגרסיה של ריבועים מראה כמה פעמים התלות ברגרסיה מנבאת את התוצאה טוב יותר מהממוצע בְּ-. יש טבלה של ערכים קריטיים F Rמקדם פישר בהתאם למספר דרגות החופש של המונה - ל, מכנה v 2 = p - ק- 1 ורמת מובהקות א. אם הערך המחושב של קריטריון פישר F Rגדול מערך הטבלה, אזי השערת חוסר המשמעות של מקדם הקביעה, כלומר. על הפער בין הקשרים המוטבעים במשוואת הרגרסיה לבין אלה הקיימים באמת, עם הסתברות p = 1 - a נדחה.

שגיאת קירוב ממוצעת(סטייה ממוצעת באחוזים) מחושב כהפרש היחסי הממוצע, מבוטא כאחוז, בין הערכים האמיתיים והמחושבים של המשתנה המתקבל:

ככל שהערך של אינדיקטור זה נמוך יותר, כך איכות הניבוי של המודל טובה יותר. כאשר הערך של מחוון זה אינו גבוה מ-7%, הם מצביעים על הדיוק הגבוה של המודל. אם 8 > 15%, מציינים את הדיוק הלא מספק של הדגם.

שגיאה סטנדרטית של מקדם הרגרסיה:

כאשר (/I) -1 .- אלמנט אלכסוני של המטריצה (X G X) ~ 1 עד -מספר גורמים;

איקס-מטריצה ​​של ערכי משתני גורמים:

X7-מטריצה ​​מועברת של ערכי משתני גורמים;

(JL) _| הוא מטריצה ​​הפוכה למטריצה.

ככל שהציונים הללו עבור כל מקדם רגרסיה קטנים יותר, כך האומדן של מקדם הרגרסיה המתאים יותר אמין יותר.

מבחן תלמיד (סטטיסטיקה t):

קריטריון זה מאפשר למדוד את מידת המהימנות (המשמעות) של הקשר עקב מקדם רגרסיה נתון. אם הערך המחושב ט. גדול מערך הטבלה

ט av , איפה v - p - k - 1 הוא מספר דרגות החופש, ואז ההשערה שמקדם זה אינו מובהק סטטיסטית נדחית בהסתברות של (100 - a)%. ישנן טבלאות מיוחדות של התפלגות /-המאפשרות לקבוע את הערך הקריטי של הקריטריון לפי רמת מובהקות נתונה a ומספר דרגות החופש v. הערך הנפוץ ביותר של a הוא 5%.

מולטי-קולינאריות, כלומר ההשפעה של קשרים הדדיים בין משתני גורמים מובילה לצורך להסתפק במספר מוגבל מהם. אם זה לא נלקח בחשבון, אז אתה יכול לגמור עם מודל רגרסיה לא הגיוני. כדי למנוע את ההשפעה השלילית של מולטי-קולינאריות, לפני בניית מודל רגרסיה מרובה, מחושבים מקדמי מתאם של זוג rxjxjבין משתנים נבחרים איקס.ו איקס

כאן XjX; -ערך ממוצע של המכפלה של שני משתנים פקטוריאליים;

XjXj-המכפלה של הערכים הממוצעים של שני משתני גורמים;

הערכת השונות של משתנה הגורם x..

שני משתנים נחשבים כקשורים רגרסיבית (כלומר, קולינאריים) אם מקדם המתאם הזוגי שלהם גדול בהחלט מ-0.8 בערך המוחלט. במקרה זה, יש להוציא כל אחד מהמשתנים הללו בחשבון.

על מנת להרחיב את אפשרויות הניתוח הכלכלי של מודלי הרגרסיה המתקבלים, נעשה שימוש בממוצעים מקדמי גמישות, נקבע על ידי הנוסחה:

איפה Xj-ערך ממוצע של משתנה הגורם המתאים;

י -הערך הממוצע של המשתנה המתקבל; אני -מקדם רגרסיה עבור משתנה הגורם המתאים.

מקדם האלסטיות מראה כמה אחוזים ישתנה בממוצע ערך המשתנה המתקבל כאשר משתנה הגורם ישתנה ב-1%, כלומר. כיצד מגיב המשתנה המתקבל לשינוי במשתנה הגורם. לדוגמה, איך המחיר של מ"ר. מ' שטח הדירה במרחק ממרכז העיר.

שימושי מנקודת המבט של ניתוח המשמעות של מקדם רגרסיה מסוים הוא האומדן מקדם קביעה פרטי:

להלן ההערכה של השונות של המתקבל

מִשְׁתַנֶה. מקדם זה מראה כמה אחוזים הווריאציה של המשתנה המתקבל מוסברת על ידי הווריאציה של משתנה הגורם /-ה שנכלל במשוואת הרגרסיה.

  • מאפיינים נהנתנים מובנים כמאפיינים של חפץ המשקפים את תכונותיו השימושיות (בעלי הערך) מנקודת המבט של הקונים והמוכרים.