5.2. Регресіпний аналіз
Вивчення кореляційного зв'язку між ознаками починається з регресійного аналізу, який вирішує проблему встановлення форми зв'язку, або виду рівняння регресії, та визначення параметрів рівняння регресії.
В регресійному аналізі розрізняють рівняння парної (простої) та множинної (багатофакторної) регресії. Коли зв'язок із результативною ознакою у здійснюється з одним видом факторної ознаки х, то рівняння регресії має назву рівняння парної регресії. Якщо результативна ознака у пов'язана з декількома видами факторних ознак хj (j=1-т), то така залежність має назву рівняння множинної регресії. Обмежимось розглядом рівнянь парної регресії, як найбільш простим випадком зв'язку між ознаками, що достатньо широко використовується в статистичній практиці обстеження економічних явищ.
Найбільш часто для характеристики кореляційного зв'язку між ознаками використовують такі види рівнянь парної регресії, або кореляційних рівнянь:
а) лінійний Y = а0 + а1х;
б) параболічний Y = а0 + а1x2 ;
в) гіперболічний Y = а0 + а1 1/x;
г) степеневий Y= аох a1 , (6.5)
де а0, a1 - параметри рівнянь регресії, які підлягають визначенню.
Параметри аj (j=1-m)в рівняннях регресії визначаються методом найменших квадратів, який запропоновано в XVIII ст. французьким математиком Лежандром. Цей метод найкращим чином відповідає кореляційній таблиці і припускає знаходження таких значень параметрів рівняння регресії, при яких сума квадратів відхилень табличних (фактичних) значень результативної ознаки у від теоретичних Y за лінією регресії була б мінімальною:
S = ∑(y - Y)2 = min
Функція S параметрів рівняння регресії аj буде мінімальною тоді, коли виконуються необхідні умови знаходження екстремуму цієї функції - дорівнення нулю перших похідних функції за параметрами:
∂S : ∂a0 = 0; ∂S : ∂a1 = 0
Із цих умов визначається система нормальних рівнянь для знаходження параметрів а0 та а1.
У випадку лінійного виду рівняння регресій система нормальних рівнянь записується у вигляді:
∑y = na0 + a1∑x
∑хy = a0∑x + a1∑x2
де n - кількість одиниць сукупності (тобто заданих пар значень х і у).
Розв'язавши цю систему, знаходимо такі значення параметрів:
а0 = (∑у∑х2 - ∑ху∑х) : (n∑х - ∑х∑х)
а1 = (n∑ху - ∑х∑у) : (n∑х2 - ∑х∑х)
або
a0 = yсер – a1 yсер; a1 = (x yсер - xсер yсер) : (x2сер - xсер2)
де хусер - середня із добутку факторної ознаки на результативну.
Використавши рівняння регресії, можна знайти теоретичне значення Y для будь-якого значення факторної ознаки х.
У рівнянні параметр а0 економічного змісту не має, а геометрично він відповідає значенню ординати ліній регресії Y при х=0. Параметр а1 називається коефіцієнтом регресії і показує зміну результативної ознаки Y при зміні факторної ознаки х на одиницю; геометрично параметр а1 відповідає куту нахилу (в радіанах) прямої лінії регресії до горизонтальної осі.
Для оцінки впливу факторної ознаки на результативну може розраховуватись коефіцієнт еластичності в середньому для усієї сукупності:
Ке = а1хсер / усер
де хсер, усер - середні величини фактичних даних відповідно за факторною та результативною ознаками в цілому для сукупності.
Коефіцієнт еластичності показує, на скільки процентів у середньому зміниться результативна ознака при зміні факторної ознаки на 1%.
Прикладами використання лінійного рівняння регресії є такі залежності: між електроозброєністю праці (х) на 1 робітника і випуском готової продукції (у) для однорідних підприємств; між стажем роботи (х) та виробкою 1 робітника за зміну (у) тощо.
Для вибору виду рівняння регресії необхідно побудувати графік залежності фактичних даних у=f(х) і за групуванням точок на графіку встановити візуально, до якого виду (лінійного чи нелінійного) можна віднести лінію регресії.