2.2.3.1.3. Визначення закону розподілу ймовірності випадкової величини
Характеристикою випадкової величини служать
імовірності появи різних її значень. Знання закону розподілу ймовірності (ЗРЙ) дає можливість обчислити середні значення величин, які характеризують явище, а також розсіювання (дисперсію) значень, що спостерігаються у певний момент часу, відносно середніх значень та інші показники. Визначення ЗРЙ здійснюється шляхом порівняння за статистичними критеріями емпіричного розподілу частот з теоретичним ЗРЙ, який вибирається адекватно природі явища, що вивчається. У практиці дослідження соціальних процесів найчастіше використовують нормальний, біноміальний та пуассонів ЗРЙ, а також функції, що приводяться до нормального ЗРЙ шляхом математичних перетворень. Перевірка нормальності та однорідності вибірних розподілів використовується при аналізі випадковості залишків (див. далі) і для виявлення викидів, тобто аномальних результатів, причиною яких можуть бути грубі помилки, допущені на етапі збирання та реєстрації первинної інформації.
Табличний процесор MS Excel і система STATISTICA мають приблизно однакові можливості визначення ЗРЙ. Вони генерують близько п'ятнадцяти добре вивчених ЗРЙ з параметрами (середнє та дисперсія), які задаються користувачем. Порівнюючи гістограму (чи
полігон частот), побудовану за даними реальних спостережень, з вибраним ЗРЙ, можна оцінити ступінь їх близькості і підібрати найбільш адекватний ЗРЙ, а також визначити викиди. В системі STATISTICA ця процедура автоматизована, а в MS Excel вона потребує програмування. В STATISTICA можна, виводячи графіки у різних масштабах, підібрати тип перетворення даних, що приводить до нормального ЗРЙ. Обидві програми дають змогу розрахувати показники форми (особливості розподілу) ЗРЙ — коефіцієнт асиметрії (КА) та коефіцієнт ексцесу (КЕ), які характеризують відхилення ЗРЙ від нормального. Однак про ступінь незначності цих характеристик можна судити лише в системі STATISTICA, яка обчислює стандартні помилки КА — Std.Err.Skew-ness та КЕ — Std.Err.Kurtosis. В MS Excel таких функцій немає, і відповідні вирази треба програмувати. Аналогічна ситуація спостерігається при перевірці нормальності ЗРЙ з використанням критерію згоди 3£2 (хі-квадрат) (функції ХИ2ТЕСТ із MS Excel та Chi І із STATISTICA), а також при розрахунку ймовірності наявності грубої помилки у викиді (функція ВЕРОЯТНОСТЬ з MS Excel) [13]. Слід, проте, зазначити, що в системі STATISTICA є засіб графічного редагування Brushing (Пензель), який дає змогу за допомогою маніпулятора "миша" вилучати будь-які точки на графіках і відразу отримувати оновлені результати розрахунків. Це значно полегшує процес аналізу та фільтрації даних.