2.2.3.1.2. Зведення та групування статистичної інформації
Зведення та групування статистичної інформації
(ЗГСІ) виконується задля побудови варіаційних рядів (ВР) розподілу випадкових величин і поділу їх за кількісними чи атрибутивними (описовими) ознаками. Для останнього використовують методи факторного, кластерного, дискримінантного аналізів.
Неодмінним атрибутом ЗГСІ є складання користувальних таблиць і графічне подання ВР у формі гістограм (для інтервальних ВР) і полігонів розподілу (для дискретних ВР). Процедура ЗГСІ готує дані для аналізу їх статистичного розподілу й обов'язково включається до відповідних комп'ютерних програм. Ця процедура неодмінно використовується для аналізу даних анкетування. В MS Excel вона, як і інші методи статистичної обробки інформації, включена в Пакет анализа (файл analisys 32. xls) і виконується за допомогою інструментів Выборка та Гистограмма. Причому розбивка на інтервали групування здійснюється як автоматично, так і може бути задана користувачем. В другому випадку слід дотримуватися статистичних критеріїв групування [11].
Значно більші можливості обробки статистичної інформації надає інтегрована система комплексного статистичного аналізу STATISTICA (фірма-виробник StatSoft® Inc. США). Вона повністю узгоджена з усіма стандартами ОС Windows" і базується на загальновизнаних методах статистичного аналізу [6]. Система STATISTICA обробляє одночасно до 4092 змінних і 2 млн. випадків. Змінні можуть відображати числову або текстову інформацію. Введення даних здійснюється заповненням ЕТ, а виведення — у табличній формі, у вигляді графіків і звітів у розширеному текстовому форматі (RTF). Система підтримує різні типи операцій з даними, такі як передача даних через буфер обміну Windows9, поблочна обробка даних (як у MS Excel ), автоза-повнення блоків, перетягування фрагментів за допомогою "миші", імпорт даних (OLf-технологія) та ін. STATISTICA має потужний апарат зображення даних у вигляді різноманітних графіків: наукових, ділових, дво- і тривимірних у різних системах координат, матричних, категоризованих, гістограм, діаграм розсіювання та ін. Система оснащена внутрішньою мовою програмування STATISTICA BASIC, яка має велику кількість спеціальних функцій, у тому числі призначених для вирішення задач лінійної алгебри, наприклад, знаходження власних
векторів і власних значень матриць за допомогою LU, QR, SVD-розкладок. Користувач має можливість записувати макрокоманди, обробляти дані у пакетному режимі, викликати зовнішні бібліотеки DLL, тобто нарощувати системи на свій розсуд. Всі інструкції для роботи з системою STATISTICA докладно описані в її електронній ДПС (англомовній), яка організована за стандартами для Windows". Завдання ЗГСІ вирішується в STATISTICA автоматично під час здійснення частотного аналізу в модулі Basic StatisticsTables (Основні статистики/Таблиці). /
Ринок програм статистичної обробки даних, звичайно, не вичерпується розглянутими ППП. Відомі західні системи SPSS, Systat, S-Plus, Minitab, розробки російських програмістів Stadia, Да-сис-тема, Эвриста, Альт-прогноз та ін. Раніше була популярна русифікована програма Nutneri. Проте рейтинг MSExcel і STATISTICA значно вищий і надалі ми будемо опиратися виключно на них.