2.3. Система класифікації та кодування економічної інформації
2.3. Система класифікації та кодування економічної інформації
Важлива складова інформаційного забезпечення — система класифікації та кодування.
Класифікація — обов’язковий етап попередньої підготовки економічних даних до автоматизованого оброблення, а також передумова раціональної організації інформаційної бази та моделювання інформаційних процесів.
Її можна визначити як складову інформаційного забезпечення будь-якої інформаційної системи, що належить до мовних засобів управління. Тому класифікація є основою для кодування інформації та наступного її пошуку.
Система класифікації — це сукупність методів і правил розподілу множини об’єктів (М) на підмножину(Мij) відповідно до ознак схожості або несхожості.
Об’єкт класифікації — елемент класифікаційної множини.
Класифікаційне групування — підмножина об’єктів, отриманих у результаті класифікації.
Розрізняють два методи класифікації — ієрархічний і фа-
сетний.
Ієрархічний метод класифікації — це послідовний поділ множини об’єктів на підлеглі класифікаційні угруповання.
Переваги: логічність побудови, чіткість визначення ознак, великий обсяг інформації, зручність використання.
Недоліки: жорстка структура, брак резервного обсягу.
Фасетний метод класифікації — паралельний поділ множини об’єктів на незалежні класифікаційні угруповання.
Фасет — набір значень однієї ознаки класифікації. Фасети взаємно незалежні. Кожний об’єкт може одночасно входити в різні класифікаційні угруповання.
Переваги: гнучкість структури (пристосування до змін у задачах), дає можливість вводити нові фасети чи видаляти старі.
Недоліки: недостатньо повне використання обсягу.
Рис. 2.1. Ієрархічна класифікація
ФАСЕТИ
Значення | Ф | Ф |
| Ф |
1 | //////////////// |
|
|
|
2 |
|
|
|
|
3 |
|
|
|
|
4 |
|
|
|
|
5 |
|
|
|
|
... |
|
|
|
|
Рис. 2.2. Фасетна класифікація
Kодування — процес присвоєння умовного позначення різним позиціям номенклатури.
Код — це знак чи сукупність знаків, прийнятих для позначення класифікаційного угруповання чи об’єкта класифікації.
Для кодування інформації в інформаційних системах застосовують порядковий, серійно-порядковий, послідовний та паралельний методи кодування.
Порядковий метод кодування — найпростіший і найпоширеніший. Побудова кодів виконується в міру зростання або спадання ознак без пропуску номерів.
Серійно-порядковий метод кодування на кожну групу ознак має серію порядкових номерів із резервом номерів.
Послідовний метод кодування передбачає виокремлення певних розрядів коду під певні ознаки.
Паралельний метод кодування теж передбачає виокремлення розрядів, але значення ознаки, записаної на будь-якому розряді коду, не залежить від значення ознак, записаних на інших розрядах.
Вибір методів класифікації та кодування об’єктів передбачає:
можливість розширення кодової множини об’єктів і внесення відповідних змін;
однозначність ідентифікованих об’єктів;
мінімальну довжину коду;
можливість оброблення інформації за допомогою ЕОМ;
простоту методу кодування;
застосування загальноприйнятих позначень.