ГоловнаНовиниПару слів про чистоту даних

Пару слів про чистоту даних

Основний інструмент для аналізу ефективності оренди державного майна — реєстр договорів оренди. Лише розпочавши роботу з ним, ми зрозуміли, що з чистотою даних у фонду державного майна є деякі проблеми 🧐 А відсутність якісних відкритих даних значно ускладнює громадський контроль, що часто призводить до численних махінацій.

Розглянемо один атрибут — код ЄДРПОУ балансоутримувача, який має складатись із 8 цифр. На графіку нижче ви можете побачити, що на практиці все трохи не так 🙄

Кількість символів у коді ЄДРПОУ

Основна проблема: абсолютно у всіх кодів ЄДРПОУ, які починаються з нуля, ці нулі не відобразились в ексель-файлі. Однак є і цікавіші випадки, наприклад, код [1]. Замість кодів ЄДРПОУ двох балансоутримувачів взагалі наведені ідентифікаційні коди фізичних осіб (передавайте привіт загадковій Оксані Михайлівні) 🙂 Є коди навіть з 11 символів 😱

І схожі проблеми спостерігаються практично з кожним атрибутом по всьому реєстру. Однак, ми не звикли просто критикувати. Успіх нашого проекту (а також ефективність в управлінні державною власністю) залежить від якості даних Фонду Держмайна. Сподіваємось на плідну співпрацю з Фонд державного майна України для недопущення махінацій з державним майном у майбутньому.

May the 8 symbols of ЄДРПОУ be with you!