29.11.2017

Тренінги «Відкриті дані для державних службовців»: підсумки та рекомендації

19149121_925160744293187_4702267159173795420_n
Напрямки: Культура даних.
Географія: Україна
Період: 02/2017

Протягом лютого-липня 2017 року Український центр суспільних даних та Український освітній центр реформ, за підтримки Державного агентства з питань електронного урядування України та Національного фонду на підтримку демократії (NED) провели серію тренінгів щодо відкритих даних для державних службовців з усіх регіонів України.

16682001_861380177337911_9042242233076598943_n 16996329_861380470671215_8880588566347153209_n16998708_861380330671229_8053912023245633377_n 17308920_871531102989485_3822637861026955260_n 17362890_871530082989587_4277977214291088192_n 19149121_925160744293187_4702267159173795420_n 19702246_938961966246398_694439864907562025_n 19748332_938962069579721_480467154403464516_n

Під час тренінгів, дискусій та подальших комунікацій із учасниками навчальної програми були сформовані рекомендації, з якими пропонуємо ознайомитися нижче.

Проблеми у роботі з даними та рекомендації щодо їх усунення: зворотній зв’язок від учасників тренінгів

Учасниками тренінгів «Відкриті дані для державних службовців» було озвучено низку проблем, що стосуються практичних аспектів виконання Закону України від 13.01.2011 №2939-VI «Про доступ до публічної інформації» та постанови Кабінету Міністрів України від 21.10.2015 №835 «Про затвердження Положення про набори даних, які підлягають оприлюдненню у формі відкритих даних» (далі — Постанова №835) як безпосередньо під час тренінгів, так і в опитування, що проводилося через декілька місяців після проведення тренінгів (протягом лютого-липня 2017 р).

 

Категорії проблемних питань, визначених респондентами

Загалом озвучені учасниками тренінгів проблемні питання можна розподілити наступним чином:

  • юридичні
  • технічні
  • організаційні, в тому числі робота з даними
  • взаємодії з громадськістю

До першої категорії належать питання, пов’язані із виконанням нормам, викладених у Постанові №835.

 

Юридичні питання

  1. У [постанові] перелік даних більше стосується сільських, селищних та міських рад, а на сайтах обласних та районних рад не публікують дані».

Це зауваження не повною мірою відповідає дійсності, оскільки, по перше, Переліком наборів даних, які підлягають оприлюдненню, затверджено набори даних, оприлюднення яких є обов’язковим для всіх розпорядників інформації, а по друге, окремі розпорядники оприлюднюють також набори даних, які не зазначено у Переліку як обов’язкові для них. Так, Донецька обласна державна адміністрація на Єдиному державному веб-порталі відкритих даних оприлюднює такі набори даних, як «Витяг з реєстру місць видалення відходів у Донецькій області», «Пожежі, що виникли на підконтрольній Україні території Донецької області у червні – серпні 2017 року», «Дані про полігони твердих побутових відходів» тощо, реалізуючи таким чином норми п. 3 Положення про набори даних, які підлягають оприлюдненню у формі відкритих даних (далі — Положення №835), згідно якого розпорядники інформації оприлюднюють також будь-які інші наявні дані, що відповідають визначенню публічної інформації у формі відкритих даних.

Враховуючи те, що чинною редакцією Переліку наборів даних, які підлягають оприлюдненню (а також проектом про внесення змін до нього) для обласних (районних) державних адміністрацій обов’язковими для оприлюднення визначено лише схеми планування території області (району), а на практиці обласні державні адміністрації володіють значними масивами публічної інформації, що відповідає визначенню публічної інформації у формі відкритих даних, доцільно було б вжити наступних заходів:

  • провести інвентаризацію наявної публічної інформації у пілотній обласній державній адміністрації
  • за результатами інвентаризації визначити типовий перелік наборів даних, що знаходяться у розпорядженні ОДА
  • провести консультації із зацікавленими установами, об’єднаннями громадян, громадськістю для визначення переліку пріоритетних наборів даних ОДА, що підлягають оприлюдненню
  • внести відповідні зміни до розділу «Обласні державні адміністрації» Переліку наборів даних, які підлягають оприлюдненню із врахуванням наявних кадрових та матеріально-технічних ресурсів типової ОДА
  1. Визначенням набору даних (п. 2 Положення №835) встановлено, що набір даних складається із структурованої сукупності однорідних значень, тобто набір даних за визначенням є структурованими даними, однак при цьому в переліку форматів, що можуть використовуватись для оприлюднення наборів даних наявні формати, що за своїми властивостями не можуть містити структурованих даних (такими є усі формати, окрім XML, JSON, CSV, XLS(X), ODS та YAML).

Дана колізія є основною причиною низької якості наборів даних, у значній кількості розміщених на Єдиному державному порталі відкритих даних, оскільки більшість розпорядників не дотримується вимог ст. 10-1 Закону України від 13.01.2011 №2939-VI «Про доступ до публічної інформації» щодо забезпечення можливості автоматизованого оброблення публічної інформації у формі відкритих даних електронними засобами, а також положень п. 9 Положення №835 в частині забезпечення використання відкритих форматів даних та структурованих даних під час створення нових наборів даних. Наслідком цього є значна кількість наборів даних на Єдиному порталі, які оприлюднені у неструктурованих форматах (DOC, JPEG/JPG, скановані зображення в форматі PDF).

Вирішити цю проблему можливо лише за умови обмеження переліку файлових форматів, що можуть використовуватися для оприлюднення наборів даних: лише форматами, що придатні для збереження структурованих форматів і водночас можуть оброблятися електронними засобами без необхідності використання додаткових засобів, а саме:

  • XML
  • JSON
  • CSV
  • YAML

Слід також зазначити, що формат RDF, який згадується у графі «Структуровані дані», не є файловим форматом, натомість він є специфікацією моделі метаданих [1], а форматами серіалізації для графів RDF виступають, зокрема, наступні формати, визначені рекомендаціями W3C:

  • Turtle [2]
  • N-Triples [3]
  • N-Quads [4]
  • JSON-LD [5]
  • RDF/XML [6]

Згадані у п. 9 архівні формати файлів (ZIP, 7z, Gzip, Bzip2) також не можна вважати форматами оприлюднення, оскільки архівація файлів використовується для зменшення розміру файлів, а не для оприлюднення інформації.

  1. Питання викликала також і невизначеність місця оприлюднення наборів даних, оскільки у п. 2 Положення №835 під оприлюдненням набору даних розуміється розміщення та оновлення розпорядником інформації наборів даних на офіційному веб-сайті розпорядника інформації _або_ на Єдиному державному веб-порталі відкритих даних, а у п. 4 цього ж Положення зазначено, що набори даних оприлюднюються та регулярно оновлюються розпорядником інформації на його офіційному веб-сайті _та_ на його веб-сторінці на Єдиному державному веб-порталі відкритих даних».

У проекті Постанови «Про внесення змін до постанови Кабінету Міністрів України від 21 жовтня 2015 р. №835» вказану неоднозначність усунуто, оскільки, згідно з проектом, під оприлюдненням набору даних розуміється розміщення розпорядником інформації набору даних в мережі Інтернет, а п. 4 передбачає оприлюднення набору даних лише на Єдиному державному веб-порталі відкритих даних.

Однак запропонована проектом редакція породжує нову правову колізію: абзац другий ч. 1 ст. 10-1 Закону України «Про доступ до публічної інформації» передбачає оприлюднення публічної інформації у формі відкритих даних на єдиному державному веб-порталі відкритих даних та на своїх веб-сайтах, а оскільки закони України мають вищу юридичну силу, ніж постанови Кабінету Міністрів, то запропонована редакція п. 4 Положення №835 є неузгодженою із діючою редакцією Закону України «Про доступ до публічної інформації».

Усунення даної колізії без внесення змін до Закону України «Про доступ до публічної інформації» можливе за умови приведення п. 2 Положення №835 (у редакції проекту) у відповідність із нормами абзацу другого ч. 1 ст. 10-1 Закону України «Про доступ до публічної інформації».

 

Проблеми організації роботи

Робота з даними

Значна кількість учасників тренінгів  неодноразово відзначала (як під час дискусій, так і під час заповнення анкет) однією з головних проблем, що стоять на заваді оприлюдненню наборів даних, відсутність методичних рекомендацій з наступних питань:

  • типова структура наборів даних з відповідної тематики (напрямків)
  • перелік змінних, які повинні міститися у наборах даних по відповідних тематиках (напрямках)
  • принципи оприлюднення переліків нормативно-правових актів, інших документів, виданих різними органами державної влади та місцевого самоврядування, а також переліків договорів
  • зміст наборів даних певних категорій
  • єдиний реєстр (перелік) обов’язкових наборів даних

Сама наявність подібних питань свідчить про брак розуміння у окремих розпорядників відмінності між інформацією та даними, про неготовність аналізувати наявну інформацію та визначати, які дані така інформація містить, і як наслідок — відсутність чіткого уявлення про те, які саме дані підлягають оприлюдненню.

Прикладом може бути питання «Які змінні потрібно оприлюднювати при публікації рішень місцевих рад?». Відповідь на це питання є очевидною — необхідним мінімумом змінних в даному випадку є обов’язкові реквізити рішення як акту органу місцевого самоврядування — дата прийняття, номер та назва рішення.

Частковим вирішенням цього блоку питань могла б стати розробка типових структур усіх наборів даних, що підлягають обов’язковому оприлюдненню відповідно до Переліку №835, так як даний перелік має визначену кількість наборів даних.

Розробка відповідних типових структур даних повинна бути покладена на центральними органами кожного розпорядника інформації (міністерствами, відомствами, іншими центральними органами виконавчої влади), що дозволить максимально врахувати специфіку роботи кожного розпорядника.

До розробки типових структур даних органів місцевого самоврядування можна залучити представників тих міських (районних) рад, які мають передовий досвід оприлюднення наборів даних, активно взаємодіють із громадськістю в цьому напрямку.

Враховуючи викладене, доцільно направити Кабінету Міністрів України лист від Державного агентства з питань електронного урядування, який містив би концепцію розробки відповідного Порядку підготовки типових структур наборів даних, а також пропозицію щодо створення відповідної робочої групи, до складу якої повинні увійти фахівці по роботі з даними, а також представники розпорядників, громадськості, інших зацікавлених осіб (громадських організацій, об’єднань громадян тощо).

Однак оскільки порушене питання, по-перше, носить системний характер в частині нерозуміння окремими посадовими особами розпорядників інформації принципів організації даних в цілому, а по друге — кількість можливих наборів даних є в десятки, а можливо й сотні разів більшою за перелічені у додатку до Положення №835, доцільно також підготувати методичні рекомендації та/або посібники по роботі з даними, завдяки яким відповідні фахівці органів державної влади та місцевого самоврядування змогли б навчитися працювати з інформацією як з даними, виділяти дані із інформації, структурувати їх тощо. При цьому бажано, щоб згадані методичні рекомендації та/або посібники мали «офіційний» характер (як варіант — розроблені згаданою вище робочою групою), оскільки, як показує практика, наявні посібники та методичні матеріали, розроблені різними громадськими організаціями, носять дорадчий характер, оскільки є неофіційними.

Окремими посадовими особами розпорядників також було озвучено проблемні питання щодо браку методологічних рекомендацій (інструкцій) по роботі з користувацьким інтерфейсом персонального електронного кабінету користувача на єдиному державному веб-порталі відкритих даних, оскільки не всі користувачі мають достатній рівень навичок роботи з комп’ютером та веб-інтерфейсом. Для таких користувачів доцільно було б розробити або покрокові методичні рекомендації щодо основних дій у персональному електронному кабінеті користувача (із скріншотами), або ж створити навчальне відео.

Робочий процес в органах державної влади та місцевого самоврядування

Найбільший за обсягом блок питань, порушених учасниками тренінгів, стосується організації роботи по оприлюдненню відкритих даних в органах, у яких вони є відповідальними за оприлюднення. Спектр проблем є досить широким — від нерозуміння керівниками органу концепції відкритих даних, небажання забезпечення відкритості органу до браку кадрових та матеріально-технічних ресурсів, що виділяються для проведення роботи з оприлюднення наборів даних.

Так, посадовими особами розпорядників відзначається відмінність форми подання інформації у вигляді набору даних, та цієї ж інформації як вона циркулює всередині відповідного органу державної влади та місцевого самоврядування (як горизонтально, так і вертикально). Прикладом цього при вертикальній циркуляції може слугувати ситуація, коли добре зрозуміла та прийнятна для керівника суб’єкта владних повноважень форма подання інформації є водночас недостатньо структурованою для того, щоб бути набором даних, що призводить до необхідності одночасно із підготовкою інформації для керівництва готувати її у вигляді набору даних для оприлюднення. У випадку, коли інформація циркулює горизонтально, можлива ситуація, коли структурний підрозділ розпорядника інформації надає відповідальній особі інформацію для оприлюднення у неструктурованому вигляді (наприклад, таблиці у документах Microsoft Word із назвами, складними заголовками стовпчиків та підписами посадових осіб), або ж у вигляді, що потребує довгої та кропіткої обробки (наприклад, у вигляді сканованих таблиць). Природньо, що необхідність дублювати інформацію або ж займатися її обробкою відбирає певну кількість часу і при цьому позбавляє особу, яка готує оприлюднення, мотивації (особливо у випадках значних обсягів інформації для оприлюднення).

Одним з вагомих факторів, що негативно впливає на оприлюднення наборів даних формі відкритих даних, є дублювання паперового документообігу паперовим, оскільки потребує значних витрат часу та зусиль під час оприлюднення. Також вказувалося і на те, що в багатьох органах виконавчої влади, місцевого самоврядування, інших установах на особу, що відповідальна за оприлюднення наборів даних, часто виконує і інші посадові обов’язки (наприклад, відповідальна за діловодство), іноді також штатна чисельність відповідальних за оприлюднення не повною мірою відповідає обсягам інформації, яка обробляється та оприлюднюється, що призводить до браку часу і відповідно унеможливлює якісну підготовку наборів даних.

Під час тренінгів (а також в анкетах) відповідальні особи розпорядників також відзначали невміння застосовувати ефективні прийоми та методи обробки даних у окремих посадових осіб, недостатній рівень володіння офісними програмними комплексами, недостатній рівень знань (відсутність розуміння понять кодової сторінки, формату файлів) тощо.

Усі перелічені вище фактори негативно впливають на процес організації оприлюднення публічної інформації в органах державної влади та місцевого самоврядування, особливо у випадках, коли присутній не один, а кілька факторів, скомбінованих між собою.

На нашу думку, поліпшення стану справ могли б забезпечити наступні дії.

У короткостроковій перспективі:

  • роз’яснення необхідності, важливості публікації наборів даних серед керівників розпорядників інформації, кінцевим результатом таких заходів повинні стати ліквідація формального підходу окремих керівників до оприлюднення наборів даних, зокрема припинення практики комплектації відповідних підрозділів, на які покладено обов’язки із оприлюднення за залишковим принципом (як людськими, так і матеріально-технічними ресурсами).
  • чітке розмежування обов’язків посадових осіб, відповідальних за оприлюднення інформації у формі відкритих даних — такі відповідальні особи не повинні одночасно відповідати в установі за діловодство, роботу зі зверненнями громадян тощо.
  • видання керівництвом відповідних установ внутрішньо-нормативних актів (наказів, розпоряджень), спрямованих на створення в організації чіткої структури із підготовки та оприлюднення наборів даних (в тому числі із визначенням відповідальних осіб за підготовку наборів даних у підрозділах), із залученням до цього найбільш кваліфікованих працівників, що мають навички роботи з комп’ютером, сучасною офісною технікою тощо.
  • організація керівниками відповідних суб’єктів владних повноважень періодичних навчань працівників навичкам, методам та прийомам роботи з даними із використанням сучасного програмного забезпечення.

У довгостроковий перспективі на загальнодержавному рівні публікації наборів даних, оприлюдненню всієї можливої публічної інформації у формі відкритих даних сприятиме перехід від паперового обороту до електронного із одночасною обов’язковою розробкою відповідних програмних комплексів, здатних забезпечувати автоматичне оприлюднення відповідних наборів даних (або принаймні їх формування у відкритих та структурованих форматах).

Важливим питанням також є рівень автономності розпорядника під час прийняття рішень в частині політики оприлюднення наборів відкритих даних — значна кількість розпорядників підпорядкована відповідним організаціям вищого рівня — міністерствам, відомствам, іншим центральним органам виконавчої влади (наприклад, обласні управляння статистики підпорядковані Держстату), що впливає на можливість оприлюднення тієї чи іншої інформації таким розпорядником — мають місце випадки, коли керівництво розпорядника інформації очікує відповідних вказівок від органу вищого рівня, що іноді призводить до бездіяльності при оприлюдненні наборів даних.

Сприяти вирішенню даної ситуації могло б видання розпорядниками вищого рівня — суб’єктами владних повноважень відповідних документів (наказів, розпоряджень, листів тощо), якими б розпорядникам нижчого рівня надавалася б певна свобода дій в частині оприлюднення наборів даних, зокрема право самостійно визначати інформацію, яка підлягає оприлюдненню у вигляді наборів відкритих даних, з урахуванням норм чинного законодавства у сфері інформації.

Принагідно слід відзначити, що низька якість наборів даних, небажання їх оприлюднювати, формальний підхід до оприлюднення іноді є наслідками застарілої парадигми мислення окремих керівників, для яких майже єдиним дієвим засобом стимулу виконання обов’язків є адміністративне покарання. Відсутність відповідальності за невиконання вимог Постанови №835 породжує безкарність, що зрештою негативно впливає на відкритість і прозорість сектору державної та місцевої влади. На жаль, ані діюча редакція Постанови №835, ані проект внесення змін не містять механізму, що передбачав би відповідальність за порушення Положення про набори даних, які підлягають оприлюдненню у формі відкритих даних.

Технічні питання

Питання відсутності автоматизованих систем, які б здійснювали автоматичне формування (а можливо і публікацію наборів даних), порушене у попередньому розділі, має наслідком наступні проблемні питання:

  • необхідність ручного контролю якості сформованих наборів (наприклад, перевірка наявності порожніх комірок у таблицях, де їх бути не повинно, контроль відповідності типів даних тощо).
  • відсутність доступних єдиних реєстрів (довідників міст, вулиць, прізвищ тощо) призводить до погіршення якості даних (низька якість адрес, різні варіанти назв топонімів і т. ін).
  • використання в різних установах, підпорядкованих одному розпоряднику вищого рівня, різного програмного забезпечення та підходів до створення наборів даних призводить до неможливості якісно акумулювати дані в одному місці, унеможливлює інтероперабельність.

Вирішенню цих проблем може сприяти створення на рівні Держстату та органів, що є утримувачами відповідних реєстрів, системи загальнодоступних довідників, реєстрів та переліків одночасно із визначенням необхідних ідентифікаторів у відповідних реєстрах.

 

Питання взаємодії з громадськістю

Плідна та взаємовигідна взаємодія влади та громадськості є однією з очікуваних цілей, що мають бути досягнуті завдяки відкритості влади. На даному етапі розвитку концепції відкритих даних в Україні слід відмітити низький рівень попиту на відкриті дані у громадськості, що призводить до виникнення замкненого кола — попит на дані відсутній через невелику кількість відомих широким колам проектів, а проекти в свою чергу відсутні, оскільки у суспільства відсутній попит на відкриття даних.

Учасниками тренінгів було окреслено наступні проблемні питання:

  • відсутність попиту на відкриті дані з боку стейкхолдерів
  • відсутність у розпорядників вичерпних переліків публічної інформації, якою вони володіють, і як наслідок — неможливість сформувати переліки пріоритетних наборів даних

Яскравим прикладом цього є місто Кропивницький, де наприкінці лютого 2017 року від імені журналістської спільноти було направлено відкритий лист з вимогою вирішити питання оприлюднення на офіційному сайті міськради масивів відкритих даних, визначених Постановою №835. Міська влада Кропивницького пішла назустріч озвученим вимогам — на офіційному сайті міської було створено розділи «Набори відкритих даних», видано розпорядження №40 «Про набори даних, що підлягають оприлюдненню у формі відкритих даних», призначено відповідальних осіб. Однак сформувати перелік пріоритетних та актуальних наборів даних журналістська спільнота Кропивницького не змогла. [7]

В даному випадку розпорядникам для налагодження ефективної взаємодії потрібно насамперед провести аудит даних, що дасть можливість визначити набори даних, що можуть і мають бути оприлюднені, набори, а також провести відповідні консультації із громадськістю з питання переліку оприлюднених наборів даних.

Посилання

[1] https://www.w3.org/TR/PR-rdf-syntax/

[2] https://www.w3.org/TR/turtle/

[3] https://www.w3.org/TR/n-triples/

[4] https://www.w3.org/TR/n-quads/

[5] https://www.w3.org/TR/json-ld/

[6] https://www.w3.org/TR/rdf-syntax-grammar/

[7] https://gre4ka.info/blog/entry/posadovtsi-chy-zhurnalisty-khto-nedopratsiuvav-dlia-vidkrytykh-danykh