04.12.2017

Ефективність тренінгів «Відкриті дані для державних службовців»

Untitled-3
Напрямки: Культура даних.
Період: 11/2017

В рамках реалізації проекту «Відкриті дані: тренінги для державних службовців» фахівці Українського центру суспільних даних провели п’ять дводенних тренінгів у Києві, Львові, Одесі, Харкові, Дніпрі – для представників з усіх регіонів України. У тренінгах, в якості лекторів та тренерів, виступали також учасники Національної мережі тренерів з відкритих даних, створеної в рамках проекту USAID/UKAID TAPAS: Олена Гунько (Львів), Юрій Пігарєв (Одеса), Артем Серенок (Харків), Кирило Захаров (Дніпро).

Питання, охоплені на тренінгах:

  • Відкриті дані: поняття, історія, законодавство;
  • Приклади використання відкритих даних;
  • Формати відкритих даних, чисті дані, правильно структуровані дані, формати файлів;
  • Обробка даних засобами електронних таблиць;
  • Мікродані та проблеми захисту персональних даних;
  • Основи статистики, аналізу та представлення, візуалізації даних;
  • Визначення основних проблем, що впливають на якість даних – групові дискусії, колективні обговорення;
  • Підготовка даних до публікації у вигляді «відкритих даних».

Лектори концентрували увагу учасників на вмінні грамотно працювати і управляти даними, доводили надзвичайну важливість цих навичок для державних службовців, працівників органів місцевого самоврядування, оскільки лише на основі надійних і коректних даних можна приймати виважені і ефективні управлінські рішення.

Презентації доступні для перегляду тут

Заявки до участі у тренінговій програмі подали майже 400 осіб. Були відібрані і пройшли навчання 167 осіб — фахівців зі сфер освіти, охорони здоров’я, поліції, юстиції, а також спеціалісти відділів IT та доступу до публічної інформації органів виконавчої влади та місцевого самоврядування.

Учасники тренінгів

Регіональний розподіл склався наступним чином — найбільша кількість учасників в порівнянні із середньою по областях спостерігається у Дніпропетровській, Донецькій, Кіровоградській, Львівській, Одеській, Харківській та Херсонській областях.

chart1

Діаграма 1. Регіональний розподіл учасників тренінгів

Розподіл учасників тренінгів залежно від сфери діяльності показано на діаграмі 2 — більшість складають посадові особи органів державної влади, освіти та поліції, найменша кількість спостерігається у категорії охорони здоров’я.

chart2

Діаграма 2. Розподіл учасників тренінгів за сферою діяльності

Початкове анкетування

З метою дослідження рівня знань безпосередньо перед тренінгами проводилося початкове анкетування учасників, за результатами якого було виявлено, що:

  • переважна більшість (92% опитаних) отримує дані для роботи у форматах Microsoft Office (doc/docx, xls/xlsx), а також PDF (72%)
  • у структурованих форматах електронних таблиць (csv, ods) дані отримують 27% опитаних, 17% працює з даними, отриманими з Google Таблиць

І хоча через розповсюдженість офісного пакету Microsoft Office використання форматів MS Word та MS Excel домінує, приємно спостерігати, що в деяких випадках вільне програмне забезпечення все ж таки використовується, про що свідчать відповіді щодо використання форматів ODT та ODS (щоправда, у форматі електронних таблиць ODS дані отримують лише 4 особи).

З отриманих відповідей також стало відомо, що існують також органи, що використовують по справжньому структуровані формати — такі як XML та JSON та його похідні, але випадки використання цих форматів поодинокі і зумовлені специфікою роботи відповідних органів.

За результатами початкового анкетування трохи більше, ніж половина учасників вказали, що не знають, що таке кодування UTF-8 (сучасний стандарт кодування файлів, здатний забезпечити відображення майже усіх відомих людству мов, використовується в сучасних операційних системах та офісних пакетах).

chart3

Діаграма 3. «Чи знаєте Ви, що таке UTF-8 або Unicode?»

Більшість учасників до тренінгів також не знали або не могли визначитися із відповіддю на питання, що є чутливими даними.

Публікація наборів відкритих даних на порталі data.gov.ua

Незважаючи на те, що Єдиний державний веб-портал відкритих даних функціонує починаючи з квiтня 2014 року, переважна більшість опитаних учасників не спішить оприлюднювати на ньому набори даних (діаграма 4). При цьому найбільша кількість розпорядників, що оприлюднюють дані, спостерігалася у м. Києві та регіонах, учасники яких прибули на тренінг до м. Києва.

chart4

Діаграма 4. «Чи публікуєте Ви набори даних на data.gov.ua»

Але не все так погано — третина посадових осіб, що не оприлюднюють дані на Єдиному веб-порталі, все ж вказали, що оприлюднюють дані на порталах або сайтах місцевих органів влади. В цілому практика оприлюднення наборів тут виглядає більш позитивною в порівнянні з публікацією на Єдиному веб-порталі, але не настільки, щоб можна було казати #перемога — в усіх регіонах (крім регіону міста Львів), де були проведені тренінги, більшість респондентів не оприлюднює набори даних.

chart5

Діаграма 5. «Чи публікуєте Ви набори даних на cайтах місцевих органів влади?»

Однак не слід забувати, що сама лише наявність порталу або розділу на сайті не гарантує, що на ньому будуть оприлюднюватися саме набори даних, а не скановані документи в PDF — тобто навіть там, де оприлюднення здійснюється, постає питання щодо якості оприлюднених даних та відповідності цих даних умовам машиночитаності, охайності та структурованості.

Оцінка тренінгів учасниками

Безпосередньо після кожного тренінгу проводилося опитування учасників з метою визначення вражень від тем, що їх було висвітлено під час тренінгів, а також щодо теми, що сподобалася найбільше. Найбільше «лайків» зібрала тема «Обробка даних засобами MS Excel», найменше — «Підготовка даних до публікації у вигляді „відкритих даних“», що зрозуміло — Microsoft Excel в якості прикладного інструменту використовується посадовими особами щодня, а підготовка до публікації є процесом, якого посадові особи намагаються уникати, оскільки він містить багато технічних аспектів.

chart6

Діаграма 6. «Яка тема вам найбільше сподобалася?» (учасники могли відзначити більше одного варіанту відповіді)

Коротко про інші аспекти оцінки — тема «Відкриті дані» виявилася доступною, але не новою, важливість форматів даних була відмічена учасниками, але не дуже надихає (на відміну від обробки даних в Excel), тема мікроданих виявилася не лише важливою, але водночас новою і доступно викладеною, «Статистика», як і повинно бути — конкретна, доступна та важлива, а «Підготовка до публікації» — не дуже надихає, хоча і важлива.

Тема «Відкриті дані»

chart7

Тема «Формати даних»

chart8

Тема «Обробка даних в Excel»

chart9

Тема «Мікродані»

chart10

Тема «Підготовка до публікації»

chart11

Тема «Статистика»

chart12
Вебінари

В ході реалізації проекту було проведено п’ять вебінарів (кожен з яких відповідав окремій темі тренінгу) для учасників, які з тих чи інших причин не змогли потрапити на тренінги, а також для всіх охочих. На час написання цих рядків вебінари загалом переглянули більше ніж 1800 разів.

При цьому питома вага учасників тренінгів, що переглядали не менше одного вебінару із циклу «Відкриті дані для державних службовців», становить 85,9% (через декілька місяців після завершення навчання, учасникам тренінгів було запропоновано заповнити підсумкову анкету, де й запитували в т.ч. й про вебінари).

chart18

Діаграма 7. «Чи дивилися Ви вебінари?»

Як свідчить опитування, найбільш популярними серед учасників тренінгів були вебінари, присвячені обробці даних за допомогою електронних таблиць (75,8%) та концепції відкритих даних (64,5%)

.

chart19

Діаграма 8. Вебінари, які дивилися учасники тренінгів (відповідно до відповідей на анкети)

Практичні результати

З метою оцінити, як змінилися практики роботи з даними серед учасників, наскільки корисними і прикладними були проведені тренінги, через декілька місяців після завершення власне навчання, учасникам тренінгів було запропоновано заповнити підсумкову анкету. Незважаючи на те що анкета була надзвичайно детальною, було отримано 72 відповіді, (близько 50% від загальної кількості учасників) – досить добрий показник, що свідчить про важливість теми для цільової аудиторії.

Відповідно до отриманих відповідей, учасники тренінгів отримали наступні знання та навички:

  • дізналися, що найбільш придатним для збереження текстових файлів структурованих форматів є кодування Unicode (76,1%)

chart13

Діаграма 9. «Яке кодування бажано використовувати у файлах з даними?»

  • навчилися визначати, що таке структуровані дані та формати файлів, що можуть бути використані для оприлюднення відкритих даних (81,7%), хоча дехто з учасників все ще вважає, що в PDF можна оприлюднювати відкриті дані.

chart14

Діаграма 10. Розподіл відповідей на питання «Які з наведених файлових форматів більш придатні для публікації відкритих даних?»

  • чутливі дані виявилися дійсно новою темою — навіть після тренінгів тільки 22,8% змогли правильно визначити, які дані вважаються чутливими, решта, вочевидь, була дещо дезорієнтована кількістю видів чутливих даних, оскільки при вихідному анкетуванні вказала поряд з дійсно чутливими даними інші дані, які не відносяться до чутливих (адресу, телефон, e-mail, IP-адресу тощо).

chart15

Діаграма 11. Розподіл відповідей на питання “Які з вказаних нижче даних вважаються чутливими?”

Майже всі респонденти (92,9%) поширювали отримані знання — ділилися отриманими знаннями з колегами, підлеглими та іншими зацікавленими особами.

chart16

Діаграма 12. Розподіл респондентів за типом поширення отриманих знань.

Найбільш розповсюджений спосіб поширювати отримані знання серед респондентів — надання порад та демонстрація прикладів (57,6%), на другому місці поширення презентацій разом з наданням порад та прикладами (27,3%), а деякі з учасників тренінгів до того ж провели тренінги самостійно — таких серед респондентів 4,5%.

Певно, найцікавішим було те, як змінився робочий процес у розпорядників даних після тренінгів.

Значна кількість опитаних учасників відзначили зміни на краще — про зростання ефективності роботи з даними повідомили 75% респондентів, про підвищення культури роботи з даними (вимагання у колег чистих та охайних даних) — 56,9%, використання інших форматів для оприлюднення спостерігається у 20,8%.

chart17

Діаграма 13. Як змінилася робота з даними респондентів після тренінгів.

Зміни в робочому процесі при цьому спостерігаються у 26,1% опитаних: у 20,8% відбувся перерозподіл функцій між співробітниками (скоріше за все внаслідок того, що відповідальні особи у підрозділах почали займатися підготовкою даних, а не просто передавати їх тим, хто безпосередньо відповідає за публікацію), а 15,3% змінили правила роботи. Крім цього, 5,6% розпорядників підвищили ефективність роботи шляхом налагодження обміну публічною інформацією з іншими розпорядниками.

Оприлюднювати більше наборів даних стали 9,7% опитаних (скоріш за усе, внаслідок отриманих знань про публічність майже всієї інформації, якою володіє розпорядник), а 1,4% — навпаки, менше (можливою причиною цього може бути відмова від публікації у неструктурованих форматах, наприклад у PDF чи сканованих зображеннях).

В розрізі напрямків діяльності розпорядників зміни у роботі з даними нерівномірні — у декого вони значущі, а дехто продовжує працювати як і раніше:

  • Найбільше зростання ефективності роботи з даними спостерігається в органах Національної поліції (31,5%), закладах освіти (22,2%) в органах державної влади (18,5).
  • Підвищення культури роботи з даними спостерігається майже по всіх основних сферах діяльності у приблизно рівній пропорції — органи місцевого самоврядування, органи державної влади та установи освіти — по 22,0%, органи Національної поліції — 19,5%. Частка закладів охорони здоров’я в загальній кількості установ, що підвищили культуру роботи з даними, становить 12,2%.
  • Формати публікації даних найбільш помітно змінилися в органах місцевого самоврядування (33,3%), сфері освіти (26,7%) та органах державної влади (26,7%), частка органів Національної поліції становить 13,3%, в установах охорони здоров’я формати оприлюднення не змінювалися (на нашу думку, показник Національної поліції може свідчити про відсутність необхідності істотно змінювати формати оприлюднення, так як оприлюднення вже проводиться у відповідних форматах, а у випадку із закладами охорони здоров’я навпаки, свідчить про небажання змінювати стан справ на краще).
  • Перерозподіл функцій серед співробітників та/або зміну правил роботи найбільш помітний серед установ освіти (67,3%), органів державної влади та місцевого самоврядування (по 38,2%), а також органів Національної поліції (33,9%). В органах охорони здоров’я змін у робочому процесі майже не відбулося — відповідний варіант відповіді обрали 6,7% респондентів.
  • Збільшення кількості наборів, які оприлюднюються розпорядниками, значною мірою спостерігається по категорії органів місцевого самоврядування та органів державної влади (42,9% та 28,6% відповідно). Питома вага установ охорони здоров’я та освіти в загальній кількості установ, що збільшили кількість наборів, що оприлюднюються, є однаковою і становить 14,3%.

Зазначене може бути наслідком того, що в органах як місцевої, так і державної влади кількість публічної інформації, а відповідно і наборів даних є досить значною та має тенденцію до зростання, а у закладах освіти та охорони здоров’я кількість наборів даних детермінована і тенденції до зростання не виказує.

Тренінги «Відкриті дані для державних службовців» не лише допомогли працівникам органів виконавчої влади та місцевого самоврядування поглибити теоретичні і практичні знання у сфері відкритих даних, їх обробки та захисту, а і дозволили виявити наявні проблемні питання, по яким фахівцями нашого центру було розроблено відповідні рекомендації (див. окремий матеріал Тренінги «Відкриті дані для державних службовців»: підсумки та рекомендації).