Журналістика даних, або дата-журналістика — напрямок, який стрімко набирає популярність. Завдяки йому можна проаналізувати інтернет-простір, викрити дезінформацію в медіа та месенджерах, наративи російської пропаганди, розслідувати корупційні кейси або дослідити руйнації внаслідок війни.
Ґрунт, база, основа для таких матеріалів — аналіз великої кількості відкритих даних. А результат роботи можна презентувати у вигляді списку, інфографіки, діаграми тощо.
Серед українських медіа на журналістиці даних знається інтернет-видання Texty.org.ua. Торік на сайті вийшов ряд подібних матеріалів: перевірка житлових районів українських міст на інклюзивність, матеріал про рік повномасштабної війни в інфографіці, спільний із медіагрупою «Накипіло» проєкт про Північну Салтівку.
Також журналістика даних є одним з інструментів для команд, що фокусуються на розслідуваннях: NGL.media, Bihus.Info, Рух «ЧЕСНО».
Разом із Денисом Губашовим, консультантом із впровадження політики відкритих даних, аналітиком Texty.org.ua, підготували своєрідну інструкцію щодо дата-журналістики.
Де журналісти можуть шукати дані про Україну?

Про суспільство та місто:
- DREAM — державна платформа, відкрита за дизайном, яку прозвали «єдиним вікном» для проєктів відновлення. Уже під час її розробки враховували, що вона може бути корисною і для аналізу даних, і для їхнього перевикористання. За словами Дениса, платформа має стати першим інструментом для моніторингу відновлення.
- Єдиний державний портал відкритих даних https://data.gov.ua.
- Державна служба статистики України (Держстат). Вона акумулює демографічну, соціальну, економічну й багатогалузеву статистику. Також в beta-версії працює банк даних, завдяки якому можна вивчати та фільтрувати набори даних за певними показниками.
- НАЗК відновило доступ до Реєстру декларацій. У реєстрі відображені зміни майнового стану осіб, уповноважених виконувати функції держави та місцевого самоврядування.
- Реєстр судових рішень.
- Єдина державна електронна база з питань освіти (ЄДЕБО). Інформація з неї, за виключенням персональних даних та інформації з обмеженим доступом, також є доступною у форматі відкритих даних.
- Єдина державна електронна система у сфері будівництва (ЄДЕССБ). На порталі оприлюднені будівельні паспорти, інформація про атестованих осіб тощо. Більша частина ЄДЕССБ, за виключенням чутливої інформації, доступна користувачам у формі відкритих даних.
Про економіку та фінанси:
- Prozorro — електронна система публічних закупівель, через яку проводяться закупівлі й щодо відновлення. Prozorro має відкритий API.
«Він непогано задокументований, не дуже гнучкий — це пов’язано з архітектурою системи, це така архітектура високих навантажень. Тож, відповідно, у них дуже простий API, але з ним зручно працювати», — каже Денис Губашов.
- Spending — публічна частина платформи відкритих даних у сфері публічних фінансів Є-data, через яку до повномасштабного вторгнення можна було можна перевірити всі транзакції казначейськими рахунками.
Інформація, яка є чутливою в умовах війни, недоступна. Завдяки Spending можна моніторити видатки на відновлення. Денис наводить типовий кейс: ви поєднуєте дані з Prozorro з даними зі Spending, і перший відображає проведену закупівлю, а Spending підтверджує факт, що транзакція коштів відбулася.
- Відкриті дані від Національного банку України містять інформацію, яка дозволяє краще зрозуміти економічний процес. У доступі, наприклад, є макроекономічні показники, є дані щодо кредитів і депозитів, ключові для банківської сфери. Є інформація щодо монетарної, валютної політики тощо.
Про екологію та охорону довкілля:
- ЕкоСистема — онлайн-платформа у сфері захисту довкілля. На ній зібрані дані моніторингів про стан повітря, води, ґрунтів у населених пунктах, а також реєстри, які ведуть Міндовкілля та центральні органи влади. Станом на початок квітня доступно 33 реєстри та ще 16 — у розробці.
- SaveEcoBot від ініціативи SaveDnipro містить дані про стан довкілля з понад 50 джерел.

Після місткого списку може виникнути враження, що з відкритими даними в Україні все добре. Утім, не все так райдужно. Денис зазначив, що існують суттєві перепони для журналістів.
- Відсутність публічного РПЗМ — Реєстру пошкодженого та знищеного майна, через що журналісти не можуть оцінювати рівні збитків унаслідок війни.
- Мін’юст не оприлюднює єдиний державний реєстр юридичних осіб, фізичних осіб, підприємців і громадських формувань. Хоча він продає через ІС ДП «НАІС» доступ до цього реєстру. За підрахунками Дениса, доступ до актуальних даних з Єдиного реєстру обійдеться користувачам в суму від 200 до 300 тисяч гривень на рік. Це вартість комерційного доступу через API.
- Обмеження до реєстрів податкової служби.
- Закритий публічний доступ до інспекційного порталу. До повномасштабного вторгнення на цій платформі збиралися всі дані про всі планові та позапланові перевірки, перевірку бізнесу й різні інспекції. Запуск порталу дозволить бізнесу зрозуміти, як із ним поводиться держава.
- Не зважаючи на вище поданий розділ «Екологія та охорона довкілля», дані з реєстрів Міністерства захисту довкілля та природних ресурсів України подаються обмежено; частина інформації залишається закритою.
Із чого варто почати журналісту?
«Найголовніше — це навчатися»
Денис зазначає, що варто знайомитися з мовами програмування.
«Це мастхев. Бо, наприклад, із Prozorro я не знаю способу роботи без використання коду. Хіба з готовими додатками типу DOZORRO, Clarity Project. Але якщо працювати з Prozorro за допомогою первинних даних, то, як на мене, лише з програмуванням. Spending дозволяє вивантажувати дані через вебінтерфейс, але там є обмеження: лише за період у 90 днів. Якщо треба вивантажити значний масив даних, це треба робити вручну, що не дуже окей, а тому програмування — це основне. Я раджу Python, JavaScript як мову для вебу або AR як мову для аналізу даних».
Утім, знайти, дослідити і написати текст — мало. Для завершеного матеріалу необхідно запакувати результат роботи у зручний читачеві чи аналітикові формат. І саме тут на допомогу приходить візуалізація даних.

Які інструменти можна використовувати?
Для простих інтерактивних графіків, які вбудовуються на вебсторінки, можна використовувати Flourish та Datawrapper. За наявності необхідних даних робота в них займе до години часу.
«Умовно все робиться перетягуванням мишки, записом елементів. Це гарні zero code інструменти, які використовують і професійні агентства. Зараз Datawrapper використовує і New Voice, і багато західних видань», — каже Денис.
Для візуалізації на вищому рівні він радить придивитися до наступних сервісів:
- https://www.tableau.com,
- Microsoft Power BI,
- https://lookerstudio.google.com.
«Це все — інструменти для побудови інтерактивних дашбордів. Це трошки відходить від журналістики даних, бо дашбордом ми не можемо розповісти історію, але можемо налаштувати гнучкий інтерфейс доступу до даних для читачів».
Наступний рівень — вивчати програмування. Мова JavaScript має численну кількість фреймворків для вебу, інструменти та бібліотеки для побудови графіків для скролітелінгу. Scrollytelliyng — явище, коли в довгочитах аудіо-, відео- та анімаційні ефекти викликаються простим прокручуванням сторінки. З мовами програмування відкриваються величезні можливості дата-журналістики.
Наостанок
Цей матеріал є лише початком для медійників, які прагнуть висвітлювати процеси відновлення за допомогою журналістики даних. На наше переконання, до Перемоги кейсів із відновлення тільки більшатиме, тож напрямок перспективний. Для продовження знайомства з ним радимо додаткову літературу:
- «Журналістика даних: Посібник» https://texty.org.ua/archive-books/40161/zhurnalistyka-danykh-posibnyk-40161/.
- «Довідник із поганих даних» від Quartz https://texty.org.ua/archive-books/90212/dovidnyk-iz-pohanykh-danykh-vid-quartz-90212/.
- Карл Броман, «Організація даних у таблицях» https://texty.org.ua/archive-books/87136/karl-broman-orhanizatsija-danykh-u-tablytsjakh-87136/.
Ми створили цей матеріал як учасники Мережі «Вікно Відновлення». Все про відновлення постраждалих регіонів України дізнавайтеся на єдиній платформі recovery.win.
Обкладинка: Pexels