19 апреля 2018 года в Москве прошла встреча представителей некоммерческих организаций, посвященная теме “Результаты деятельности НКО как открытые данные”.
Эксперты Инфокультуры представили результаты исследования текущего состояния данных некоммерческих организаций: типы публикуемых данных, информационное поведение НКО, доступность и открытость данных. Участники встречи обсудили также, каким требованиям должен соответствовать портал для публикации данных, чтобы он стал эффективным инструментом для продвижения результатов деятельности некоммерческих организаций.
Публикуем ключевые выводы и презентацию первого исследования данных, которые создают и размещают некоммерческие организации.
Цель и задачи исследования
Многие НКО в ходе своей деятельности собирают или производят данные и иные информационные материалы. Значительное число таких организаций пользуются при этом источниками государственного финансирования, прежде всего государственными грантами, а также субсидиями.
В большинстве случаев данные, собранные в рамках проектов НКО (в том числе и организованных на государственные средства) остаются достоянием исключительно этих НКО и не распространяются за их пределы. Между тем, в ряде случаев полученные данные могли бы быть полезны как другим НКО, так и более широкой аудитории. Можно также предположить, что в ряде случаев по этой же причине работа фактически дублируется разными НКО, потому что даже если необходимые данные уже собраны какой-либо организацией, узнать об этом и получить эти данные в свое распоряжение другой организации уже трудно.
Если бы данные (и иные материалы), производимые НКО, были общедоступны, это, с одной стороны, могло бы быть полезно другим НКО, активистам и исследовательским организациям. C другой стороны, это позволило бы в ряде случаев избегать дублирования уже проделанной работы.
Чтобы данные были общедоступными, необходимо три основных условия:
- Их должно быть легко искать;
- У них должна быть открытая лицензия;
- Они должны быть опубликованы в открытом доступе и в пригодном к использованию виде.
Цель исследования — изучить существующую ситуацию и установить, какими свойствами должен обладать централизованный портал, на котором НКО могли бы размещать свои данные и прочие информационные материалы так, чтобы они были общедоступны.
Основные задачи исследования:
- Определить, какого рода информацию производят НКО;
- Установить, как они ею распоряжаются
- Установить, как должна быть устроена платформа, отвечающая поставленной цели.
Описание предметной области, необходимое для определения свойств портала, производилось на анализе информационного поведения отдельных НКО и последующего обобщения результатов этого анализа. Информационное поведение устанавливалось на основании содержания сайтов этих НКО.
Помимо информационного поведения, также учитывались обстоятельства финансирования их деятельности. Это было необходимо как одно из оснований создания правовой базы проекта.
Для отбора организаций, на примере которых проводился анализ, была первоначально сделана выборка из базы данных проекта “Открытые НКО” (openngo.ru). Эта база создана на основе реестра НКО Министерства юстиции РФ и включает также данные о доходах этих организаций из таких источников, как президентские гранты (данные с 2013 по 2017 гг.), федеральные субсидии (с 2012 по 2017 гг.), контракты 94-ФЗ, 44-ФЗ, договоры 223-ФЗ (с 2011 по 2018 гг.). Из базы “Открытых НКО” были отобраны все действующие, согласно реестру Минюста РФ, организации, для которых на момент выгрузки было точно известно, что они получали финансирование хотя бы из одного из названных источников. На момент выгрузки таких организаций было чуть более 17 000.
Затем из полученной выборки в полуавтоматическом режиме были отфильтрованы организации, с наибольшей вероятностью подходящие под определение НКО, используемое в проекте.
В данном исследовании под НКО (некоммерческой организацией) понимается объединение людей (или их объединений), деятельность которого направлена на удовлетворение интересов членов объединения или общественных интересов и не ориентирована на извлечение прибыли (кроме направляемой на уставные цели).
В автоматизированной части применялся поиск организаций по ключевым словам, список которых формировался с использованием описаний деятельности, данных в Положении Фонда президентских грантов “О конкурсе на предоставление грантов Президента Российской Федерации на развитие гражданского общества” (https://президентскиегранты.рф/Home/Official). По итогам фильтрации в выборке осталось около 3 300 организаций.
Помимо этой выборки, был также составлен экспертный список НКО, куда вошло около 40 организаций. Эти организации были выделены как наиболее типичные представители тех, на которые ориентируется проект. Организации экспертного списка также использовались для выявления тенденций в информационном поведении.
Типы НКО
Для удобства анализа материала среди НКО были выделены следующие пять типов информационного поведения на основании масштаба и качества их деятельности. Эти типы учитывают, какого рода информацию собирают и производят НКО на какую аудиторию она рассчитана. В ряде случаев НКО может быть отнесена к более чем одному типу.
НКО внутреннего действия. Эти НКО представляют собой сообщества, участников которых связывают общие и при этом относительно узкие интересы. Характерные примеры таких сообществ — это ролевые сообщества и различные клубы любителей. Они собирают информацию по интересующей участников теме, прежде всего, для внутреннего использования. В качестве конкретного примера можно привести Московский Центр авторской песни (ksp-msk.ru). Участники собирают литературу, касающуюся их предмета, тексты песен, фотографии авторов, ссылки на внешние источники информации.
НКО, занимающиеся согласованием и продвижением интересов участников. Чаще всего это объединения организаций по признаку общности сферы деятельности, например, торгово-промышленные палаты или профессионально-отраслевые ассоциации. Такие НКО, в первую очередь, собирают и производят информацию, касающуюся этих отраслевых или профессиональных интересов. Это могут быть, к примеру, проекты профессиональных стандартов (Российское общество скорой медицинской помощи), отраслевые исследования (Ассоциация «Юристы за гражданское общество»), списки участников и партнеров (торгово-промышленные палаты).
НКО, занимающиеся продвижением общественного интереса и организацией внешнего (направленного не только и не в первую очередь на участников) социального действия. Примерами таких организаций могут быть Вольное историческое общество, комитет «Гражданское содействие», фонд «Общественный вердикт», Социально-экологический союз. В ходе своей деятельности они собирают и создают информацию по своей профильной теме. По сравнению с организациями первых двух типов, НКО, позиционирующие свою деятельность как продвижение общественного интереса, более непосредственно заинтересованы в распространении собираемой и производимой ими информации.
НКО, занимающиеся сбором и распределением ресурсов. Наиболее распространенный пример таких организаций — это благотворительные фонды. В качестве примеров конкретных представителей можно привести такие организации, как «Справедливая помощь», «Подари жизнь», Благотворительный фонд профилактики социального сиротства и т.п. В случае с такими организациями сбор информации (в первую очередь, данных) происходит в ходе их деятельности. Иными словами, НКО, занимающиеся сбором и распределением ресурсов могут быть важным источником информации в той области, на которой они специализируются.
НКО, специализирующиеся на агрегировании информации, аналитике и исследованиях. Прежде всего, это аналитические центры. Также сюда можно отнести некоторые образовательные и просветительские проекты, которые также в ходе своей работы занимаются агрегированием информации. Сбор данных такими организациями обычно происходит в рамках исследований, которые, в свою очередь, тоже могут становиться источниками новых (переработанных) данных.
Информационные приоритеты проекта
У перечисленных видов подходов разные информационные задачи. В связи с этим можно ожидать, что степень востребованности производимых ими данных и документов будет разной. Некоторые данные релевантны лишь для немногочисленных групп, другие представляют более масштабный общественный интерес. Как следствие, некоторые материалы больше располагают к воспроизведению, переработке и повторному использованию, чем другие.
В соответствии с разницей между этими подходами выстраиваются информационные приоритеты единого портала для публикации данных НКО. Наиболее высокий приоритет имеют данные и документы общего значения, пригодные для переработки и повторного использования. Наиболее низкий — у информации узкого профиля и преимущественно внутреннего использования, а также той, которая слабо пригодна к повторному использованию. Таким образом, информационные продукты в ходе исследования были распределены на следующие группы:
Высокий приоритет
- Данные исследований, аналитики. Это, в первую очередь, информационная продукция аналитических центров;
- Статистика, собираемая в ходе деятельности НКО, распределяющих ресурсы.
Средний приоритет
- Информация, касающиеся продвижения интересов различных групп;
- Информация, генерируемая в ходе образовательной/просветительской деятельности. Это могут быть образовательные материалы или подборки документов, имеющие содержательную ценность, но плохо преобразуемые в воспроизводимые форматы. Часто такого рода информацию производят НКО, занимающиеся продвижением общественного интереса.
Низкий приоритет
- Информация, собираемая в рамках организаций внутреннего действия и, соответственно, слабо востребованная за пределами этих организаций.
Иерархия приоритетов — отправная точка при моделировании содержательной структуры портала, предполагаемых к размещению форматов, а также жанров материалов, которые будут на нем размещаться
Типы информации
Информацию принято разделять на два типа: структурированную и неструктурированную, где структурированная информация представлена данными с жестко заданной структурой, а неструктурированная — текстами, видео- и аудиоматериалами, изображениями и т.п.
В случае с информацией, производимой или собираемой НКО, можно говорить не только о структурированной и неструктурированной, но и о структурируемой и неструктурируемой. Последнее в ряде случаев больше соответствует действительности, так как зачастую производимая НКО информация публикуется в неструктурированной форме, даже если по сути она имеет вполне формализуемую и жесткую структуру. В связи с этим, говоря об информации, производимой НКО, стоит использовать использовать термины “структурируемая” и “неструктурируемая”. Это помогает подчеркнуть, что речь идет о ее потенциальных, а не уже имеющихся свойствах.
Информационное поведение НКО и состояние данных
В целом информационное поведение НКО в настоящий момент можно охарактеризовать тремя основными свойствами.
- Во-первых, в большинстве случаев среди материалов, публикуемых НКО, наблюдается преобладание документов над данными. Организации публикуют презентации, методические рекомендации, брошюры, отчеты об исследованиях, но данные публикуются крайне редко, даже если они использовались при создании документов.
- Во-вторых, структурируемая информация публикуется в неструктурированной форме, в результате чего оказывается почти непригодна к использованию. Это могут быть длинные списки или реестры, представленные на вебстраницах или в виде скачиваемых текстовых файлов. Еще один жанр такого рода — это публикация таблиц с данными в виде файлов PDF. Такие документы зачастую слишком длинны и монотонны для человеческого восприятия, но при этом их невозможно или очень трудно обработать машинными методами, что препятствует их использованию.
- В-третьих, некоторые технически продвинутые НКО, создающие относительно сложные продукты на основе своих данных, зачастую ограничиваются публикацией этих продуктов. Это могут быть веб-интерфейсы, позволяющие фильтровать и просматривать базы данных. Это могут быть визуализации или интерактивные проекты, отображающие данные. Но как правило, выгрузить сами данные, на которых работают эти продукты, невозможно, что также затрудняет повторное использование.
Таким образом, наблюдается целый спектр информационной компетентности НКО, от технически продвинутых до технически слабых, однако в подавляющем большинстве случаев отсутствует практика публикации данных в пригодном для повторного использования виде.
Предоставление доступа к данным
Некоторые НКО предоставляют пользователям доступ к данным из своих баз через веб-интерфейс, а также в ряде случаев создают интерактивные визуализации или веб-приложения на основе данных. В качестве примеров таких технически продвинутых НКО можно назвать Аналитический центр «Сова», «Мемориал», Левада-центр, ассоциацию «Юристы за гражданское общество» и другие.
Веб-интерфейсы и визуализации могут быть сколь угодно удачными и информативными, но на момент исследования в большинстве случаев базы полностью «герметичны»: ни одна из названных организаций не предоставляет доступа к «сырым» данным. Между тем, данные, не опосредованные визуализациями и приложениями, могут быть гораздо более полезны для использования как другими НКО, так и индивидуальными пользователями (аналитиками, разработчиками, журналистами, гражданскими активистами.
Данные базы используются преимущественно как средство создания интерфейса, через который посетитель сайта может найти интересующий его документ и, вероятно, скачать его. Но данные такой базы можно было бы использовать значительно более разнообразно, если бы они были доступны для скачивания в «сыром» виде, то есть без каких-либо технических или вычислительных надстроек. Эти данные могли бы послужить одним из источников для дальнейших исследований в этой области.
Заключение
По итогам проделанной работы можно заключить, что НКО производят и собирают много различной информации, допускающей повторное использование. Это могут быть как данные, так и документы. При этом качество публикации документов в подавляющем большинстве случаев значительно выше, чем качество публикации данных.
Судя по тому, насколько массово распространены неоптимальные способы публикации и насколько часто данные не публикуются вообще, большинство НКО пока не освоили эту практику и не вполне осознают ее ценность. Тем не менее, некоторые НКО уже создают технические продукты с использованием своих данных, а некоторые пытаются также и предоставить к своим данным удобный доступ.
На основании наблюдений были сформулированы некоторые рекомендации для НКО как публикаторов своих данных. В частности, им можно порекомендовать часть своих информационных продуктов публиковать в структурированном виде. Также им можно предложить предоставлять пользователям доступ не только к продуктам, созданным на основе данных, но и непосредственно к данным.
Помимо рекомендаций, по итогам анализа была концептуально описана предметная область, и это описание ляжет в основу структуры портала, на котором НКО смогут размещать свои данные и документы.
Ваши комментарии и предложения по исследованию, а также по тому, каким характеристикам должен отвечать портал для публикации открытых данных НКО, вы можете присылать нам на эл. почту nkissel@infoculture.ru