Что такое данные и открытые данные
Короткое описание урока: Этот урок дает краткое введение в мир данных. Курс охватывает основные понятия и различные типы данных.
С помощью данных можно описать все вокруг нас. Но что это значит? Данные – это значения, присвоенные предмету. Возьмите, к примеру, банки меда на рисунке ниже.
Что мы можем о них сказать? Если это банки меда на продажу, то первое значение, которое приходит на ум – это цена. Но есть и еще.
Например, мед бывает разного сорта, это тоже даст нам много информации. Есть сезоны, есть место производства, вес, количество и качество. Все это – данные.
Из приведенного выше примера мы уже видим, что существуют разные типы данных. Двумя основными категориями являются качественные и количественные данные.
- Качественные данные – это все, что относится к качеству чего-либо: цвет, текстура и другие признаки, которые можно объединить в категории.
- Количественные данные – это те данные, которые выражены в числах. Например, вес меда, количество банок и т. д.
С данными удобно работать, когда они собраны и структурированы. Давайте сделаем это в таблице ниже.
Задание: определите, качественные или количественные данные в последней колонке.
Цвет | Белый | Качественные |
Сорт | Горный | ? |
Вес в банке 0,5 литров | 750 граммов | Количественные |
Производство | Кыргызстан, Ат-Башы | ? |
Цена | 200 сомов за банку | ? |
Но каждое отдельно взятое значение все еще не приносит нам пользы. Чтобы извлечь информацию из данных, их нужно интерпретировать.
Давайте возьмем вес: то, что пол-литровая банка весит 750 грамм, не говорит нам много. Но это имеет смысл, когда мы сравниваем вес и объем одной банки с другими. К примеру, можно найти информацию о том, что пол-литра меда весит от 700 грамм. Хорошо, теперь мы знаем, что вес меда в рамках нормы. Это уже информация. Но это еще не знание. Знание создается, когда информация изучается, анализируется и приводит к чему-то.
Что такое открытые данные?
“Открытые данные могут быть свободно использованы, модифицированы, и распространены кем угодно в любых целях”.
Это принятое в международном сообществе определение открытых данных максимально сжато формулирует суть открытых данных. Использованы, модифицированы и распространены – это три критерия, по которым данные считаются и могут быть признаны открытыми.
Данные могут быть использованы, если они доступны в интернете. Модифицированы они могут быть, если предоставлены в формате, который позволяет это сделать. И, наконец, распространены кем угодно в любых целях данные могут быть, если за ними не закреплены авторские права.
Таким образом, все три условия на самом деле технические – публикация данных, формат и лицензия определяют их открытость. Идеология прозрачности и движения за открытые данные началась именно с той позиции, что сбор этих данных уже был оплачен гражданами как налогоплательщиками, а, следовательно, доступ к ним – это такое же право каждого человека, как и другие фундаментальные права.