3 июл. 2012 г.

DBpedia+Tableau или Как показать на карте все авиакатастрофы

В последнее время я часто использую Tableau Public, чтобы покопаться в данных и показать какие-нибудь идеи. Возможности этого инструмента огромны (но тем не менее ограничены ;-).

С некоторых пор я заметил, что мне нужны данные, которые в принципе существуют, но в неструктурированном или полуструктурированном виде. И очень часть в Википедии.

Я спросил в группе LinkedIn Information Access and Search Professionals, как подступиться к Википедии. И Dupont Gérard из Франции посоветовал чудесный инструмент: DBpedia.org.

DBpedia представляет данные Википедии в структурированном виде и позволяет запрашивать их различными методами. Я использовал язык запросов SPARQL. Для не очень сложных запросов достаточно изучения примеров и какого-нибудь хорошего коротенького руководства.

Составляем SPARQL-запрос, немного редактируем полученную таблицу в Excel и визуализируем в Tableau Public.

Вот, например, интерактивная (чуть-чуть) карта всех* авиакатастроф, для которых в Википедии указаны координаты, с количеством жертв и типом самолёта. От вопроса до картинки — меньше часа**!
 

© 2010 – Константин Варик (разработка презентаций и необычные и удобные яркие гамаки).