31 дек. 2011 г.

С Новым Годом!

Вот что Google говорит о том, как часто в его базе данных книг встречается это поздравление, а также упоминание Снегурочки и Деда Мороза:


Пусть в новом году ваши данные станут ещё интереснее!

20 дек. 2011 г.

Database от Stanford — всё понятно

Я никогда не понимал, зачем в офисном пакете Microsoft Office приложение Access...

Летом увидел где-то ссылку на онлайн-курс Artificial Intelligence, организуемый Стэнфордским университетом. И я на всякий случай зарегистрировался. И сразу зарегистрировался аналогичный курс по базам данных. В итоге на Artificial Intelligence времени не хватило, а базами данных я так увлёкся, что выполнил почти все упражнения и сдал экзамены. Так же как 340 соотечественников...

Я понял, что это как раз то, чего мне не хватало в Excel. И тут же применил для анализа 344 Мегабайт данных о транзакциях (в Access же). Это круто!

Ещё один побочный эффект: логика Tableau Public сразу стала понятной.

Видеолекции на английском, но он такой простой, что через некоторое время можно не включать субтитры. И всё построено на примерах. Точнее на одном примере, который используется в большинстве тем. Теперь мне стало понятно, почему Стэнфорд — это Стэнфорд.

Ответы на некоторые задания необходимо дать в форме текстовых запросов (чаще всего на языке SQL). И вот тут спрятан СамыйПриятныйМомент. Когда ты вводишь ответ, жмёшь кнопку проверки, и система в ответ на несколько строк твоего текста (о котором несколько дней назад ты вообще ничего не знал) пишет "Correct". Радости твоей нет предела!
И так два месяца )

Спасибо Jennifer Widom!


Кстати, в следующем году открывается ещё несколько интересных бесплатных курсов: pgm-class.org (внизу страницы весь список).

7 дек. 2011 г.

8 000 000 строк данных за 24 минуты

Вот что получается, если самой лучшей и единственной в России команде видео-инфографики дать 8 миллионов строк данных о транзакциях по пластиковым карточкам:

Инфографика: Транзакции по картам Сбербанка в реальном времени


26 нояб. 2011 г.

Шедевр визуализации от Росстата

Картинка из Статистического бюллетеня "Основные показатели сельского хозяйства в России"


Там ещё много таких. Но сразу по ссылке увидеть их не получится. Нужно сначала скачать архив RAR, разархивировать его и открыть файл DOC.

Интересно, это кто-то использует вообще?

11 нояб. 2011 г.

7 000 000 000

Вы наверно знаете, что совсем недавно нас на планете стало что-то около семи миллиардов. Сколько это? Как это случилось? Почему? Что будет дальше?
На эти вопросы своими прекрасными работами отвечают инфограферы The Economist, The Guardian, ООН, NPR.

9 окт. 2011 г.

iLive


В память об этом Великом Человеке. Juan Osborne взял 2500 сообщений, оставленных после смерти Стива Джобса, и и показал самые часто встречающиеся. 

3 окт. 2011 г.

Текстовые слайды

Наткнулся на слайд из презентации компании Амедиум. Слайд о том, что текста на слайдах должно быть мало:

22 авг. 2011 г.

Кручу, верчу, показать хочу

ООН давно публикует очень много разнообразных данных со всех концов света. Например, данные воспроизводства населения в разных странах. Существует много вариантов визуализации этих данных — графики, столбчатые и линейчатый диаграммы, спарк-лайны, etc. И в зависимости от задачи лучше использовать определённые. И необязательно показывать данные как есть. Например, можно произвести несложные действия над этими данными и показать их совсем в другом свете.

Ребята из отдела инфографики The Economist взяли и посчитали для каждой страны количество лет, необходимое, чтобы всё население вымерло при существующих показателях убыли населения. И показали на диаграмме:


Конечно, сравнение весьма условное и не учитывает многие другие факторы. Однако теперь данные "заговорили". Пять веков более понятно, чем 1,2 дочери на каждую женщину.

27 апр. 2011 г.

Тупое преступление Картмана 2000

Пример хорошей презентации из Южного Парка – есть начало, середина, конец. Хорошая структура, хорошая идея. Правильная продолжительность и хорошее визуальное сопровождение. А главное – она что-то меняет.

Это серия целиком. Презентация начинается в 16:45

 

9 мар. 2011 г.

Государства и корпорации

Я знаю, что не совсем корректно сравнивать ВВП государства и выручку компании. Однако, если это сделать, то получится, что почти половина (45) из 100 крупнейших экономик мира - это корпорации:


Кстати, диаграмма полностью сделана в Excel, включая автоматическое выделение жирным корпораций. А перевод названий государств выполнен в Google Docs. 

Рассказать как?

21 февр. 2011 г.

Когда нужны линии сетки на графиках и диаграммах

 Очень часто на графиках и диаграммах используются линии сетки. И в большинстве случаев эти линии являются графическим мусором. То есть тем, что не несёт никакого смысла и отвлекает от данных. Chartjunk, как сказал бы гуру информационного дизайна Эдвард Тафти.

Однако есть 4 случая, когда применение линий сеток на графике оправдано.

Большинство программ и сервисов добавляют сетку на график по умолчанию. Хотя должно быть наоборот. Сетка должна добавляться только в случае необходимости.

Графики, в отличие от таблиц, не предназначены для представления точных значений. Они предназначены для выявления закономерностей, связей и тенденций через визуализацию данных. И сетка редко в этом может помочь.

Итак, когда нужны линии сетки на графиках и диаграммах.

15 февр. 2011 г.

Зачем нужны презентации (слайды)

Алексей Каптерев задался вопросом, зачем вообще нужны презентации:

Старый как мир вопрос: нафига возиться со шрифтами и толщиной линий на этих чертовых слайдах, когда можно вместо этого... (далее большой список). Зачем вообще нужны эти слайды? Я долго думал и смог перечислить всего четыре функции:

  1. Напоминать: о содержании спикеру во время выступления и аудитории — после (раздатка).
  2. Усиливать: придавать больший эмоциональный вес словам за счет иллюстраций. 
  3. Объяснять: схемами можно объяснять сложные процессы, взаимоотношения и т.д.
  4. Доказывать: данные и визуальные сравнения пригодятся там, где требуются доказательства.

Но... может быть еще еще какие-то? Предлагайте свои версии, не стесняйтесь.

Радуюсь )

Моё сравнение русских и японских пословиц попало на dirty.ru, где вызвало бурное обсуждение (дошло до шоколадных попок) и даже фотожабы. Это привело 2000 посетителей на этот сайт за один только четверг!

И я до сих пор не могу вспомнить, как эта идея пришла мне в голову :-)

размер 373x500, 21.42 kb
(картинка - жаба от Genki)

31 янв. 2011 г.

Кстати, о птичках

В нашем постоянно обновляющемся твиттере vMethods много примеров хороших визуализаций и ссылок на интересные статьи.

А в списке Following много хороших twitter-ресурсов по визуализации информации и анализу данных.

Посоветуете, что-нибудь ещё интересное и полезное?

19 янв. 2011 г.

Google Refine - инструмент для очистки и структурирования смешанных данных

Если вы сталкиваетесь с необходимостью очистки и структурирования данных, например с веб-страниц, а возможностей Excel не хватает, то Google Refine — для вас!

Google Refine - мощный инструмент для работы со смешанными данными, их очистки, организации, преобразования, дополнения с использованием веб-сервисов и загрузки в базы данных, вроде Freebase.

Dan Nguyen дал ещё одно определение Google Refine: средство от головной боли, усталости глаз, депрессии и других симптомов многочасовой работы по очистке данных.

5 янв. 2011 г.

Русские и японские пословицы


Облака слов построены в отличном сервисе wordle.net.
Пользоваться им просто: копипастите текст или вставляете URL блога, нажимаете Go и играетесь с параметрами.
 

© 2010 – Константин Варик (разработка презентаций и необычные и удобные яркие гамаки).