19 янв. 2011 г.

Google Refine - инструмент для очистки и структурирования смешанных данных

Если вы сталкиваетесь с необходимостью очистки и структурирования данных, например с веб-страниц, а возможностей Excel не хватает, то Google Refine — для вас!

Google Refine - мощный инструмент для работы со смешанными данными, их очистки, организации, преобразования, дополнения с использованием веб-сервисов и загрузки в базы данных, вроде Freebase.

Dan Nguyen дал ещё одно определение Google Refine: средство от головной боли, усталости глаз, депрессии и других симптомов многочасовой работы по очистке данных.


Google Refine:

  • могут использовать люди без навыков программирования и работы с базами данных;
  • бесплатен;
  • запускается на любом компьютере, работает в браузере и использует интерфейс, похожий на Google Docs;
  • несмотря на то, что инструмент придуман Google, он работает автономно и не требует отправки данных в интернет;
  • куча полезных функций, включая историю изменений и их отмены, визуализацию характеристик данных; фильтры, кластеризацию, самые разные преобразования и использование простого языка выражений Google Refine Expression Language (GREL). 
Позже я планирую рассказать об основах работы с Google Refine и показать примеры его использования.

А те, кто хоть чуть-чуть владеет английским языком, могут посмотреть первый из серии скринкаст об основах работы с Google Refine (7 минут):

0 коммент.:

Отправить комментарий

 

© 2010 – Константин Варик (разработка презентаций и необычные и удобные яркие гамаки).