Investigador de la Universidad de Kavel lythari Dzhordtaunskogo, reunió
catálogo de 250 millones de eventos se han producido en el mundo desde 1979, que se actualiza diariamente y está disponible para cualquier persona interesada que quiera explorar .
Cada entrada tiene un conjunto de 58 atributos. Y la colección se divide en 300 categorías diferentes. En la actualidad, el catálogo tiene un volumen de 100 GB y un proveedor de alojamiento es Goolge.
Para llevar a cabo el análisis, el usuario puede descargar todo el conjunto, o está interesado en una categoría o utilice la
Google BigQuery directamente en el sitio.
Base de datos se actualiza automáticamente desde muchas fuentes en todo el mundo novsti. Todo se procesan utilizando diferentes algoritmos y maning'a texto geocodificación creado lythari y luego introducidos en la base de datos. Además, el autor señala que, en relación con los recientes avances en el procesamiento del lenguaje natural, pronto aumentará la proporción de las fuentes que no hablan inglés.
VIA
GIGAOM
Fuente:
habrahabr.ru/post/224647/