在一处2.5亿国际赛事




研究员Kavel lythari从Dzhordtaunskogo大学,聚集 250万个事件的目录自1979年以来发生在世界上,它每日更新,提供给有兴趣的人谁愿意去探索。

每个条目都有一组58属性。和集合被划分成300个不同的类别。目前目录有100 GB的体积和主机托管服务提供商是Goolge的。

为了进行分析,用户可以下载整组,或者他感兴趣的类别或使用谷歌BigQuery中直接在网站上。

数据库是来自世界各地的novsti许多来源自动更新。所有正在使用不同的算法和创建lythari然后文本maning'a地理编码输入到数据库处理。此外,笔者注意到,在自然语言处理的最新进展方面,很快就会增加非英语人士的比例。

威盛<一href="http://gigaom.com/2014/05/29/more-than-250-million-global-events-are-now-in-the-cloud-for-anyone-to-analyze/">GIGAOM

资料来源: habrahabr.ru/post/224647/

标签

另请参见

新&值得注意