Estructurada base de datos de "archivo Panamá" presentado en el acceso abierto

La mayor filtración de documentos en la historia de Internet: 2, 6 terabytes


El Consorcio Internacional de Periodistas de Investigación (ICIJ) presenta en el acceso libre "Archivo de Panamá": la mayor base de datos de empresas off-shore desde ordenadores firma panameña Mossack Fonseca personas desconocidas.
Anónimo (John Doe) dio a los reporteros del periódico alemán Süeddeustche Zeitung 2, 6 terabytes de archivos de hojas de cálculo -, letras, texto, PDF, TIFF y otros formatos, incluyendo la antigua y tiene sin usar. La comprensión de la magnitud de la obra, se les pidió que ICJI organizar un proyecto conjunto internacional.
Millones de gráficos condujeron a través de los servidores de tiempo de programa de OCR Tesseract 40 en la nube de Amazon. Para la indexación de texto usando Apache Solr, para procesar documentos en diferentes formatos -. Apache Tika
Durante el año, el archivo estudió 370 periodistas de 80 países. Para facilitar sus periodistas de trabajo, los desarrolladores del ICIJ enganchados programa de la biblioteca GUI del Proyecto Blacklight. Para mostrar la información en las relaciones gráficas forma y mostrar entre objetos, era necesario el uso de un programa propietario Linkurious, sino por el contenido de Talend herramienta de base de datos SQL relacional Mossack Fonseca transferido a formato Neo4j.


Ahora se invita al resultado de la productividad de los desarrolladores para evaluar todos los interesados ​​a través de Internet.
ICIJ base de datos en una forma estructurada está disponible en:
https://www.occrp.org/en/panamapapers/database.html
Se puede descargar una copia en el ordenador (35, 7 MB de archivo).
  • data-csv.zip
  • archivo torrent
     

    La base de datos contiene información sobre casi 214.000 empresas offshore en 21 jurisdicciones offshore.
    Mapa Interactivo de empresas clientes en alta mar


    En la base de 11.516 empresas que pertenecen a los 6285 ciudadanos rusos. Entre ellos - los amigos y familiares de altos funcionarios. Dicha fuga a gran escala de documentos puede conducir a una serie de renuncias de alto perfil y los casos penales, aunque las compañías offshore menudo operan en una zona gris legal, sin violar la ley.
    Publicado sólo una parte de la información a partir de los 11, 5 millones de archivos que se obtuvieron de las computadoras de la firma de abogados Mossack Fonseca, uno de los mayores generadores del mundo de las empresas de un día.
    empresas del Consorcio Internacional de Periodistas de Investigación no publican toda la información disponible, no hay documentos originales o una gran base de datos con información personal, cuentas bancarias, no se muestran los contenidos de los correos electrónicos y las transacciones financieras de las empresas. Esto se hace a fin de no a la luz los datos personales de muchas personas que no están involucradas en delitos financieros.
    sólo los nombres dados a conocer, su jurisdicción, dirección postal y de los nombres de los líderes de las empresas offshore. Los datos cubren el período de 1977 a 2015.
    Base de datos "archivo Panamá" se publica bajo una licencia libre Creative Commons Atribución-Compartir Igual. El Consorcio Internacional de Periodistas de Investigación invita a toda la comunidad para centrar los esfuerzos en el estudio y clasificación de la información publicada.
    UPD. El primer hallazgo Geektimes comunidad


    UPD2. El segundo descubrimiento Geektimes comunidad

    Fuente: geektimes.ru/post/275558/

Tags

Vea también

Nueva y Notable