Gran parte de la infraestructura necesaria para llevar a cabo buenas investigaciones —desde conjuntos globales de datos hasta herramientas de fuentes abiertas de última generación— ya ha sido creada, y se invitó a periodistas de todo el mundo a profundizar en ellas en la 12ª Conferencia Global de Periodismo de Investigación (#GIJC21).
En una sesión del evento, un panel de reporteros y editores empleó cinco minutos para dar ideas a los periodistas acerca de cómo reunir datos difíciles de encontrar.
Estas son algunas de sus sugerencias:
Considera la posibilidad de utilizar herramientas de reconocimiento facial, como Findclone, para rastrear e identificar, por ejemplo, a posibles extremistas en posiciones de poder, como neonazis dentro de las fuerzas del orden. Sébastien Bourdon, periodista independiente que investiga la extrema derecha, dijo que Findclone puede mostrar cinco coincidencias previas —con una puntuación de probabilidad entre cero y uno— de rostros en plataformas de redes sociales como la rusa VK (VKontakte) y, lo que es más importante, puede incluso encontrar imágenes en cuentas eliminadas. La organización de investigación Bellingcat ha señalado que sistemas como Findclone tienen «usos muy limitados, aunque potentes, para buscar la presencia de una persona en VK», pero advirtió a los periodistas que deben tener en cuenta los importantes problemas éticos asociados al software de reconocimiento facial, y recordar que estos sistemas se han utilizado de forma abusiva con fines ilegales.
Prueba el crowdsourcing de datos y evidencias con recursos como CrowdNewsroom. Marc Engelhardt, director de CrowdNewsroom Suiza, dijo que la herramienta permite a los periodistas lanzar campañas de crowdsourcing, construir fácilmente una historia de datos, y luego analizar y verificar la información entrante. «Los ciudadanos pueden compartir sus datos o historias personales a través de la plataforma de forma segura», dijo.
Engelhardt dijo que la plataforma independiente Correctiv ya ha utilizado CrowdNewsroom para varias investigaciones, incluido el seguimiento del dinero que hay detrás de una campaña de cartelería para un partido político europeo de extrema derecha. El proyecto obtuvo entradas de datos de 3.500 personas.
Utiliza la potencia de los datos y la flexibilidad de la herramienta Aleph del Organized Crime & Corruption Reporting Project (OCCRP). Su editor de datos, Jan Strozyk, recomendó Aleph como un archivo global interactivo para la investigación.
Al igual que en un iceberg, la mayor parte de las investigaciones basadas en datos —extracción, limpieza, análisis y conversión de la información— tiene lugar «por debajo de la línea de flotación», que el público no suele ver. Strozyk afirma que varias funciones del archivo pueden ayudar a los periodistas en este trabajo de datos menos glamoroso.
Aleph incluye ahora 309 conjuntos de datos públicos, 200 raspadores de datos y datos de más de 150 millones de entidades. Pero Strozyk dijo que la plataforma también permite compartir de forma segura investigaciones con colaboradores, cargar casi cualquier tipo de archivo, buscar en varias secuencias de comandos y convertir los datos en gráficos cliqueables que muestran conexiones.
Para cartografiar las solicitudes de explotación minera y el cumplimiento de la normativa en el sur de África —y para orientar a periodistas de otros lugares sobre el funcionamiento de la industria del carbón—, consulta la herramienta #MineAlerts, desarrollada por la organización sin ánimo de lucro Oxpeckers. Andiswa Matikinca, reportera y directora de datos de Oxpeckers, dijo que la plataforma combina una base de datos digital con una herramienta de geoperiodismo, y que también incluye documentos relacionados con las solicitudes de licencia y las minas en funcionamiento, así como información sobre el uso del agua alrededor de las minas.
Del mismo modo, la base de datos Offshore Leaks permite buscar investigaciones relacionadas con empresas que operan a nivel transfronterizo. Delphine Reuter, periodista de datos del Consorcio Internacional de Periodistas de Investigación (ICIJ), dijo que esta base gratuita y de código abierto ya contiene datos de 800.000 entidades y que esta cifra pronto aumentará con la incorporación de los datos de los Pandora Papers. Reuter también ofreció varios consejos para utilizar la herramienta:
Ten en cuenta que existen nuevas bases de países específicos, como Ucrania y Kazajistán. Dmitry Chaplinsky, especialista en tecnologías de la información del portal ucraniano Bihus.info, afirma que los periodistas que busquen registros públicos, documentos de divulgación de activos, datos de contratación pública y otros registros públicos de Ucrania y Kazajistán deben consultar dos nuevas bases de datos de fuentes abiertas que se actualizan periódicamente. Ring es un motor de búsqueda de documentos de más de 20 bases de datos de Ucrania con 29 millones de registros públicos. Dentro de la base se pueden hacer búsquedas en ucraniano, inglés y ruso. Open Base es un repositorio de datos similar para Kazajistán, con una docena de fuentes.
“Mi herramienta favorita es R y R Studio.” — Mohammad Haddad, editor en Al Jazeera
Aparte de las nuevas herramientas, puede ser igualmente valioso conocer otras más tradicionales en las que confían numerosos medios de comunicación. Mohammed Haddad, editor de datos de Al Jazeera Media Network, reveló los cinco principales recursos que utiliza a diario.
Una característica común y llamativa de las herramientas presentadas por el panel fue que hacen manejables volúmenes de información en apariencia abrumadores, y muestran que los datos contenidos en diversos idiomas, contextos, tipos de archivo e imágenes son potencialmente buscables para cualquier periodista con acceso a Internet.
Este artículo fue publicado originalmente en el sitio de la Red Global de Periodismo de Investigación y es reproducido en IJNet con permiso.
Foto de UX Indonesia en Unsplash.