Seis herramientas básicas para trabajar con datos

Publicado por Tory Lysik
Compartir

El mundo del periodismo de datos puede resultar desalentador para muchos. Sin embargo, cualquiera puede ofrecer y producir una pieza de periodismo de datos si es capaz de comprender los conceptos justos.

Para los que se inician en el periodismo de datos, e incluso para los periodistas experimentados que quieren empezar a informar con datos, estas seis herramientas pueden ayudar a ejecutar mejor las historias y mejorar la oferta a los editores:

La codificación es un mal necesario

Tener un lenguaje de código en el bolsillo es crucial. Incluso los conocimientos más básicos de codificación (que no es lo mismo que programación) pueden repercutir en tu trabajo al permitirte alejarte de las simples hojas de cálculo, que aunque se utilizan habitualmente en el periodismo de datos, no son las preferidas para el análisis en profundidad porque no pueden manejar tanta información.

La codificación te permitirá manipular datos con mayor facilidad. Es raro que un conjunto de datos esté completamente limpio o sea exactamente lo que se necesitas. Ser capaz de limpiar y peinar rápidamente incluso los archivos más pequeños puede resolver algunos de los mayores dolores de cabeza.

Aprender a codificar también puede abrirte las puertas a cosas como el raspado web y el aprendizaje automático, dos habilidades que pueden mejorar tu trabajo. Aunque estas técnicas no son sencillas, pueden aprenderse.

No todos los lenguajes de codificación son iguales. Python es el lenguaje más fácil y flexible. También es gratuito, y puede aprenderse mucho más rápido que R o C++. Otra ventaja de Python es que es más fácil encontrar respuestas en línea a los códigos de error cuando surgen, y ofrece más ayuda gratuita a través de foros online.

Es importante saber cómo visualizar tus historias, incluso si no piensas implementar la técnica

Los editores necesitan ver el aspecto de los datos, por lo que, aunque no tengas previsto incluir visualizaciones en tu trabajo, ser capaz de representar visualmente la información que tienes reforzará tu propuesta. Además, demostrará al editor que entiendes la historia y los datos que la sustentan.

La herramienta de visualización más utilizada es Datawrapper, una plataforma gratuita que permite transferir datos fácilmente. Es fácil de aprender y puede utilizarse para crear desde gráficos sencillos hasta mapas más complejos. Datawrapper utiliza HTML básico, pero ofrece guías sobre cómo escribir código HTML en su interfaz.

Poner los gráficos de tu datawrapper en un software de Adobe puede mejorar los gráficos, pero será más complicado. Adobe tiene pruebas gratuitas, que puedes usar para ver si vale la pena comprar una suscripción. Como Adobe es más difícil de aprender que Datawrapper, es mejor utilizarlo como complemento a menos que se ejecute para un proyecto, más que para una propuesta o pitch.

Los colores importan en las visualizaciones, incluso en los borradores

Esa clase de arte que tomaste en la secundaria es extremadamente beneficiosa al diseñar visualizaciones de datos.

Los colores son una herramienta crucial en la visualización de datos debido a cómo funciona nuestro cerebro. Entendemos los colores como otra pieza de información que puede retratar eficazmente la información o distorsionarla por completo. Todo, hasta la opacidad, puede afectar a la comprensión de los datos que se están visualizando.

Los colores como el gris, el blanco o el negro deben utilizarse siempre con moderación o cuando se trata de señalar al lector un punto de datos específico. Dominar el uso de los colores es fácil y muy importante.

Hay múltiples códigos que pueden producir color, como Hex, RGB y HTML. Estos códigos se emplean para indicar a la computadora exactamente cuál de los millones de colores y matices debe elegir, siendo el más utilizado el HTML. Memorizar los códigos de seis dígitos para cada color no es necesario, pero saber que existen sí lo es, sobre todo si se trata de replicar un color exacto o de hacer coincidir los colores en diferentes visualizaciones de datos.

Para obtener un código de color hay varias herramientas digitales. HTML Color Codes.com es un generador de códigos de color muy útil y gratuito, pero hay muchos disponibles. Sentirte cómodo con unos cuantos esquemas y tener unos cuantos preajustes que te gusten será útil a futuro.

La forma de enfocar una historia lo es todo

Cuando intentes proponer una historia con datos, piensa en el producto final antes que en los datos. A diferencia de una cobertura típica, en la que se puede construir el artículo desde la base, la pieza de datos se basa más en tu capacidad para trabajar con los datos disponibles que en la cantidad de información que tiene un conjunto.

Si bien hay miles de bases de datos a tu disposición, importa saber cómo piensas utilizar un conjunto de datos antes de poner manos a la obra. Esto te ayudará a evaluar tus capacidades al toparte con un conjunto de datos brillante con el que quieres hacer cosas increíbles, pero que podría ser demasiado problemático o difícil de trabajar.

Para ello, establece hipótesis de trabajo. Crea un guion gráfico en el que se describa cómo quieres probarla y qué datos hay disponibles. A continuación, busca los datos y comienza las entrevistas.

Usar una herramienta como Trello te ayudará con esto. Es gratuita para uso personal, pero de pago para equipos.

Solicitar datos a una entidad u organización gubernamental puede ser una buena manera de conseguir una historia, pero viene con todos los problemas añadidos de cualquier solicitud de documentos. Esto es especialmente cierto con los conjuntos de datos desordenados.

Es importante tener en cuenta que, aunque se pidan datos muy específicos en un formato concreto, es posible que los datos no sean del todo utilizables. Dedicar tiempo a solicitar datos y luego esperar a recibirlos puede ser costoso, especialmente cuando se trabaja por cuenta propia.

En lugar de pedir datos, encontrar datos abiertos en línea puede valer más la pena. En el caso de Estados Unidos, la mayoría de los estados tienen un sitio web de datos abiertos que tiene casi todo lo que necesita sin tener que pasar por una solicitud de la FOIA.

Tener una reserva de datos es importante, incluso si no tienes previsto continuar con el periodismo de datos

Para los periodistas que no son gurús de los datos, tener conjuntos de datos a mano y listos para usar es fundamental. Todos los periodistas de datos los guardan, y tener tu propia biblioteca personal es necesario.

Crear una cuenta gratuita en Github para utilizarla como biblioteca es una opción. También puedes construir tu portafolio, o colocarlos en un sitio web independiente para que futuros posibles empleadores vean lo que has hecho.


Imagen de Markus Spiske en Unsplash.

 

ijnet.org

Compartir