NICAR 2014

 

“We need to fear the consequences of our work more than we love the cleverness of our ideas” (Mike Monteiro)

Acabo de volver de NICAR, una conferencia que se realiza todos los años y junta a periodistas de varios medios grandes alrededor del mundo. El objetivo es discutir y presentar tecnología que ayude a los periodistas a manejar datos para sus investigaciones y artículos. Este año junto a la mayor cantidad de gente hasta el momento, más de 1000 personas del mundo del periodismo.  Estuve participando por la fellowship de Mozilla OpenNews y ha sido una gran inmersión en sensación térmica en que esta el desarrollo de tecnología en medios masivos.

Presentaciones/Paneles

The next generation of data viz. Alberto Cairo presento puntos importantes al momento de hacer una visualización de datos. Estuvo interesante la muestra de visualizaciones que tienen puntos que fallan al momento de mostrar los datos. Enfatizo que las visualizaciones no son para mirar sino para leer. También contó sobre uno de los ejemplos más viejos de periodismo de datos, John Snow fue un medico ingles del siglo 19 que mapeo los casos de cólera y las fuentes de agua. De esta formo pudo asociar la transmisión de cólera a partir de agua contaminada. Un punto importante es que no intento probar una hipotesis sino tirar abajo sus supuestos.

ProPublica y NPR llamaron a un debate en el bar, al que no pude entrar por estar muy lleno de gente, en donde discutieron la creación de aplicaciones web dinámicas versus estáticas al momento de hacer las aplicaciones de periodismo de datos. Luego Noah Veltman escribió un articulo orientado a periodistas explicando con ejemplos de maquina expendedora versus restaurante lo que significa tener una aplicación dinámica versus estática. Lo que más tomo de esto es que como en toda selección de tecnología depende de que problema estés intentando resolver y quienes van a ser tus usuarios.

Brevemente estuve en la charla de Jonathan Stray sobre modelos de amenaza para periodistas. Creo que es importantísimo hacer pensar a periodistas en seguridad, privacidad y que estrategias se tiene a mano para cada caso. Pueden mirar y ver el video de la charla en Scribd.

Newseum y archivar aplicaciones web

OpenNews junto a Newseum y Pop Up Archives organizaron un espacio para discutir como archivar aplicaciones de periodismo de datos. Lo importante de esto es como hacer para que no se pierdan una vez que pasa la euforia y necesidad de usarlas. En el colectivo de Indymedia Uruguay hicimos un buen trabajo en decidir que servicio cerrábamos cuando decidimos no seguir con el grupo. Indymedia Uruguay cerró la publicación de noticias pero dejo en linea un archivo con las noticias y el buscador.  Lo importante de la reuníón en Newseum es pensar en un conjunto de buenas practicas al archivar aplicaciones web así como herramientas para esto.

Herramientas

No todas estas herramientas son nuevas sino que son algunos de los proyectos que se están utilizando y se nombraron durante NICAR.

Proyecto Panda: Salido de la Knight News Challenge y hecho con Django, Panda es un CMS para datos tabulares. Con este los newsrooms pueden tener un repositorio de archivos con datos tabulares y pueden hacer búsquedas así como suscribirse a búsquedas.

Tarbell: Hecho y utilizado por Chicago Tribune es un generador de sitios web estáticos.

Overview: Para categorizar documentos por palabras de búsqueda.

DocumentCloud: Varios medios vienen utilizando este servicio. Se pueden subir documentos y hacer búsquedas en los mismos.

Drake: No lo escuche durante la conferencia pero Manuel lo menciono en twitter y me parece super interesante nombrarlo pues es un Make para datos. Puedes escribir un script y aplicarlos a los datasets que tengas.

Fabric: Viejo y querido pero NPR lo usa para todos los proyectos que lanzan. En python ayuda al deployment.

Excel Mucho Excel: el mundo de periodismo de datos se mueve a base de excel. Hubieron muchos talleres sobre trucos y más trucos, estadisticas y calculos que hacer con excel.

Un post con enlaces a slideshares y herramientas aquí.

Café de DATA & Día de Datos Abiertos 2014

Ciudades más grandes que Montevideo parecen tener una comunidad vibrante alrededor de datos abiertos y transparencia. La gente se encuentra a discutir formas de ayudar el proceso de transparencia en gobiernos, como buscar datos o como crear nuevos proyectos. Uruguay ha tenido una buena ley de acceso a información pública y un grupo de datos abiertos en la intendencia de Montevideo que ha empujado por la publicación de datos publicos. Desde DATA queremos crear un espacio para discutir, ver proyectos que inspiren y crear juntos herramientas y analisis de datos. Empezamos en FEbrero a organizar una reunión mensual. El registro y noticias estan en el sitio web de meetup.

Algunos de los temas que hablamos en la reunión de Febrero son:

Catálogo de Datos

Portales de pedidos de información pública
Aplicaciones Periodisticas
Mapa de lugares de reciclaje http://www.dondereciclo.org

Cafés de DATA & Open Data Day

Bigger cities than Montevideo seems to have a vibrant community around open data and transparency. People meet to discuss how to help the process of transparency in governments, how to look for data or to hack on new projects. Uruguay had a early quite good freedom of information law (that just changed last year to make it more restricted) and a good open data group in Montevideo’s local government that push to publish interesting public data sets.  From DATA we want o create spaces to discuss, look at projects around the world and hack together on local tools and data analysis.  We started on February to organize a monthly meetup.  The registration and news is at the meetup’s website.

Some of the stuff we talked about in February are:

Data Catalogs 

Freedom of Information Requests
News Apps

from shapefile format to geojson

ogr2ogr is a very useful tool to convert data features between file formats. To convert input.shp to output.geojson:

ogr2ogr -f geoJSON output.json input.shp

There are many operations that you can do in the middle like quering for only rows with specific attributes.