El big data, al alcance de las ciencias sociales

Capturar, analizar y visibilizar un gran volumen de datos es un apoyo más en la investigación en el campo de las ciencias sociales. La importancia de manejar el big data en disciplinas tales como el periodismo o la sociología, es una cuestión que trasciende tanto al ámbito académico como al profesional. La ingente cantidad de datos que a diario se publican en webs, blogs y redes sociales -entre otros espacios- constituyen un recurso importante para la elaboración de proyectos de investigación, así como para la interpretación de diversos procesos sociales. Y hoy, quienes no tienen formación en programación informática disponen de recursos que permiten un mejor aprovechamiento de los datos.

En este contexto, el colectivo Outliers y el Programa de Comunicación y Sociedad Civil del IN3/UOC han trabajado de forma conjunta para organizar el "Taller sobre minería y visualización de datos para no programadores". El curso se impartió de forma intensiva durante cinco días y en el mismo participó un grupo de 22 personas que adquirieron conocimientos sobre herramientas enfocadas tanto a la adquisición, al análisis como a la visualización de datos. Durante el taller se realizó un repaso a las principales herramientas de adquisición como el Google scraper. Una vez capturados los datos, se trabajó con OpenRefine para poder "limpiarlos", darles el orden deseado, transformándolos de un formato a otro. En el curso también se realizó una jornada intensiva centrada en la comprensión de grafos y redes a partir del uso del software Gephi. Y la última jornada estuvo dedicada al trabajo de los datos sobre mapas y su visualización.

A lo largo del taller predominó la práctica con los datos, es decir, a partir de unas pautas básicas de teorías, las personas asistentes pudieron poner en práctica cada una de las herramientas con tiempo suficiente para asimilar y comprender el proceso de la minería y la visualización. Esta experiencia formativa permitió asimismo poner en común la inquietud por el manejo de los datos a gran escala.