Vozyvoto

Vozyvoto es un estudio de la participación (tanto en términos de hablar como de ser mencionado) de subgrupos en asambleas gubernamentales. Es extracción de información dentro del proyecto IE4OpenData.

Demo actual

La demo actual fue concebida durante la 3ra Hack(at)ONG en Cordoba, Argentina en septiembre del 2016. Analiza la participación de las diputadas en las sesiones del congreso, un tema de interés para FUNDEPS una fundación que (entre muchos otros temas) estudia el impacto de las leyes de cuotas por género en los comicios argentinos.

Implica (vea Hackatong2016.md para más detalles):

  • Bajado de sesiones taquigraficas.
  • Bajado de asistencias.
  • Asignación de género en los listados de asistencia.
  • Identificación de personas en las transcripciones.
  • Conteo de personas mencionadas por género.

El sistema creado durante la hackathon utiliza una combinación de shell scripts, pandoc, iconv, perl y OpenNLP. El identificador de género se basa en las listas de nombres masculinos no ambiguos en español and nombre femeninos no ambiguous en español de la Wikipedia en español (y se encuentra disponible como un proyecto aparte). La atribución de entidades (desambiguación de menciones de personas) es el componente más rudimentario y usa un sistema de heurística por puntos para atribuir una frase identificada como una persona por OpenNLP a uno de los diputados o diputadas presentes.

El total de texto procesado fue:

  • Datos totales (incluyendo tags): 161Mb
  • Datos textuales: 107Mb
  • Palabras: 2M
  • Sesiones: 425 usables, 475 totales
  • Años: 2001-2016
  • Total de personas a atribuir: 887

Estos datos están disponibles para descarga: http://duboue.net/download/vozyvoto2016ds.zip

Equipo

Demo de palabras claves

Esta demo fue armada después de la hackathon. Es una live demo usando gráficos de plot.ly. Cuidado: es un página de gran tamaño. Ingresar a la demo.