SAAT
El Sistema para el Análisis Automático de Testimonios (SAAT) es una plataforma web, desarrollada por el grupo RISE, que combina técnicas de minería de datos, procesamiento de lenguaje natural y análisis textual, con técnicas de Análisis Exploratorio de Datos Espaciales, para crear un sistema capaz de identificar, y geocodificar en un mapa, los lugares mencionados en textos no estructurados como testimonios o similares (declaraciones, opinión, entrevista, diálogo, entre otros).
La digitalización de testimonios es una labor común en instituciones públicas y privadas; por ejemplo, a lo largo del conflicto armado colombiano instituciones gubernamentales y ONGs han recolectado millones de testimonios sobre hechos victimizantes que contienen información valiosa para el proceso de paz y la reconciliación. En este caso, la pregunta que surge es: ¿Cómo convertir estos millones de testimonios en información que apoye el diseño de mecanismos encaminados a garantizar que las víctimas del conflicto accedan al goce efectivo de derechos, justicia y reparación?
Este problema puede ser complejo: se tienen millones de textos que son transcripciones literales de historias contadas por personas de todo el país. Son testimonios narrados en sus propias palabras. Este tipo de textos se conocen como “no estructurados”. Los textos no estructurados se caracterizan por ser altamente flexibles (una misma idea se puede expresar de muchas maneras) y con variados niveles de expresividad (una misma idea se puede contar con diferentes niveles de detalle). Así, información importante como direcciones, localizaciones y lugares de referencias, quedan “camuflados dentro de los textos” lo cual hace muy difícil su extracción para su posterior análisis.
El procesamiento de este tipo de bases de dato por parte de personas, sería una labor que consumiría tiempo y dinero. SAAT reduce el tiempo requerido para procesar un testimonio de minutos a fracciones de segundo. Así, en poco tiempo sería posible tener mapas con todos los testimonios geocodificados, listos para que el talento humano pueda dar valor agregado a esta información por medio del Análisis Espacial, el cual permitiría: (1) identificar patrones espaciales que señalen, de forma objetiva y rigurosa, las zonas geográficas más referenciadas en lo textos analizados; y (2) cruzar los patrones espaciales resultantes del análisis textual, con información sobre aspectos demográficos, socioeconómicos y geográficos, que permitan medir relaciones de causalidad y correlación.