Hacete socio para acceder a este contenido

Para continuar, hacete socio de Caras y Caretas. Si ya formas parte de la comunidad, inicia sesión.

ASOCIARME
Sociedad inteligencia artificial | Cruzar | Udelar

Una búsqueda que se reedita cada año

Cruzar: inteligencia artificial al servicio de la memoria y la verdad

Desde Udelar y el Gobierno analizaron la incorporación de la inteligencia artificial en el proyecto Cruzar, y su aporte en la búsqueda de verdad y justicia.

Suscribite

Caras y Caretas Diario

En tu email todos los días

Un equipo interdisciplinario de investigadores, docentes y estudiantes de la Universidad de la República (Udelar), con el apoyo del colectivo Madres y Familiares de Uruguayos Detenidos Desaparecidos, continúa avanzando con el proyecto Cruzar, una iniciativa que desde el año 2018 busca aportar herramientas al estudio de la memoria reciente. Actualmente, el proyecto dio un salto cualitativo con la incorporación de técnicas de inteligencia artificial para el análisis de los documentos vinculados a la dictadura cívico-militar.

Esta nueva etapa, en colaboración con el Centro Interdisciplinario en Ciencia de Datos y Aprendizaje Automático (Cicada), abre un horizonte inédito para la investigación histórica y el acceso a la información, con la potencia de una tecnología que puede iluminar zonas aún ocultas del pasado, ya que “existen millones de páginas de documentos de la dictadura uruguaya que aún no se han analizado en su totalidad”, según señalaron desde Cicada.

En diálogo con Caras y Caretas, la docente e investigadora del Instituto de Computación de la Facultad de Ingeniería, Lorena Etcheverry, rememoró el inicio de la propuesta y sus principales desafíos. Recordó que el proyecto comenzó a gestarse en 2018 a partir de la inquietud del periodista y docente de la Facultad de Información y Comunicación (FIC), Samuel Blixen, quien buscaba herramientas que permitieran analizar en profundidad el Archivo Berrutti, que contiene unos 3 millones de documentos desordenados, en algunos casos inconexos, ya que proceden de diferentes unidades del Ejército. “Al inicio se armó un equipo interdisciplinario con personas del Instituto de Computación, del Instituto de Ingeniería Eléctrica, y más recientemente incorporamos también gente de la Facultad de Ciencias Sociales, de la FIC, de Archivología y de Periodismo”, señaló.

La motivación inicial, según la investigadora, estuvo vinculada al acceso a las imágenes digitales del Archivo Berrutti, conservadas gracias a un acuerdo con la Secretaría de Derechos Humanos para el Pasado Reciente. “El objetivo final es cruzar información entre distintas fuentes documentales, por eso el nombre Cruzar, buscando responder preguntas específicas. Se busca reconstruir líneas de tiempo de personas: en qué momento del tiempo estuvieron en qué lugares, información tanto las personas que podían pensarse como víctimas de la represión, como también del personal militar”, explicó.

La incorporación de inteligencia artificial al proyecto marcó un cambio sustancial en las posibilidades de análisis debido a la capacidad de estas herramientas para procesar información visual y textual con mayor precisión. “Este proyecto tiene que ver con la extracción de información a partir de imágenes. Los nuevos métodos con inteligencia artificial generativa están mostrando un buen desempeño para resolver problemas que veníamos tratando de atacar con métodos tradicionales”.

Consultada sobre cómo interviene la inteligencia artificial al enfrentarse a millones de páginas de documentos, explicó que la herramienta puede utilizarse en distintos niveles del análisis. “En este proyecto, que recientemente cuenta con financiación por parte de la ANII y el IDRC (International Development Research Centre) buscamos lograr, a partir de un texto —que tiene nombres, por ejemplo, de personas detenidas en tal fecha, en tal lugar, acompañados de tal persona, etcétera— establecer rápidamente relaciones entre estas persona y lugares, así como organizar automáticamente datos claves. El paso siguiente, que todavía estamos avanzando en eso, es almacenar esa información en lo que se conoce como un grafo de conocimiento, una gran red que va a permitir, por ejemplo, descubrir conexiones entre hechos que hoy es difícil de ver en los documentos”, señaló.

Más allá del análisis de nombres y lugares, surge la interrogante de si el uso de la IA también abre la posibilidad de descubrir patrones de conducta más amplios sobre, por ejemplo, la utilización de la prisión o el trato hacia ciertos sectores de la población. Aquí Etcheverry aseguró que se trata de una consulta interesante y que, aunque actualmente no cuentan con ninguna herramienta específica enfocada en eso, “se podría intentar desarrollar”.

“Esta forma de construir el análisis de archivos históricos no es algo descabellado, es decir, hay otros equipos en el mundo que están llevando adelante el mismo enfoque. Nosotros estamos trabajando en cooperación con equipos de otros países, en particular con investigadores de la Pontifica Universidad Católica de Chile (PUC), de la Universidad de Buenos Aires (UBA), así como con investigadores mexicanos”.

Desafíos

La investigadora destacó que uno de los principales desafíos es la heterogeneidad del Archivo Berrutti. “Es un archivo que contiene información de todo tipo. Entonces, para poder determinar qué parte de ese archivo es relevante para cada una de las tareas, hace falta información de gente que conozca el contenido de archivo, con conocimiento de historia, que pueda decidir enfocar la atención en el tal rollo que contiene tal tipo de información”, explicó.

Por otro lado, la entrevistada subrayó que transformar las imágenes con texto en información interpretable sigue siendo un reto que implica requerimientos técnicos. “Es una etapa que parecía sencilla, pero que no lo es. Ahí nos enfrentamos con un montón de problemas por la calidad de las imágenes, porque hay cosas que están escaneadas y borroneadas, porque el papel es muy viejo, etcétera”, señaló.

Este tipo de exploración, debido a la cantidad de documentos e información, precisan dispositivos de hardware con los que no siempre se cuenta. “Las tareas de entrenamiento de grandes modelos de lenguaje requieren del uso, por ejemplo, de unas tarjetas que se llaman GPUs (Graphics Processing Unit), que tienen un alto costo. En ClusterUY, el centro de computación del que Udelar es parte, hay algunas disponibles, pero hay otros actores involucrados, por lo que no siempre se pueden utilizar. Poder contar con recursos de hardware para hacer estas tareas es algo que está siendo un limitante a nivel local, porque justamente la soberanía pasa por tener recursos”.

El avance del proyecto también plantea interrogantes sobre la privacidad de los datos. Sobre este punto, Etcheverry expresó: “El acceso a la información y la privacidad de las personas es un tema en tensión desde el inicio de este proyecto. Por un lado, el marco normativo establece que los datos vinculados a delitos de lesa humanidad deberían ser públicos; pero, por otro, en nuestro país rige la Ley de Protección de Datos Personales, por lo que entran en tensión”.

Otras herramientas

La investigadora detalló que, hasta el momento, el grafo de conocimiento aún no está construido, y que los datos generados se comparten mediante el repositorio Luisa Cuesta, un servicio gestionado por la Universidad de la República en conjunto con la Institución Nacional de Derechos Humanos y que está a cargo de una archivóloga, Natalia Lima.

Según Etcheverry, las personas que acceden al repositorio deben registrarse y firmar documentos de confidencialidad sobre el manejo de la información disponible que, por ahora, es la colección documental Berrutti. “La documentación que está ahí no está ni anonimizada ni sanitizada, es decir, lo que las personas pueden ver son las imágenes tal cual fueron entregadas al proyecto”.

Existen otras herramientas para la consulta de archivos sobre el pasado reciente. Al respecto, Etcheverry explicó que todas se han bautizado con nombres de mujer y cumplen funciones complementarias. “Además del Repositorio Luisa Cuesta, también está Luz, una herramienta para la búsqueda de documentos, y Amalia, que está más enfocada en hacer un análisis cualitativo y más fino de los textos para, a partir de un conjunto de documentos más o menos identificado, por ejemplo, extraer palabras frecuentes”, explicó.

En cuanto a los sentimientos que representa poder aplicar lo profesional, en este caso la ingeniería de datos, a un tema tan sensible para la sociedad como la búsqueda de la verdad y la memoria, Etcheverry describió la experiencia como “profundamente gratificante” al ver cómo su área de trabajo “puede ser útil para una función súper importante para nuestro país” como el aporte a la memoria y la verdad histórica.

Al mismo tiempo, reconoció que existe un amplio margen de desarrollo que aún depende de recursos y apoyo institucional. “Me queda la sensación de que hay más potencialidad de la que estamos pudiendo llevar adelante, que estaría bueno contar con más recursos para poder pasar a un nivel más robusto algunas ideas que han quedado en prototipo o resultados de investigación preliminar”.

Finalmente, subrayó la importancia de ampliar el acceso a estas herramientas más allá del equipo de investigación. “Sería importante, no sólo darle visibilidad a nuestro trabajo como investigadores, sino que alguien use estas herramientas para algo más. Por ejemplo, que la Fiscalía Especializada contara con este servicio, que pudieran hacer preguntas y disponibilizar estas herramientas directamente al Poder Judicial”.

Hacia una pedagogía de la memoria

La directora de la Secretaría de Derechos Humanos para el Pasado Reciente, Alejandra Casablanca, evaluó positivamente la aplicación de la inteligencia artificial al análisis documental y valoró el rol de la Universidad de la República en la iniciativa. “Creo que la Universidad de la República, tan castigada por la derecha de este país, ha demostrado que está al servicio de la sociedad, en todos los proyectos que realiza a través del área universitaria y en todas las carreras. En el caso de Cruzar, la inteligencia de nuestros científicos, ingenieros y académicos logró actualizar la función de los archivos”.

La directora recordó que el Frente Amplio logró digitalizar apenas el 30 % del Archivo de la Dirección Nacional de Inteligencia en siete años, y celebró el impacto que tendrán las nuevas herramientas tecnológicas para lograr mayores avances. “El trabajo que pueden hacer nuestros académicos y científicos va a ayudar a agilizar la posibilidad de tener esa información, que después sirva de dos maneras. Por un lado, para cruzar información y dar un paso en materia de búsqueda, y justicia, pero también para la ciudadanía toda. Porque más allá de reservar algunos elementos que pueden revictimizar a las personas involucradas, la ciudadanía se merece conocer la historia de este país”, opinó.

Casablanca también subrayó la ventaja de la tecnología actual frente a los altos costos de equipos anteriores. “En 2013-2014, el escáner que está en la Dirección de Inteligencia le costó a Presidencia 25 mil dólares. En mayo del año pasado yo licité cuatro escáneres con muchísima mayor calidad y salieron 166 mil pesos los cuatro. Cada escáner salió aproximadamente mil dólares contra veinticinco mil. Entonces, la tecnología está a nuestro favor, no solo por los costos, sino por el conocimiento aprendido”, señaló.

Más allá de la digitalización, Casablanca destacó la posibilidad de incorporar en esta área otras tecnologías innovadoras, como el Lidar [por su acrónimo del inglés Light Detection and Ranging o Laser Imaging Detection and Ranging]. Explicó que se trata de un sistema utilizado en Argentina normalmente para trabajos topográficos que, por ejemplo, releva información sobre terrenos, estructuras e identifica movimientos de tierra y rastros ocultos, lo que se podría combinar con el trabajo de antropólogos, historiadores e ingenieros en Uruguay. “El Lidar es como un avión chiquito o un dron grande, algo a medio camino, que emite halos de luz para hacer detecciones y mediciones de espacios u objetos. Acá hay uno en el Ministerio de Transporte y Obras Públicas y otro en la Intendencia de Montevideo. Creo que desde el Estado todo, podemos colaborar. Teniendo en cuenta lo que hace nuestra universidad en distintas áreas, se pueden hacer cosas interesantes”.

Más allá de la digitalización y el análisis de archivos, la jerarca subrayó que uno de los objetivos centrales de su gestión es impulsar una pedagogía de la memoria que permita a la sociedad comprender y recordar los hechos del terrorismo de Estado, a través de políticas educativas y culturales que preserven la memoria histórica y fortalezcan la democracia. “Tenemos ejemplos maravillosos en todo nuestro continente, incluso en España, que hace muy pocos años establecieron una política de pedagogía de la memoria. En nuestro país se han dado muchos pasos, pero no trabajamos en un concepto que sea una política de Estado a través de una pedagogía de la memoria”, señaló.

Casablanca destacó la necesidad de escuchar y recoger las experiencias de quienes vivieron el terrorismo de Estado, así como de involucrar a la sociedad civil y a los jóvenes. “¿Cómo construimos esa pedagogía de la memoria? Con la gente de la educación, que después de cinco años vuelve a incluir la historia reciente y la educación sexual en los programas de educación, pero sobre todo con la sociedad civil, porque no ha sido el Estado quien ha puesto el cuerpo, sino la sociedad civil. La gente de Bella Unión que publica un libro sobre lo que pasó allí, poniendo plata de su bolsillo. La gente que organiza un conversatorio, que invita a un artista popular porque van a colocar una placa en Nueva Helvecia para Nibia. ¿No será hora de sanearnos como sociedad, contar la historia y generar esa pedagogía de la memoria que diga: esto es parte de la historia uruguaya?, ¿parte de la identidad? Creo que hacía ahí debe ir el concepto de pedagogía de la memoria. Por supuesto que, por ejemplo, con la libertad de cátedra de todos los docentes de Historia, no metiéndonos en donde no nos tenemos que meter como gobierno, pero sí colaborando. Colaborando con cada sitio de memoria, con cada iniciativa de la sociedad civil, escuchando, aprendiendo hablando en distintos lenguajes”.

En tal sentido, subrayó la importancia de adaptar la pedagogía de la memoria al lenguaje de los jóvenes y de los distintos actores sociales: “¿No será que tenemos que sentarnos con los adolescentes, con los jóvenes, con los universitarios, con los laburantes a ver cuál es su idioma, y pensar cómo armamos esa pedagogía de la memoria de la mejor manera?”, preguntó.

Casablanca concluyó que este enfoque buscará blindar la democracia y fortalecer el ‘nunca más’ al terrorismo de Estado, insistiendo en que se trata de una política de Estado que trasciende los partidos políticos. “En eso vamos a estar estos años, intentando escuchar mucho, descentralizar, contando las historias que se están yendo porque los protagonistas están muriendo, y buscando establecer una política de Estado. Yo no creo que haya ningún partido político que cuestione la democracia. Entonces, ¿cómo va a haber un partido político que cuestione una política de Estado de memoria?”.