El contenido sexista en las redes sociales suele ser más implícito y sutil que violento, según revela EXIST 2021, una campaña para detectar mensajes sexistas en Internet, en la que participan profesores y doctorandos de la UNED.
Según ha informado este lunes la institución educativa, EXIST 2021 propone a la comunidad científica la tarea de detectar y categorizar automáticamente mensajes sexistas en redes sociales, clasificándolos en sexistas o no sexistas, y categorizando a los sexistas de acuerdo con la faceta de la mujer a la que atacan.
Para ello, han creado un dataset de más de 11.000 mensajes cortos provenientes de Twitter y Gab.com que contienen más de 200 expresiones sexistas detectadas por los organizadores. EXIST ha recibido una gran acogida con la participación de más de 30 equipos de 11 países.
«Hemos encontrado una gran cantidad de conversaciones en español, en este caso concreto procedentes de Twitter, de contenido misógino. Dado que Twitter es una red social con mecanismos de censura y políticas de uso bastante restrictivas, esperábamos encontrar pocos tweets para la categoría de misoginia. Del mismo modo, hemos encontrado un alto porcentaje de tweets en inglés para la categoría ‘violencia sexual'», afirma el profesor Jorge Carrillo, profesor de la ETSI de la UNED.
Asimismo, Carrillo añade que el porcentaje de contenido sexista que podría considerarse «implícito o sutil en el dataset es considerablemente más alto que el explícitamente violento, lo que corrobora que es imprescindible avanzar en la detección automática de este tipo de sexismo».
Como detalla el profesor, la campaña EXIST «pretende impulsar el desarrollo de algoritmos automáticos capaces de detectar el sexismo en un sentido amplio, desde la misoginia explícita hasta otras expresiones sutiles que involucran comportamientos sexistas implícitos». «Se trata de una tarea muy compleja debido al uso de vocabulario neutro y la dependencia con el contexto en que se produce la conversación», señala.
La campaña de evaluación EXIST se organiza como parte del proyecto MISMIS (Misinformation and Miscommunication in Social Networks) en el que participan investigadores de la UNED, la Universidad Politécnica de Valencia y la Universidad de Barcelona, como un instrumento para potenciar la investigación en detección automática de sexismo en la red, fundamentalmente en conversaciones en redes sociales.
«Investigaciones anteriores han estudiado la presencia de contenidos misóginos y violentos hacia la mujer en Internet, pero nunca antes se han tratado el sexismo en su globalidad, que incluye formas sutiles, amables e incluso encubiertas», señala Carrillo.
El equipo de Trinidad Donoso, de la Universidad de Barcelona, ha sido el encargado de identificar un conjunto de términos que, con frecuencia, se presentan en conversaciones sexistas, pero que, dependiendo del contexto de la conversación, pueden también presentarse en conversaciones sin ninguna connotación sexista.
También han elaborado una categorización de los tipos de sexismo que con mayor frecuencia se encuentran en redes sociales, tomando como referencia las distintas facetas de la mujer que son atacadas o menoscabadas. A partir de estos términos, el equipo de la UNED ha recopilado un dataset de conversaciones que los contienen y que han sido anotados manualmente como sexistas o no sexistas, y se asigna así a cada conversación sexista una categoría conforme a la categorización elaborada por las expertas.
«Durante la competición EXIST se ha pedido a los equipos participantes que desarrollen sistemas automáticos capaces de clasificar automáticamente los textos como sexistas o no sexistas y, en caso de ser sexistas, clasificarlos según el tipo de sexismo: misoginia, violencia sexual, objetivación de la mujer, de estereotipo y dominancia, e ideológico», indica Carrillo.
El profesor sostiene que el objetivo no es identificar términos sexistas sino detectar conversaciones con connotaciones sexistas. «De hecho, frecuentemente, y máxime cuando se trata de un sexismo sutil, las conversaciones no presentan términos que, per sé, puedan considerarse sexistas, pero, sin hacer uso de un vocabulario específico u ofensivo, encierran mensajes que menoscaban o discriminan a la mujer», advierte.