L'étude présentée se concentre sur les déclarations de violences de genre sur Twitter en France dans le cadre de #MeToo, entre octobre 2017 et décembre 2022. Plus de 300 000 tweets ont été analysés, provenant de deux bases de données : une collecte en continu et une collecte rétrospective fin 2022. Les hashtags ciblés incluent #Metoo, #MeTooInceste, #MeTooGay, #IWas, et #BalanceTonPorc.
Les enjeux méthodologiques principaux étaient l'identification des témoignages de violences parmi les tweets collectés et l'analyse détaillée de ces témoignages en termes de contenu et d'intention. Deux modèles de classification automatique basés sur CamemBERT (Martin et al, 2019) ont été développés. Utilisant une approche supervisée avec des annotations manuelles, les modèles ont été entraînés pour des classifications à 4 et 7 classes. Le second modèle, qui classe les témoignages (identifiés par le premier modèle) selon le contexte des violences déclarées (inceste, couple, espaces publics, école, milieu professionnel, connaissances, autres), applique une classification systématique par champs lexicaux pour améliorer la précision. Les modèles atteignent des taux d'accuracy de 87% et 95%.
L'analyse révèle plusieurs points clés. D'abord, il y a une sur-déclaration des violences au travail et à l'école et une sous-déclaration des violences conjugales par rapport aux enquêtes nationales (Enquête Virage, Ined, 2015), mettant en évidence des disparités dans les témoignages #MeToo. Ensuite, une analyse des métadonnées des comptes et tweets (date de création du compte, nombre d'abonnés, d'abonnements, de tweets publiés, nombre de likes, retweets, etc.) a permis de mesurer l'anonymat, la visibilité et l'interaction des utilisateurs. La comparaison entre tweets issus de la collecte journalière et ceux de la collecte rétrospective a permis d'étudier la suppression des tweets. Les tweets identifiés comme témoignages sont surreprésentés parmi les tweets supprimés, anonymes et peu visibles, soulignant l'usage spécifique de Twitter pour témoigner par rapport aux autres types de contenus.
- Poster