Compte rendu: atelier Prospéro-Marlowe
L’atelier « Prospéro-Marlowe » a été organisé le 10 juin par Josquin Debaz, ingénieur de recherche au Groupe de sociologie pragmatique et réflexive de l’EHESS, afin d’ouvrir à la discussion le développement du logiciel d’analyse de corpus Prospéro et la “contre-intelligence artificielle” Christopher Marlowe qui lui est reliée.
Présentation initiale
Les participants n’étant pas familier avec les logiciels, une première partie de l’atelier a consisté en une présentation sommaire pour alimenter la discussion ultérieure.
des principes du logiciel Prospéro
Une première partie a consisté à expliciter les principes d’utilisation du logiciel Prospéro : basé sur la constitution et l’échange de dictionnaires syntaxiques et conceptuels, il permet ensuite l’analyse du corpus, d’en faire émerger les traits principaux, son évolution dans le temps, mais également des recherches fines, par exemple sur les formes argumentatives à l’œuvre dans les textes. La distinction des concepts en trois formes sémantiques (entités, catégories et collections) permet à l’utilisateur de croiser les formes de comptage et d’association entre les ontologies de sa grille de lecture.
du développement de Prospéro 2
Le développement de la première version s’étale entre le milieu des années 90 et le milieu des années 2000. Il était devenu nécessaire de toiletter le logiciel de certaines branches plus utilisées ou pouvant être regroupées et de donner un coup de jeune technique au code (utf-8, multiprocesseur, …). Tout a été repris de zéro, avec un système multi-plateforme en mode client-serveur, et le passage progressif du code vers une licence ouverte.
de la chronique de Marlowe
La présentation a ensuite illustré un usage particulier du logiciel, celui effectué par un ensemble de scripts interactifs en langage naturel dénommé Christopher Marlowe. Sur la base d’un corpus d’actualités collectés automatiquement, Marlowe s’auto-questionne, analyse syntaxiquement et sémantiquement (via Prospéro) les textes, pour construire une chronique quotidienne. Cette production est, depuis 2012, déposée en ligne sur un blog et enrichie graphiquement par des images et des vidéos, mais aussi la production de cartes, de graphes, de nuages de tag et de tableaux
Discussion
Une série de questions a émergée au fur et à mesure de la présentation et à sa suite.
Il y a eu un certain nombre d’interrogations techniques sur le logiciel Prospéro :
- sur sa distribution : Prospéro 1 est gratuit en freeware, sous condition d’accord avec une charte qui met en avant la non-surveillance des personnes et le respect des droits d’auteurs. Prospéro 2 est en cours de développement, la participation à ce dernier est ouverte. En particulier, la partie client est mise à disposition sur github en licence LGPL ;
- sur les formations : un séminaire est ouvert à l’EHESS depuis le début des années 2000 et des formations peuvent être proposées par l’association Doxa ;
- sur la communauté d’utilisateurs : un forum et une liste de diffusion sont en place ;
- sur les langages utilisés : C, C++, Python, Qt, Lisp… en fonction de la pertinence pour le développement ou l’usage ;
- l’export vers d’autres logiciels : il est déjà possible de connecter les résultats de Prospéro avec des logiciels statistiques comme R ou de visualisation comme Pajek et Gephi, il serait intéressant de le faire avec des logiciels de traitement textuel (IRaMuTeQ, TXM…)
Une autre partie de la discussion a porté sur Marlowe.
Des questions concernaient les possibilités d’interactions. A moins d’avoir le logiciel installé sur sa machine, auquel cas c’est en dialoguant en langage naturel que s’utilise Marlowe, un échange à minima est déjà possible via email (marlowe<@>laposte.net), twitter, facebook ou en renseignant certains champs que les scripts peuvent appeler (vdoc, citations). Ces possibilités sont amenées à être développées au fur et à mesure des usages.
D’autres interrogations se penchaient sur les processus d’information et d’apprentissage du logiciel. Leur potentiel est encore sous-exploité mais Marlowe est par exemple attentif à savoir si un individu est décédé, à la profusion de sigles dans les séries publiques ou encore à constituer une série d’indicateur qui pourraient attester d’un certain état du monde (de la température au prix du baril de pétrole, en passant par les prix Nobel de l’année et le box office).
Autour de la production d’une chronique a émergé une discussion autour du métier de journaliste, des possibilités d’en automatiser une partie et des problèmes essentiels que cela pose. Les sources et leurs traitements ont été interrogées, les humanités savent en effet combien l’usage critique des sources est primordial. Un participant a qualifié le dispositif de “flippant”, ce qui a permis de mettre en avant la mise à distance critique et réflexive qu’essaie d’imposer Marlowe sur nos usages des outils numériques, ne serait-ce que par l’emploi de noms issus du théâtre élisabéthain (Prospéro, Marlowe…).
Catégories: Non classé Tags: CR d'atelier, THATCamp Paris 2015