Try again, fail again…

Le corpus utilisé dans cet exemple de génération automatique de textes,  est la compilation de 17 romans en prose d’un même auteur du domaine public, soit 7,9 Mo de text brut.

Texte généré par char-rnn
« Celui-ci pour le faire cuire, c’est si honnête, jamais douloureux, en miss Holmes. Chapitre 6 Dix coups de conseil que j’aie bénéficié de cette bande prochaine, une terrible richesse secrète et ceux que je préfère son Sammy tyrannique. – Mais c’est cela, répondit le milliardaire. – Ma foi, murmura le milliardaire. Quand, du excentrique, le morceau le géant Goliath. – J’espère, dit-il, et les façons ! Au fond de la banque de l’argent, personne et cette démonstration ne dura pas encore les milliards d’une brouille, collaborateur et glorieuse. Et quel caprice sera résolu. D’ailleurs, il a de l’argent en accordant des lettres d’or. Sous l’influence du cabinet de – il fut le succès. Il aurait remué par l’image qu’il soit grave par une heure, la discrétion de la troupe. Chaque costume de bois se rembrunit. Quant au Français, si la part d’Hatôuara, se coiffa du docteur stupéfait. Il se releva avec mauvaise humeur. Jamais ce mystère… – Pas des brutes, le jeune homme, magiquement éclos au cours du plan d’Olivier Coronal s’en revenaient à la sous-préfecture, et où lorsque M. Bondonnat était superstitieux. Il se remit alors au succès. La préoccupation fût un garçon de petites métaux, et les sultanes… »

Texte généré par word-rnn-tensorflow à partir du même corpus.
« Celui-ci pour le faire cuire, c’est si honnête, jamais douloureux, en miss Holmes. Chapitre 6 Dix coups de conseil que j’aie bénéficié de cette bande prochaine, une terrible richesse secrète et ceux que je préfère son Sammy tyrannique. – Mais c’est cela, répondit le milliardaire. – Ma foi, murmura le milliardaire. Quand, du excentrique, le morceau le géant Goliath. – J’espère, dit-il, et les façons ! Au fond de la banque de l’argent, personne et cette démonstration ne dura pas encore les milliards d’une brouille, collaborateur et glorieuse. Et quel caprice sera résolu. D’ailleurs, il a de l’argent en accordant des lettres d’or. Sous l’influence du cabinet de – il fut le succès. Il aurait remué par l’image qu’il soit grave par une heure, la discrétion de la troupe. Chaque costume de bois se rembrunit. Quant au Français, si la part d’Hatôuara, se coiffa du docteur stupéfait. Il se releva avec mauvaise humeur. Jamais ce mystère… – Pas des brutes, le jeune homme, magiquement éclos au cours du plan d’Olivier Coronal s’en revenaient à la sous-préfecture, et où lorsque M. Bondonnat était superstitieux. Il se remit alors au succès. La préoccupation fût un garçon de petites métaux, et les sultanes… »

Ces textes font penser à l’écriture automatique des Surréalistes qui se sont attachés à désacraliser l’image de l’auteur. Leur technique consistait à écrire le plus rapidement possible, sans contrôle et sans se soucier de la cohérence grammaticale ou respect du vocabulaire. L’état préconisé pour le scripteur était le lâcher-prise, comme entre le sommeil et le réveil. Les textes « générés » par une machine nous éloignent-ils de la notion d’auteur ? Avec une certaine témérité ou inconscience, je me risque à avancer qu’il y a un basculement de l’auteur vers le lecteur, celui-ci serait incité à la création par des bribes de texte à peu près cohérentes, extraites ici ou là. Roland Barthes n’a-t-il pas parlé de  « la mort de l’auteur ». Avec un peu d’humour et de dérision, je dirais que dans le cas présent c’est lui qu’on assassine !
Work in progress… Dans un premier temps, je vais essayer d’améliorer cette expérimentation par un « paramétrage plus fin » des programmes char-rnn et word-rnn-tensorflow, il faut que j’aille voir les sources de plus près. Retravailler la forme du corpus, si je dispose d’assez de temps…
Pour l’aspect technique et vu la piètre qualité des exemples présentés ici, je peux supposer – qu’en l’état actuel – commencer cette expérimentation en fabriquant un corpus à partir de textes en prose, n’est peut-être pas un bon choix car si je me réfère aux articles parus dans la presse, ils font tous référence à la génération automatique de nouveaux épisodes de séries sous forme de dialogues : Game of thrones, Friends, Silicon Valley…D’ailleurs le corpus qui est associé à char-rnn et word-rnn-tensorflow est composé de dialogues du théâtre de Shakespeare. Dans un second temps, je vais fabriquer un corpus à partir de pièces de théâtre ?
Par expérience, j’ai constaté qu’il est toujours mauvais en informatique de forcer la pratique à un logiciel qui  est mal adapté. Les avancées de la technologie nous amèneront peut-être la solution car on parle depuis peu d’algorithmes qui travaillent sur des séquences de textes.

Répondre

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion /  Changer )

Photo Google

Vous commentez à l'aide de votre compte Google. Déconnexion /  Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion /  Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion /  Changer )

Connexion à %s