Réseau scientifique de recherche et de publication

[TERRA- Quotidien]
Accueil > Projet "Numer-Univ" (2013/2016) > Séance n°4 (26 mars 2014)

Projet "Numer-Univ" (2013/2016)

Séance n°4 (26 mars 2014)

du séminaire Fichet-Heynlin

HISTOIRE et transformations numériques dans l’enseignement supérieur et la recherche

Questions et débat avec :

Deux questions préliminaires aux deux invités pour ouvrir le débat :

  • Question n°1 (aux deux chercheurs) : Quelles sont à votre avis, en histoire, les transformations les plus importantes, liées au numérique, modifiant le processus (données, traitements, éditions, pédagogies, valorisations) allant de la recherche à ses diffusions pédagogiques et publiques ?
  • Question n°2 (aux deux chercheurs) : Quelles sont, à votre avis, les spécificités des disciplines historiques (vis à vis d’autres disciplines que vous connaîtriez dans le domaine des arts, lettres et sciences humaines), dans le rapport aux transformations numériques des pratiques de recherche et d’enseignement ?

Pour poser d’autres questions aux chercheurs :


Organisée et animée par Julien Vincent.

Date : Mercredi 26 mars 2014 - De 16h30 à 18h30 Lieu : Centre Pierre Mendès France - 90, rue de Tolbiac - 75013 Paris - Salle A 802 (ascenseurs verts, 8ème étage). Metro : Olympiade / ligne 14 Inscription gratuite mais obligatoire


Posté par Frédéric Clavert le 26/03/2014

J’ai eu l’honneur d’être invité à parler au séminaire Fichet-Heynlin [1] à l’occasion d’une séance consacrée à l’histoire. Le séminaire se déroule également en ligne et un framapad a permis à Julien Vincent, modérateur et organisateur de la séance, de collecter les questions du public qui suivait le séminaire en ligne. C’était l’occasion de rencontrer Jean-Philippe Genet (Paris 1), qui est également intervenu à ce séminaire. Il a notamment co-dirigé avec Andrea Zorzi Les Historiens et L’informatique : Un Métier À Réinventer (Ecole Française de Rome, 2011).

Je vous livre ici les notes que j’avais préparées, en réponse à deux questions préalables posées par Julien Vincent pour préparer le séminaire. Ces notes ne correspondent pas nécessairement à ce que j’ai dit, ce séminaire devant rester une forme de conversation entre les deux intervenants et leur public, qui n’était pas constitué uniquement d’historiens. Lisez aussi les notes de bas de page, où j’apporte des éléments importants aussi.

Quelles sont, en histoire, les transformations les plus importantes, liées au numérique ?

Je partirais d’Arlette Farge, Le goût de l’archive. Elle décrit la relation matérielle, physique de l’historien.ne à l’archive (importance du toucher, importance de la recopie à la main, importance du centre d’archives comme lieu). Ce qu’elle décrit correspond tout-à-fait à l’expérience que j’ai moi-même vécu pendant ma thèse de 1999 à 2006. Si on se réfère à la manière dont Arlette Farge décrit le travail des historiens dans les archives, alors on peut dire qu’il y a eu depuis dix ans au moins des changements majeurs, notamment par l’apparition de deux éléments : l’appareil photo numérique et la mise en ligne d’archives numérisées.

L’usage de l’appareil photo numérique et celui des bibliothèques numériques sont des exemples qui montrent que les lignes sont en train de bouger, que les historien.ne.s dans leur ensemble sont en train d’embrasser l’outil numérique au-delà d’usages basiques comme le traitement de texte ou le courrier électronique [2].

Toutefois, cette adoption est inégale en fonction du type d’outils offert par l’ordinateur ou le réseau. Elle se fait aussi, souvent, dans un cadre méthodologique plus que flou.

Si l’on fait une petite histoire de l’usage de l’informatique dans les sciences historiques, on constate que l’usage de l’informatique en histoire depuis les années 1950 (Castex, Éric. 1996. « Informatique et recherche en histoire ». http://pedagogie.ac-toulouse.fr/his...), notamment pour la gestion de l’information (François Furet, et Adeline Daumard. 1959. « Méthodes de l’Histoire sociale : les Archives notariales et la Mécanographie ». Annales ESC 14 (4) : 676‑693.) et pour croiser les informations afin d’en obtenir de nouvelles (Paul Garelli, et Jean-Claude Gardin. 1961. « Étude par ordinateurs des établissements assyriens en Cappadoce ». Annales ESC 16 (5) : 837‑876.) – ce que l’on appelle aujourd’hui de la fouille de données.

Toutefois, cet usage de l’informatique – malgré les grandes thèses reposant sur cette usage dans les années 1960 (Leroy-Ladurie, les Annales ou aux Etats-Unis la new economic history) – reste peu répandu dans le monde académique historien français. Mais il y a eu dans les années 1970 et 1989, un essoufflement de la première génération de l’histoire économique quantitative reposant sur les grandes séries statistiques. Cela a eu une incidence sur l’usage de l’informatique en histoire, même si ce n’est pas le seul domaine où était utilisé l’ordinateur (cf. histoire militaire aussi dans les années 1960) [3].

Depuis les années 1990, il y a eu un fort changement, particulièrement sensible depuis quelques années. L’apparition des ordinateurs individuels, de leurs interfaces graphiques, la mise en réseau de ces ordinateurs, l’apparition des interfaces tactiles sont autant de moments importants, apportant de nouveaux outils – nouveaux ou plus simples à utiliser que sur les mainframes – comme des logiciels plus faciles à utiliser (tableurs, bases de données, gestion de la bibliographie), comme du matériel (PC à interface graphique, appareils photos, tablettes, smartphones…), les services web (bibliothèques numériques par exemple), des réseaux sociaux spécialisés ou non.

Ces progrès techniques et logiciels ont entraîné une extension des usages numériques en histoire. Si en 1999, au début de ma thèse, mes deux directeurs de thèse m’ont expliqué qu’ils ne voyaient pas l’utilité d’une adresse e-mail, c’était devenu l’année suivante le meilleur moyen de les contacter. Il y a un an et demi, à une université d’été où j’ai tenu une session sur les Humanités numériques, les plus attentifs étaient les chercheurs « seniors » et non nécessairement les jeunes doctorants.

Cette extension, qui me semble s’être accélérée depuis deux ans, est toutefois très incomplète et implique des problèmes méthodologiques qu’il va falloir régler.

En effet, certaines pratiques devenues massives entraînent l’introduction de boîtes noires dans la recherche des historiens. Par exemple, il y a une différenciation des résultats reçus par Google en fonction de la langue, du lieu de la requête ou des requêtes précédentes. Sur une même requête, deux historiens auront deux listes de résultats différentes et ils n’en sont pas nécessairement conscients (Kemman, Max, Martijn Kleppe, et Stef Scagliola. 2013. « Just Google It – Digital Research Practices of Humanities Scholars ». ArXiv e-print 1309.2434. http://arxiv.org/abs/1309.2434.). La numérisation de certaines sources plutôt que d’autres entraînent des biais importants (Milligan, Ian. 2013. « Illusionary Order : Online Databases, Optical Character Recognition, and Canadian History, 1997–2010 ». Canadian Historical Review 94 (4) : 540‑569. doi:10.3138/chr.694.) et la construction d’un ordre illusoire de la connaissance et des sources primaires.

Si l’on revient à Arlette Farge, elle rappelle que le rapport matériel à l’archive (le classement par boîte, la nature du papier, la poussière, les fiches avec la signature des autres historiens qui ont exploité cette boîte, etc) est important dans la manière d’appréhender le document, la source primaire, donc dans la manière de l’interpréter. Le passage à l’archive massivement photographiée, à l’usage de bibliothèques numériques changera le rapport à la source primaire et donc son interprétation. Ce n’est pas nécessairement négatif, mais c’est un élément qu’il faut penser. Cet élément n’est pas nécessairement nouveau – il concernait déjà les microfiches – mais il se pose dans des termes nouveaux.

Il y a également un décalage entre ceux qui comprennent comment fonctionnent les outils et les autres, entre ceux qui utilisent les outils les plus avancés et les autres : utiliser Google NGrams sans en comprendre toutes les implications par exemple et savoir faire de la fouille de texte avec le logiciel statistique R n’impliquent pas les mêmes compétences du tout, ni les mêmes boîtes noires, d’ailleurs.

Si l’on regarde l’enseignement de l’histoire, un autre décalage existe. S’il y a une claire prise de conscience des enjeux numériques en histoire chez un nombre croissant d’historien.ne.s, c’est aussi en raison de la pression des étudiants. Ces « digital natives » posent des questions, imposent des pratiques qui poussent les enseignants à changer eux-mêmes leurs pratiques. C’est par cette pression que certains enseignants-chercheurs demandent des formations ou questionnent ceux qui éditent les bibliothèques numériques en ligne, fortement utilisées par les étudiants.

Mais s’intéresser au numérique uniquement en réponse au comportement des étudiants est une démarche qui peut avoir de fortes limites.

La première raison est que la notion de « digital natives » est une escroquerie. Les étudiants usent certes plus de l’ordinateur (du réseau surtout) que nous au même âge, mais peu savent prendre une distance avec les outils numériques. Il y a quelques années une étudiante a tenté de me mettre dans l’embarras pendant une conférence de méthode à l’IEP de Strasbourg à propos du document que l’on appelle couramment le protocole Hossbach. À partir de l’argumentaire trouvé sur un site web, elle a remis en cause mes propos. Une simple lecture de l’URL de ce site web lui aurait permis de comprendre qu’elle reprenait un argumentaire négationniste sans aucune distance. Il y a donc une pédagogie spécifique à élaborer vis-à-vis des étudiants et de leur rapport au numérique (ici au web) et on ne peut pas dire que, de manière générale, nous assurions aujourd’hui une formation au numérique satisfaisante.

Ensuite, s’intéresser au numérique par la pression des étudiants est une porte d’entrée comme une autre, mais qu’il faut bien dépasser. Car les usages du numérique en histoire vont bien au-delà de la lecture de PDFs à l’écran ou de l’usage des réseaux sociaux. Ainsi, les usages les plus avancés du numérique (fouille et visualisation des données, les systèmes d’information géographique par exemple) ne viendront pas des étudiants et devront venir des enseignants-chercheurs / chercheurs.

La situation telle que je l’observe aujourd’hui est ainsi la suivante :

Il y a une très grande conscience des enjeux du numérique en histoire chez les historiens. J’ai pu constater un changement entre le moment où j’ai commencé à m’intéresser aux Humanités numériques et aujourd’hui. C’est relativement NOUVEAU ;
- Cette conscience ne permet pas pour le moment l’émergence d’un usage de toute la panoplie d’outils par les historiens, mais d’un usage certes très répandu mais partiel, de certains outils seulement et peu encadré par une méthodologie claire.
- Nous n’avons toujours pas répondu à la très vieille question de la formation des enseignants-chercheurs et étudiants aux outils numériques.

Là où il semble que les choses prennent bien mieux, c’est sur la communication scientifique dans un sens large (littérature grise, publications, conférences) : utilisation des réseaux sociaux (y compris pendant les conférences), de l’édition en ligne (avec le grand moteur en France qu’est dans ce domaine OpenEdition/CLEO) [4].

Quelles sont, à votre avis, les spécificité des disciplines historiques dans le rapport aux transformations numériques des pratiques de recherche et d’enseignement ?

Cela dépend beaucoup des domaines de recherche des historiens. Certains sont plus incités à l’usage des outils informatiques (l’histoire économique). D’autres s’y ouvrent à peine (l’histoire des relations internationales).

Le rapport aux sources est aussi déterminant.

- Le contemporanéiste de la première moitié du XXe siècle, par exemple, n’a pas nécessairement besoin du numérique : l’usage de l’informatique est très reliée à la gestion d’une plus ou moins grande masse d’information, or il dispose dans son cas d’une masse d’information à taille humaine (ni trop peu, ni trop) ;
- Histoire médiévale : sources peu nombreuses, fragiles, géographiquement éparpillées. A poussé à la numérisation des sources donc à un usage plus poussé du numérique en histoire médiévale.

Il est clair toutefois que certaines sciences sociales ont un rapport au numérique qui est bien plus « avancé » que celui des historiens :
- La sociologie : usage régulier du quantitatif, analyse réseau, etc ont poussé dans certains courants à un fort usage du numérique ;
- L’archéologie : car pas le choix ;
- La linguistique : car sinon cette science disparaissait.

Le point commun entre ces trois exemples, c’est probablement leur rapport aux sciences dures ou du moins aux sciences plus quantitatives. Ce qui pose un problème épistémologique très important, celui de la transformation des SHS en sciences « dures », avec résultats quantifiables, grande inquiétude aujourd’hui, à cause du numérique mais aussi d’évolutions récentes de la gestion et de l’évaluation de la recherche [5].

*

* *

De ce qu’a dit Jean-Philippe Genet, je retiendrai (en espérant ne pas déformer ses propos) qu’il entrevoit des transformations de deux ordres en histoire, liées au numérique.

Les premières sont celles qui auraient dû se produire mais ne sont pas ou pas assez arrivées. Ce sont notamment les transformations liées aux méthodes, qui touchent profondément la discipline historique. Pourquoi n’est-ce pas arrivé ? En raison du manque de formation, mais aussi parce que les historiens vivent dans un espace limité volontairement, en refusant le contact avec la sociologie et les sciences politiques, par peur panique, surtout chez les contemporanéistes, de voir leur discipline confondue avec ses deux consœurs.

Ces transformations qui ne sont pas arrivées sont celles qui reposent sur une pratique pluridisciplinaire : les outils d’analyse de données impliquent en effet de travailler avec des statisticiens, des mathématiciens ou des sociologues qui ont plus de savoir-faire en la matière. Dans le cas de la textométrie, les historiens sont restés à une pratique très empirique du texte, se considérant comme interprète légitime des sources, substituant leur narration au texte extrait de la source, alors qu’ils pourraient travailler avec les linguistes pour une approche plus méthodique du texte. Il y a enfin l’analyse spatiale, qui nécessite de travailler avec les géographes.

Le second type de changements sont ceux qui se sont produits. Ce sont ceux qui sont reliés à la numérisation. Cette dernière va transformer le travail des historiens et cette transformation sera imposée aux historiens et elle est en train de se produire.

Le fait d’avoir les sources en ligne – Jean-Philippe Genet a rappelé qu’Europeana prévoyait la mise en ligne de toutes les archives d’ici 2050 [6] – va changer la narration. Pourquoi encore paraphraser les sources quand elles sont en ligne ? Cela aura un effet positif : l’historien.ne pourra mettre beaucoup plus d’énergie à interpréter les sources, ce qui est plus délicat que les paraphraser ou les résumer [7].

La numérisation va nécessiter de savoir naviguer dans toutes ces sources numériser, d’utiliser les outils informatiques pour stocker et interpréter l’information.

Reste le problème général de la description de la donnée. Jean-Philippe Genet avait proposé la notion de méta-source. L’important est que l’esprit critique doit rester au cœur du travail de l’historien.

Le séminaire a été enregistré. Je signalerais le lien du podcast dès que possible.

Notes
[1] Réseau NUMER-UNIV, hébergé par le réseau Terra
[2] Jean-Philippe Genet a rappelé qu’avec la numérisation et la mise en réseau des sources primaires numérisées, les historien.ne.s étaient obligés de considérer le numérique et ses effets sur l’histoire
[3] Sur ce point que l’on retrouve régulièrement dans la littérature, Jean-Philippe Genet m’a contredit. Pour lui, ce sont surtout les historiens démographes qui étaient à la pointe de l’usage de l’informatique. Il attribue l’essoufflement de la petite communauté qui usait de l’informatique surtout par le blocage du CNRS et du ministère, dans un premier temps, d’équiper les historiens de micro-ordinateurs. C’est un point important qu’il faudra que je creuse plus avant
[4] J’ai nuancé mes propos sur ce point pendant le séminaire
[5] Jean-Philippe Genet a bien insisté qu’il ne devait plus y avoir de différence faite entre le quantitatif et le qualitatif.
[6] Je suis moins optimiste sur ce point.
[7] Cette dernière phrase est mon interprétation des propos de Jean-Philippe Genet


L’administration de la preuve en histoire à l’ère numérique

Posté par Frédéric Clavert le 31/03/2014

À la fin du séminaire Fichet-Heynlin de la semaine dernière, Stéphane Lamassé (Paris 1) me faisait remarquer que le mode d’administration de la preuve en histoire risquait d’être durablement infléchi par le numérique. Il avait déjà, brièvement, évoqué le sujet à THATCamp Paris 2010. Je n’ai pas encore fondamentalement réfléchit à la question. Voici quelques idées élaborées rapidement. Je remercie Stéphane Lamassé d’avoir stimulé les quelques réflexions qui suivent.

* * *

Comme les historiens prouvent-t-ils ce qu’ils affirment ? Il y a plusieurs réponses à cette question. Nous consultons des archives et lisons ce que l’on appelle de la littérature secondaire – c’est-à-dire ce que les autres historiens (et parfois, même, des chercheurs d’autres sciences humaines et sociales, si, si) ont déjà publié (livres, articles…) sur le sujet que nous traitons ou des sujets proches. Nous appuyons notre narration par des notes de bas de page où nous renvoyons à ces archives et cette littérature secondaire. Pour appuyer les documents et ouvrages ou articles cités en notes de bas de page, nous reportons des extraits, cités dans notre texte ou en résumons, plus ou moins rapidement, l’argumentaire ou les points les plus importants.

Dans Douze leçons pour l’histoire, Antoine Prost rappelle à quel point la référence (aux sources primaires et secondaires) est constitutive de la méthodologie historienne : la référence permet de donner au lecteur les moyens de vérifier ce qui est affirmé par l’auteur. Le problème est que, dans les faits, la citation en note de bas de page n’est pas aussi opérante qu’on ne le voudrait. Qui ira à Berlin, Hanovre, Munich, Freiburg am Breisgau, Genève, Bâle, Paris vérifier les archives que j’ai consultées pour ma thèse ? Qui lira les 400 publications citées dans ma bibliographie ? Personne ne pourra refaire ce travail. En résulte quelque chose qui, pour ce qui est appelé « science » – les sciences historiques -, est difficile à concevoir : il y a obligation de faire confiance à l’auteur. L’auteur lui-même fait confiance à sa propre intuition.

Jean-Philippe Genet a rappelé mercredi dernier que paraphraser le document, et, au-delà, considérer l’historien comme médiateur entre l’archive et le lecteur, était une pratique qui, avec l’ère numérique, la numérisation massive d’archives et leur mise en réseau, arrivait à son terme. En effet, pourquoi résumer longuement un document quand on peut renvoyer directement le lecteur à l’archive en question, publiée en ligne ? [1] En outre, la pratique de la citation, est très contestable. Potentiellement, citer un extrait de document n’a aucune valeurs de preuve : l’auteur choisit son extrait, celui qui lui convient pour appuyer son raisonnement, sans que ses lecteurs ne puissent savoir si d’autres passages du document cité contredisent l’argumentaire déployé.

* * *

Si l’extrait, la citation ne sont plus des modes d’administration de la preuve, quelles sont les pistes en sciences historiques pour les remplacer ?

La première piste c’est l’hyperlien. L’hypertexte, appliqué aux sciences humaines et sociales, peut donner à la référence bibliographique en note de bas de page son plein potentiel.

Une seconde piste nous est fournie par la notion de reproductibilité de la recherche. Si l’on suit Karl Popper, une science est science car elle est réfutable. Ici, refutable s’entend comme une démarche pour reproduire une recherche déjà effectuée, ce qui ouvre la possibilité de montrer que les résultats de cette recherche sont, éventuellement, faux. D’où l’idée de recherche reproductible appliquée à l’histoire. Nicole Dufournaud à Blois (et ailleurs) l’a évoquée l’année dernière.

Une recherche reproductible en histoire à l’ère numérique impliquerait un travail très important de constitution d’un corpus (mettre à disposition les données de sa recherche) et de documentation sur ce corpus, sa mise en place et son exploitation. L’historien, en plus d’être historien, deviendrait un gestionnaire de ses données (ou un chef d’équipe ou quelqu’un rompu à l’interdisciplinarité). Cela implique fatalement que l’historien améliore grandement son alphabétisation numérique et apprenne à travailler dans un cadre pluri-disciplinaire, comme l’ont rappelé d’ailleurs récemment Philippe Rygiel et Stéphane Lamassé [2].

Une seconde piste, me semble-t-il, est celle de la lecture distanciée, le distant reading de Moretti [3]). Publier en ligne ses sources et les documenter n’est pas suffisant, encore faut-il les lire. Pour cela, nous faisons appel à nos capacités de lecture durement et chèrement apprises depuis l’école primaire, mais elles peuvent (doivent, parfois, selon la taille du corpus) désormais être complétées par une lecture distante, à l’aide d’outils informatiques divers (logiciels type R, gephi, etc) reposant sur des théories issues des sciences sociales (l’analyse réseau par exemple), des statistiques (avec l’importance des analyses factorielles, soulignée par Jean-Philippe Genet ou dans le livre de Claire Lemercier et Claire Zalc [4]) ou du vivant notamment (Moretti utilise la théorie de l’évolution). Cette phase de lecture des sources, qui mène à leur interprétation, doit, là-aussi, être documentée et les données qui en découlent publiées. Pour l’analyse de texte, par exemple, selon que l’on utilise iRaMuTeQ, Voyant tools ou MALLET, les résultats obtenus ne seront pas nécessairement identiques. Le choix du logiciel et les choix implicites du logiciel doivent être explicités.

Une troisième piste est à trouver du côté de la narration, du récit de l’histoire reconstitué par les chercheurs. C’est une extension des deux premières pistes : mettre en ligne ses sources ne suffit pas, encore faut-il les interpréter puis les organiser dans un récit de l’histoire.

Ce point est peut-être le plus délicat. Il s’agit d’articuler une narration historienne avec des documents publiés en ligne, dans un cadre qui ne peut vraisemblablement plus être le livre tel qu’on le connaît, mais un livre en réseau, éventuellement articulé entre numérique et papier, dont la narration est in fine plus complexe que le format contraint, rodé, maitrisé du livre papier.

La narration de l’histoire à l’ère numérique englobe, donne une cohérence et met en réseau le corpus de sources (primaires comme secondaires), les outils pour l’exploiter et le récit historien lui même. Un exemple canonique de cette narration est le projet Valley of the shadow [5]) dans le domaine de la public history.

Cette narration ne fait pas que modifier l’administration de la preuve, mais aussi les relations auteur-lecteurs. Ces derniers choisissent le chemin qu’ils souhaitent parcourir au sein de l’œuvre qu’ils lisent. Certes, le lecteur pouvait faire un choix aussi avec le livre traditionnel (ne lire que certains chapitres par exemple), mais cette possibilité est décuplée à l’ère numérique. De plus, comme l’ont expliqué Marin Dacos et Pierre Mounier((Mounier, Pierre, Dacos, Marin, Read, Write, Book, OpenEdition, 2010)), le lecteur peut devenir auteur d’un livre, de dernier devenant inscriptible, notamment par les possibilités participatives qu’offrent certaines technologies mais aussi par la possibilité que l’auteur peut offrir au lecteur de lui-même opérer une lecture distanciée en fournissant un accès aux outils adéquats.

Notes
[1] Cela fait penser, d’une certaine manière à André Breton qui a remplacé les longues descriptions par des prises de vue photographiques : pourquoi perdre son temps à décrire ce qui est saisissable par l’appareil photo ?
[2] Lamassé, Stéphane, et Rygiel, Philippe, « Nouvelles frontières de l’historien », Sciences/Lettres, 2013
[3] Voir Moretti, Franco, Graphs, Maps, Trees : Abstract Models for Literary History (Verso, 2007
[4] Méthodes quantitatives pour l’historien, La Découverte, 2008.
[5] Voir Serge Noiret, « Digital History 2.0″, dans Clavert, Frederic, et Noiret, Serge, L’histoire contemporaine à l’ère numérique / Contemporary History in the Digital Age (Bruxelles : P.I.E.-Peter Lang S.A, 2013