Présentation du Corpus 14


Historique

Le projet « Corpus 14 » est né de la conjonction d’un manque et d’une opportunité. Un manque : le déficit de ressources sur l’histoire du français écrit peu lettré ; une opportunité : le Centenaire, en 2014, de la Grande Guerre, qui a engagé les Français à exhumer les écrits de leurs aïeux et à les confier aux Archives publiques.

Rendus très peu visibles par les politiques éditoriales, qui opèrent un lissage orthographique et syntaxique, les écrits « peu-lettrés » antérieurs à l’ère numérique sont mal connus et n’avaient pas antérieurement donné lieu à constitution de corpus spécifique au sein de la communauté universitaire française. Or avec la Grande Guerre, les soldats et leur famille, formés à l’école de la Troisième République, sont entrés dans l’écrit : cette période représente un moment fort de la production écrite populaire.

Objectifs

Ces documents apportent des informations sur l’accès à l’écrit, sur la variation linguistique, sur le vécu des soldats, leur moral, la sphère de l’intime, le genre épistolaire, plus généralement sur le rapport de citoyens ordinaires à la langue, à la guerre et à leur pays. Ils constituent un matériau inédit pour les études linguistiques, didactiques, littéraires, historiques, politiques. Participant à l’élaboration d’une histoire populaire, ils contribuent à la compréhension des sociétés contemporaines.

Constitué, pour sa première version, essentiellement de correspondances d’origine héraultaise, le corpus s’enrichit actuellement de nouveaux fonds, issus des archives d’autres régions et pays.

Soutiens

Le laboratoire PRAXILING (Université Paul-Valéry Montpellier, CNRS – UMR 5267) accompagne, depuis janvier 2013, les étapes qui jalonnent la construction de Corpus 14.

Les documents ont été mis à disposition par les Archives départementales de l’Ain, de l’Hérault et par les familles qui en sont les dépositaires.

Le projet a bénéficié de l’assistance de l’équipe TXM (Laboratoire ICAR – CNRS), dirigée par Serge Heiden, pour l’encodage du corpus, réalisé suivant la norme TEI, et les traitements textométriques.

L’hébergement des images et transcription a été mis en œuvre par l’équipement d’excellence ORTOLANG (Laboratoire ATILF – CNRS).

L’hébergement des transcriptions et du traitement textométrique est assuré par l’Université Paul‑Valéry Montpellier.

Le projet « Corpus 14 » a obtenu en 2013 le label de la Mission Centenaire. Il est subventionné par la Mission Centenaire, le Conseil scientifique de l’Université Paul-Valéry Montpellier, l’Institut de Linguistique Française (CNRS), porteur du consortium Corpus Écrits, la Délégation Générale à la Langue française et aux Langues de France.

Il est associé au projet international « Sprachpraktiken/Pratiques de l’écrit », porté par Sybille Grosse (Université de Heidelberg) et Agnès Steuckardt (Université Paul-Valéry Montpellier), et subventionné par l’Université de Heidelberg.