[retour à un affichage normal]

2. MODE D’EMPLOI

SOMMAIRE DE CETTE PAGE

Définition des Mazarinades dans ce corpus

Le terme « Mazarinades » désigne, dans ce corpus, tout ce qui a été jusqu’à présent nommé « Mazarinades », sans entrer dans le débat définitionnel. Sauf par leur production dans une période vaguement limitée à la Fronde (1648-1653), les Mazarinades ne forment pas un ensemble de documents homogène, appartenant tous par exemple à un auteur, un genre littéraire ou un groupe professionnel. Un certain intérêt porté à des auteurs (Retz, Scarron, Sarasin, etc.) et des sélections de pièces burlesques ont pu laisser croire qu’il s’agissait d’œuvres éminemment littéraires. Il faut dire précisément que ces pièces mises en valeur depuis le 18e siècle ne représentent qu’une infime partie des Mazarinades. Comme on le vérifiera dans ce corpus, il s’agit d’abord d’une foisonnante diversité de documents, parfois décourageante. C’est précisément cette extrême diversité dans un ensemble volumineux qui présente un intérêt que n’offrent pas les œuvres, fussent-elles intégrales, de tel ou tel auteur, de telle ou telle corporation. Les outils que nous proposons permettent d’organiser des regroupements, des parcours, des prélèvements dans ce vaste ensemble presque toujours à la fois rhétorique, politique, polémique, poétique et parodique. C’est du bon usage de ces outils qu’il est ci-dessous question. []

Les entrées ménagées dans le corpus en ligne

♦ L’accès public à notre corpus de Mazarinades – textes transcris et images des pages – est ouvert depuis mars 2011. Deux principales voies sont proposées au public à partir de la colonne de gauche :

  • RECHERCHE : la recherche lexicale dans le corpus entier (ou réduit selon différents critères)
  • CATALOGUE : la recherche dans le catalogue

♦ Voir ci-dessous, les méthodes de recherche pour chaque voie.

♦ Outre ces accès publics à des extraits et à des notices, les chercheurs peuvent disposer, sur simple demande, d’un accès personnel à l’intégralité des textes, que ce soit pour leurs recherches personnelles ou pour participer à l’édition scientifique en ligne des pièces (sur simple demande adressée à « webmestre » @ « mazarinades.net », sans guillemets ni espaces). []

Liste des métadonnées du corpus, ou critères

On appelle métadonnée une information qui, appartenant au texte original ou ajoutée par la suite, permet de le structurer intérieurement ou au sein d’un ensemble de documents. Le titre d’un texte ou sa date de publication, indiqués sur sa couverture, sont des métadonnées courantes. Les numéros de page, considérés comme des métadonnées, permettent à un programme informatique de donner accès à chaque page. La langue du texte, rarement indiquée dans le texte lui-même, est une métadonnée que l’on peut ajouter si elle est pertinente (s’il y a d’autres langues dans le corpus considéré). La cote dans une bibliothèque ou le genre sont également des métadonnées utiles, etc.
Les métadonnées sont également considérées comme des critères de classement et d’indexation.

Voici la liste des métadonnées définies pour le corpus des Mazarinades. Les critères 1 à 6 sont généralement présents dans le document lui-même, les critères suivants ont été ajoutés :

  1. Titre de la pièce (en italiques).
  2. Auteur : nom et prénom, titre, surnom, initiales, ou « Anonyme ». Un nom suivi de la mention [?] signifie que le nom est absent du document mais qu’il peut être déduit ou réputé. Sont également possibles les mentions [faux] ou [parti], indiquant respectivement que la pièce n’a pas été écrite par l’auteur mentionné, ou qu’elle a été écrite par une personne de son entourage.
  3. Date : en chiffres, ou la mention [s. d.], « sans date ». Une date suivie de la mention [?] signifie que la date est absente du document mais qu’elle peut être déduite ou réputée.
  4. Imprimeur (terme préféré à « éditeur ») : nom selon la normalisation dans la liste des imprimeurs, ou [s. n.], « sans nom d’imprimeur ». La mention [?] est possible.
  5. Lieu de publication : nom de la ville ou [s. l.], « sans lieu de publication ». La mention [?] est également possible.
  6. Nombre de pages : en chiffres.
  7. Langue : une ou plusieurs peuvent être mentionnées.
  8. Note : informations sur l’édition, comme « Avec permission », « date au colophon », ou la référence à une autre pièce du corpus qui en est un double ou une autre partie, etc.
  9. Genre : lettre, harangue, vers, burlesque… Une liste normalisée des genres est en préparation.
  10. Référence RIM : issue du classement numéroté dans la Bibliographie des Mazarinades de Célestin Moreau, cette référence a été étendue et normalisée (voir explication ici).
  11. Cote locale : il s’agit de la cote de la pièce dans son lieu de conservation (par exemple à l’Université de Tokyo pour la collection initialement numérisée pour ce corpus).
  12. Date et heure de dernière modification du document xml en ligne.
  13. Date et heure de création du document xml. []

RECHERCHE lexicale : fonctions et outils, avec exemples

Voir aussi les « recommandations pour la recherche »
vers le bas de la page d’accueil des recherches.

Les résultats de recherche sont donnés dans l’ordre alphabétique des auteurs, sous forme de blocs numérotés contenant références, extrait de texte et liens utiles (un lien pour voir la page entière, texte et image ; un lien pour accéder à la notice de la pièce dans le catalogue) .

♦ RECHERCHE SIMPLE (un mot ou un groupe de lettres) :

Ouvrir la page RECHERCHE et taper un mot ou un groupe de lettres dans la fenêtre de recherche, puis cliquer sur « Lancer la recherche ». Exemples :

  • reine :
    On en trouvera 1764 occurrences, ce qui donnera déjà beaucoup à lire si l’on veut parcourir les 18 longues pages de résultats : extraits 1 à 25 dans la première page, puis de 26 à 200 dans la deuxième page, puis 100 extraits dans chaque page suivante.
    Chaque extrait (occurrence ou contexte) commence par ses références dans le corpus : nom d’auteur, titre de la pièce, date, imprimeur, lieu, nombre de pages, etc. donne accès à la page d’où il provient, en cliquant sur « Afficher la page ». Possibilité alors de visionner l’image du document original. Il est bien possible qu’une étude approfondie de ce seul vocable bouscule quelque peu le sens qui lui était jusqu’alors attribué.
  • reines : Bien sûr, le mot existe aussi au pluriel, même s’il n’y a que 34 occurrences de reines.
  • reyne et autres : car l’orthographe de l’époque était multiple et incertaine ; donc reyne (4149 occ.) et reynes (109 occ.), mais aussi royne (165 occ.) et roynes (5 occ.), voire roine (4 occ.) et roines (théoriquement, puisqu’on n’en trouve aucune occurrence).

L’emploi de lettre en majuscule permet de rassembler les orthographes accentuées et non-accentuées, avec ou sans cédille pour le « c ». On voit ainsi la différence entre les requêtes lumiere (662 occ.) et lumiEre (664 occ.) : deux occurrences du mot sont accentuées, sous la forme lumiére… avec un accent aigu.
Constatation identique sur l’orthographe avec les requêtes savoir (1 occ.), sçavoir (94 occ.), scavoir (7 occ.) et sCavoir (101 occ.).

♦ RECHERCHE CUMULÉE (avec barre verticale entre des mots) :

Pour rassembler ces différentes orthographes dans une seule requête, il existe un élément syntaxique simple : reine|reyne|royne|roine (où se rassemblent les 6080 occ. prévues), ainsi qu’au pluriel : reines|reynes|roynes (154 occ.), ou bien toutes ensemble :  reine|reyne|royne|roine|reines|reynes|roynes (6234 occ.).

Cette barre verticale (touches AtlGr + 6) peut aussi servir à rassembler les occurrences de plusieurs mots, comme noir et blanc : noir|blanc (343 occ.). Mais cela ne signifie pas que les deux mots se trouvent ensemble dans chaque extrait de texte ; pour la co-occurrence, voir plus bas.

♦ RECHERCHE AVEC 1 LETTRE LIBRE (avec point + point d’interrogation, ou point seul) :

Le point seul remplace un caractère quelconque (il est également possible d’utiliser plusieurs points).
Le point + point d’interrogation remplace un caractère quelconque ou rien.

  • La recherche, ou requête, a.enir ou a.?enir (142 occ.) permet de rassembler les occurrences des formes avenir et auenir, concurrentes dans les textes de l’époque. Et ce, sans ambiguïté, parce qu’il n’y a pas d’autre lettre possible que « u » et « v » et qu’il n’y a pas de forme aenir.
    La requête frai.? (312 occ.) rassemble bien les formes fraiz et frais, ce qui peut avoir son intérêt, mais elle inclut également les formes frai et frain, peu pertinentes. On préférera la syntaxe frais|fraiz|frai, qui exclut la quatrième forme.
  • La requête so..erain permet ainsi de rechercher toutes les occurrences du mot souverain, quels que soient les emplois de « u » et « v ».
  • À propos du trône, l’orthographe dans les textes est très variable : trone (24 occ.), throne (32 occ.), throsne (365 occ.), trosne (224 occ.), trône (138 occ.)… La requête t.?rO.?ne (1037 occ.) doit les rassembler toutes. Explication : {« t.?r » = occurrences avec ou sans « h »} + {« O » = occurrences avec ou sans accent circonflexe} + {« .?ne » = occurrences avec ou sans « s »}.
  • Placé en fin d’expression, l’élément syntaxique peut permettre de grouper le singulier et le pluriel d’un mot, quand il est marqué par un « s » final. Sur le thème du blé, par exemple, il faut rechercher blé et blés par la requête blé.? (53 occ.), mais aussi bled.? (443 occ.) qui regroupe bled et bleds.
    Les éléments syntaxiques peuvent également être combinés : blé.?|bled.? (496 occ.).
  • Exercice mental et logique avec l’État, pour réviser ce qui vient d’être exposé :
    – etat = 83 occ. (tel quel)
    Etat = 122 occ. (avec ou sans accent aigu)
    – e.tat = 13261 occ. (avec une autre lettre intérieure)
    – e.?tat = 13344 occ. (requête incluant etat et e.tat)
    – E.?tat = 13384 occ. (requête incluant les quatre précédentes).
    – E.?tat.? = 16370 occ. (avec la possibilité du pluriel).

Deux lettres entre crochets, séparées par un tiret, peuvent être utilisées pour remplacer n’importe quelle lettre de la série qui les sépare dans l’ordre alphabétique.

  • La syntaxe sal[u-v]t (1324 occ.) permet de rechercher à l’emplacement désigné toutes les lettres de l’alphabet entre « u » et « v », elles-mêmes comprises. Comme il n’y a qu’elles deux, la requête est limitée à sa stricte nécessité (alors qu’un point seul aurait permis n’importe quelle autre lettre).
  • Cette syntaxe sera utile pour tous les cas d’ambivalence u/v, même redoublée, comme c’est le cas avec « univers » : [u-v]ni[u-v]ers (691 occ.), et ses dérivés universel, universelle, etc. : [u-v]ni[u-v]ers.* (1540 occ.).
  • La recherche du « jeu » ou des « jeux », dans tous ses sens, peut s’effectuer en une seule requête grâce à l’expression complexe : [i-j]oUE.*|[i-j]eu.? (1394 occ.). Elle rassemble, d’une part, toutes les formes du verbe jouer, orthographié iouer, ioüer, ainsi que ses dérivés jouet, joueur, etc., et d’autre part, les formes du substantif jeu(x) dans ses différentes orthographes (la rédaction de la requête suppose toutefois que l’on ait connaissance de ces diverses orthographes).

♦ RECHERCHE AVEC TRONCATURE (avec point + astérisque) :

  • La requête arrest.* (6287 occ.) rassemble tous les mots commençant par ces lettres, quel que soit le nombre de lettres qui les suivent ; dans les résultats, le substantif arrest (un Arrêt, ou un Arrêté, document officiel) et les formes du verbe arrester, avec le sens de décider (l’absence du « s » intérieur n’est attestée que par 5 occurrences de la forme arret(s), sans accent circonflexe).
    Dans toutes ces occurrences, aucune arrestation policière : le mot n’existe pas encore !
  • S’intéresser à la notion du public, du bien public ou des affaires publiques requiert la combinaison d’éléments syntaxiques. Logiquement, la requête public.?|publique.? (5257 occ.) s’impose. Mais c’est sans compter l’orthographe publicque. La meilleure requête est donc : public.*|publique.? (5554 occ., soit près de 300 occurrences supplémentaires).

Nota Bene : La troncature fonctionne uniquement en fin de groupe de lettres.

♦ LIMITATION DES RÉSULTATS DE RECHERCHE

Après le choix d’une expression à rechercher et avant de lancer la recherche, il est possible de limiter le volume du corpus dans lequel la recherche doit s’effectuer. Les critères proposés dans Bibliographie, sous la fenêtre d’entrée des expressions, permettent de cibler une sous-partie du corpus global des Mazarinades par : le nom d’imprimeur, d’auteur, le lieu ou la date de publication, les références Moreau, le titre ou certains mots du titre (si ces informations sont connues du chercheur).

  •  La requête public.*|publique.?, limitée à l’année 1652 permettra ainsi de ne consulter que 1833 occurrences (au lieu des 5554 occ. vues ci-dessus).
  • La requête arrest.*, limitée à Retz (ou Gondi), recevra seulement les 58 occurrences de cet auteur.

♦ RECHERCHE DE CO-OCCURRENCES (avec espace entre deux formes) :

Dans la fenêtre de recherche, il est possible d’écrire deux mots ou expressions séparés par un espace, comme « pain vin », « blanc noir », etc. Dans les critères de Contexte, juste au-dessous de la fenêtre de recherche, il faut choisir la distance textuelle entre les deux termes en cochant : même expression (par défaut), séparés par un nombre de mots à inscrire (10 ou 20 par exemple), dans la même phrase ou dans le même paragraphe (selon les critères syntaxiques et grammaticaux de l’époque).

  • Reine & roi :
    Une expression comme reine.?|reyne.?|royne.? roi.?|roy.? permet de rechercher les co-occurrences de toutes les orthographes de reine et de roi.
    – dans la même expression, il n’y a qu’une co-occurrence ;
    séparés par 5 mots (au plus), il y a 182 co-occurrences ;
    séparés par 10 mots (au plus), il y a 330 co-occurrences ;
    séparés par 20 mots (au plus), il y a 615 co-occurrences ;
    dans la même phrase, 4092 co-occurrences ;
    dans le même paragraphe, 14998 co-occurrences – avec parfois une grande distance entre les deux termes et une forte proportion de redondance… Il convient de faire différents essais de distance textuelle pour trouver la réponse pertinente selon le questionnement du chercheur, par exemple :
    – recherche dans la même phrase et limitée aux textes attribués à Paul de Gondi, cardinal de Retz : 37 co-occurrences.
  • Prince(s) & prison : la prison des princes étant un événement important de la Fronde.
    – L’expression prince.? prison permet d’en trouver 262 co-occurrences dans la même phrase ;
    – L’expression prince.? .?.?prison.*, avec 940 co-occurrences dans la même phrase, permet d’inclure les mots emprisonnement ou prisonnier, par exemple.
    – Pour la même expression, il y a 123 co-occurrences séparées par 10 mots au maximum.
    – Que l’on peut par exemple réduire à 20 co-occurrences pour l’année 1651. []

CATALOGUE : navigation et fonctions de recherche

Ouvrir la page CATALOGUE par le lien de la colonne de gauche. Le haut de la page contient les outils de recherche simple (par titre et auteur), le lien vers la recherche avancée et, au-dessous, le début du catalogue complet des 2709 pièces du corpus, dans l’ordre alphabétique des titres.

INDEXATION & RÉINDEXATION :
– L’ensemble du catalogue (ou un sous-ensemble quelconque obtenu après une recherche) peut être réindexé en cliquant sur l’un ou l’autre des critères listés dans la ligne « Trier par » : Titre, Date de publication, Auteur, Imprimeur, date de dernière modification, Référence Moreau et Cote locale (Tokyo en l’occurrence).
– En cliquant une nouvelle fois sur le même critère, l’indexation est présentée dans l’ordre inverse.

RECHERCHE & RECHERCHE AVANCÉE :
– Un titre ou un nom entier, un groupe de lettres peuvent être utilisés pour effectuer une recherche selon l’un des critères proposés.
– Plusieurs critères peuvent être essayés simultanément.

NOTICES :
– Tout titre de pièce peut être sélectionné pour accéder à la notice.
– Chaque notice contient toutes les informations disponibles sur la pièce en quatre zones :
——- Haut-gauche : les informations éditoriales conventionnelles ;
——- Haut-centre : les informations qui concernent la version numérique ;
——- Bas-gauche : la zone de commentaires sur la pièce. À la notice Moreau, lorsqu’il y en a une, viennent éventuellement s’ajouter divers commentaires provenant d’ouvrages scientifiques, de l’éditeur scientifique de la pièce ou d’autres chercheurs.
——- Bas-droit : l’image réduite de la page de titre de la pièce.
– En haut et à droite, un lien permet d’accéder au texte intégral de la pièce (réservé aux  utilisateurs autorisés, inscription sur simple demande). []

Quelques chiffres sur le corpus en ligne

♦ Le corpus texte & image du Projet Mazarinades accueille et donne accès à l’ensemble des textes et des images des pages de 2709 pièces datant des années 1648-1653 et formant la collection dite de Tokyo (voir détails ici ou écouter là). L’objectif est, d’ici quelques années et grâce aux partenariats entre l’équipe des RIM, des bibliothèques disposant d’importants fonds et d’autres partenaires universitaires, de présenter en ligne un corpus d’environ 5000 pièces.

♦ L’ensemble de ces 2709 pièces totalise à peu près 50.000.000 de caractères (50 millions, et le double en comptant la version moderne des textes, disponible pour les utilisateurs autorisés) qui forment plus de 7 millions de mots, dont 137.000 mots uniques environ, provenant de plus de 34.000 images de pages. []

Principales disciplines concernées

Les recherches permises dans une telle quantité de textes par les fonctions du moteur de recherche et du catalogue sont très nombreuses et peuvent aider à répondre à des questionnements ou servir à des études dans un grand nombre de disciplines.
Voici les disciplines qui nous semblent directement concernées, notamment pour la France et la langue française :

  • l’histoire,
  • l’histoire sociale,
  • l’histoire politique,
  • l’histoire religieuse,
  • l’histoire militaire,
  • l’histoire administrative,
  • l’histoire du droit et du droit institutionnel,
  • l’histoire des idées,
  • l’histoire de l’édition,
  • l’histoire de la langue,
  • la philologie,
  • l’archivistique,
  • la diplomatique,
  • la codicologie,
  • la lexicologie,
  • la linguistique,
  • la littérature,
  • la géographie,
  • l’économie,
  • la médiologie,
  • l’histoire de l’environnement et du climat,
  • l’histoire de la médecine. []