Un trésor inépuisable

Répondre
jarnicoton
Messages : 1265
Inscription : mar. 11 sept. 2012, 9:16

Un trésor inépuisable

Message par jarnicoton »

Avez-vous déjà exploré les possibilités du logiciel en ligne "Google Ngram viewer" ?
Je crois qu'il n'y a pas de limite à ce qu'on peut inventer comme recherches à faire avec sur l'utilisation historique des mots, des expressions, relier le tout aux circonstances...
Avatar de l’utilisateur
TSOS
Messages : 519
Inscription : ven. 04 févr. 2011, 13:22
Localisation : Duché de Bretagne / Nordrhein Westfalen /S'la,sk

Message par TSOS »

Sauf que cet outil n'utilise qu'un corpus limité d'ouvrages (première limite) et que la numérisation des mots pour les entrer dans la base de données peut être automatique sous certaines conditions mais également parfois manuelle pour les mots moins lisibles si la qualité du "scan" est mauvaise.
Malheureusement, c'est à des volontaires (plus ou moins) que google fait appelle pour déchiffrer ces mots-ci, et certains esprits malicieux s'amusent régulièrement à fausser les résultats en entrant des mots au hasard, ce qui associe un mauvais mot (souvent injurieux) au texte (seconde limite).

Si l'on excepte ces limites, l'outil est très intéressant, cependant!
Avatar de l’utilisateur
Yeva Agetuya
Messages : 2962
Inscription : lun. 22 juin 2015, 1:43

Re: Un trésor inépuisable

Message par Yeva Agetuya »

À propos de scan, j'entre dans Google "monistère" en faisant une faute de frappe et je tombe là-dessus :

https://justice.public.lu/content/dam/j ... macher.pdf

Je me demande où ils recrutent leurs greffes. Même le scaneur ne s'y retrouve pas :

à la date de vingt pecillez 1873, intervence dans le cause. entre le Monistère reeblie, comme appelant, et le sit. Yules Schumacher, comme intimé, lequel

https://www.google.com/search?sca_esv=f ... 6&dpr=1.25
Avatar de l’utilisateur
Leclerc92
Messages : 7174
Inscription : jeu. 29 nov. 2012, 17:06

Re: Un trésor inépuisable

Message par Leclerc92 »

Ça montre juste que malgré la belle écriture manuscrite du document original, les OCR (logiciels de reconnaissance de caractères) ont encore des progrès à faire. Peut-être est-ce une vieille version ?
Avatar de l’utilisateur
Yeva Agetuya
Messages : 2962
Inscription : lun. 22 juin 2015, 1:43

Re: Un trésor inépuisable

Message par Yeva Agetuya »

Belle écriture ? Il faut lire lentement pour la déchiffrer.
Avatar de l’utilisateur
Leclerc92
Messages : 7174
Inscription : jeu. 29 nov. 2012, 17:06

Re: Un trésor inépuisable

Message par Leclerc92 »

Comparée à la mienne, cette écriture me paraît très facilement lisible !
Répondre