pierre a écrit:Re,
Fâché avec les accents circonflexes - à regarder aussi.
Et avec beaucoup d'autres choses, sinon je ne me serais pas penché sur le problème de la construction de ces dicos.
Je vais mettre aujourd'hui encore ma version des fichiers fr-FR.dic et fr-FR.aff sur le site de Rocky2, comme cela vous en profiterez et je ne serai plus le seul couillon à me taper les tests.En gros, j'ai repris les dicos partiels * de 1999, faisant partie du dico créé par Christophe Pythoud lors d'un travail de fin d'études à l'université de Lausanne (corrigé). J'ai vérifié ces dicos un par un et je les ai fusionnés.
J'ai comparé cela aux dicos fr.dic et fr-FR.dic que l'on nous propose.
J'y ai retrouvé les même erreurs que dans les dico partiels, plus un tas d'autres ajoutées au fil des ans, dont des dérivations de mots aberrantes (-> mots qui n'existent pas en français), mots à soixante-quinze présents alors que des mots comme "télécharger" sont absents.
J'ai donc corrigé tout cela, amélioré l'utilisation des règles d'affixes (certaines n'étaient pas du tout utilisées).
Finalement, j'obtiens un dictionnaire plus puissant, plus correct et pourtant moins volumineux.
Je pense que je vais réserver provisoirement ce dico amélioré à mon cercle de connaissances. Pourquoi ? Parce que je suis les discussions sur Geckozone à propos de ces dicos et que c'est un vrai foutoir. Je n'ai même plus envie de participer.
Tout le monde se plaint des dicos pour Thunderbird mais personne ne songe à coordonner le travail des "développeurs" des dictionnaires. Les dicos de TB s'installent difficilement et maintenant leur emplacement a encore changé sans que cela ne soit signalé. Bref, chacun crée des fichiers xpi d'installation à sa manière (ce qui n'est pas difficile) sans veiller à une certaine standardisation.
Maintenant quand on cherche les dicos de langues on arrive sur une seule page où tous sont repris sans un mot d'explication. Là on régresse franchement par rapport à la situation de l'année dernière.
Comme je l'ai déjà dit , c'est une honte que des dicos pratiquement identiques se retrouvent à quatre emplacements différents au minimum si on les utilise dans OOo, FF, TB et Nvu. Mettre ces dictionnaires dans un dossier unique utilisé par ces quatre applications, cela serait tellement simple que personne parmi ces brillants développeurs n'y a songé.
Dans OOo, ce sont fr_FR.dic et fr_FR.aff placés dans un sous-dossier du programme (pas facile à dégotter mais c'est un moindre mal) :
"L:\Program Files\OpenOffice.org 2.2\share\dict\ooo"
Dans Firefox, fr-FR.dic et fr-FR.aff sont dans mon
profil Mozilla
"L:\Documents and Settings\Anonyme\Application Data\Mozilla\Firefox\Profiles\lq1w5ix4.default\extensions\fr-FR@dictionaries.addons.mozilla.org\dictionaries"
Dans Thunderbird, ils étaient dans le programme
"L:\Program Files\Mozilla Thunderbird\components\myspell"
Maintenant, depuis le passage à la version 2.0.0.0 ils sont aussi dans mon
profil Thunderbird
"L:\Documents and Settings\Anonyme\Application Data\Thunderbird\Profiles\7gjhmpm2.default\extensions\fr-FR@dictionaries.addons.mozilla.org"
On a calqué l'installation sur celle pour FF, alors qu'il aurait été plus intelligent de faire l'inverse c.à.d sortir le dico principal du profil de FF pour le mettre dans le programme!
Dans Nvu, ils sont dans un sous-dossier du programme :
"L:\Program Files\Nvu\components\myspell"
* Ces dicos partiels sont encore disponibles dans une archive
Francais-GUTenberg-v1.0.tar.gz, que j'ai conservée précieusement comme pièce à conviction. Tous ces fichiers sont datés de 1998 à 1999.
Un truc : où sont les mots que l'on ajoute au dictionnaire (notre dico perso ?) Ce sont des choses que l'on pourrait t'envoyer.
Je pense que je devrais plutôt vous envoyer un extrait du mien reprenant 330 mots courants contenant œ, une ligature que je n'arrive pas à faire prendre en compte (alors que æ est accepté. Problème de code ASCII/ANSI/ISO8859-15 ???)
Dans Firefox, Thunderbird et Nvu, les dicos personnels sont des fichiers persdict.dat cachés dans le profil de chaque utilisateur. Ça c'est logique, puisque chaque utilisateur n'a pas besoin des mêmes personnalisations.
"L:\Documents and Settings\Anonyme\Application Data\Mozilla\Firefox\Profiles\lq1w5ix4.default\persdict.dat"
"L:\Documents and Settings\Anonyme\Application Data\Thunderbird\Profiles\7gjhmpm2.default\persdict.dat"
"L:\Documents and Settings\Anonyme\Application Data\Nvu\Profiles\t4tzw6l7.default\persdict.dat"
Ce sont des fichiers texte que vous pouvez éditer avec le bête bloc-notes à défaut de mieux.
Pour OOo c'est un peu plus compliqué, mais plus intelligent :
vos dicos personnels sont regroupés dans un dossier user\wordbook du profil utilisateur.
L:\Documents and Settings\Anonyme\Application Data\OpenOffice.org2\user\wordbook
standard.dic est le dico personnel par défaut, mais vous pouvez en créer d'autres (j'en ai 7 en tout) et les activer/désactiver dans les options linguistiques. C'est là aussi que vous pouvez les modifier, parce que ce sont des fichiers non éditables directement (ces fichiers contiennent WBSWG6 tout au début).
Je n'avais pas encore épluché les fichiers prefs.js et les fichiers ini de toutes les applications concernées !
L:\Documents and Settings\Anonyme\Application Data\Thunderbird\Profiles\7gjhmpm2.default\extensions.ini
L:\Documents and Settings\Anonyme\Application Data\Thunderbird\Profiles\7gjhmpm2.default\prefs.js
Là, une seule mention de dictionnaire dans la ligne : user_pref("spellchecker.dictionary", "fr-FR");
C'est dans extensions.ini que l'on trouve les chemins des dicos utilisés par TB :
L:\Documents and Settings\Anonyme\Application Data\Thunderbird\Profiles\7gjhmpm2.default\extensions.ini
[ExtensionDirs]
Extension0=L:\Documents and Settings\Anonyme\Application Data\Thunderbird\Profiles\7gjhmpm2.default\extensions\fr-FR@dictionaries.addons.mozilla.org
Idem pour FF, les chemins des dicos sont dans
L:\Documents and Settings\Anonyme\Application Data\Mozilla\Firefox\Profiles\lq1w5ix4.default\extensions.ini
Tiens, j'ai encore appris quelque chose d'intéressant aujourd'hui.
J'ai aussi constaté et ça c'est moins beau, que les fichiers prefs.js contiennent pas mal d'entrées obsolètes (des lignes concernant des extensions que j'ai testées et désinstallées aussitôt).
Libre et open source seraient-ils synonymes de große pagaille ? Je commence à le penser sérieusement, puisqu'il n'y a pas qu'un seul pilote à bord. Cela me fait penser aux voitures dans les carrousels où chaque bambin a son volant, pour ne pas faire de jaloux.
@+