Dictionnaire français amélioré pour Firefox 2.0 et plus

Modérateur: Modérateurs et Modératrices

Messagede Vazkor » 21 Juin 2007, 23:46

Salut,
nim-nim a écrit:Bonjour Vazkor,

Je viens de tomber sur ton projet en butinant sur un autre sujet.

Beaucoup de monde serait heureux de voir quelqu'un reprendre le dictionnaire français utilisé par toutes les applications libres, vu son état d'abandon actuel. Pour le moment il est de facto géré par l'équipe d'Openoffice.org qui n'a pas le temps de s'en occuper et refuse d'introduire les ligatures tant que leur application sera diffusée sur des plates-formes (vieilles versions de windows) où on ne peut pas les taper.

J'ai simplement en un an constaté que le dictionnaire utilisé est toujours celui du projet GUTenberg datant de 2001 et que si on on s'est occupé d'emballer le dictionnaire avec des fichier js et rdf, personne ne s'est inquiété du contenu du fichier dic et de l'utilisation correcte des affixes. Pourtant des milliers d'utilisateurs auraient dû s'étonner de voir soulignés en rouge des mots qui figurent au dictionnaire, mais avec des drapeaux incorrects, et de voir que des mots maintenant courants comme "télécharger, téléchargement, ..." ne sont pas repris.
Je ne jette nullement la pierre à Christophe Pythoud, parce que dans un fichier de 90000 lignes, des erreurs sont inévitables.
D'autre part, les buts du projets Gutenberg, scanner et corriger essentiellement les problèmes de reconnaissance OCR des livres tombés dans le domaine public (donc vieux de plus de 70 ans) ne correspondent pas à ceux des utilisateurs d'OpenOffice et des programmes Mozilla. D'où l'abondance de termes littéraires, rares, vieillis ou très techniques et la cruelle absence de mots que nous utilisons tous les jours. J'ai même retiré des mots complètement inconnus du TLFi.

Tu parles du problème des ligatures œ qui ne sont pas prises en compte. Il y a bien pire cependant ! Aucun mot composé n'est reconnu si tous ses éléments ne figurent pas au dictionnaire comme mot simple. Mais cela c'est dû aux programmes utilisés. Même si Hunspell est prometteur, il ne traitre pas le trait d'union autrement que comme séparateur.

Pour l'instant mon dictionnaire tient déjà très bien la route, mais j'y découvre encore des erreurs. Je suis maintenant occupé à vérifier l'utilisation des drapeaux p et q avec les verbes pronominaux à la 3ème personne. Cela concerne environ 8600 lemmes soit 10 % du dictionnaire. Avec cette révision, je devrais pouvoir ramener ce nombre à 2000 tout en éliminant un paquet d'erreurs, source de faux positifs.
Si tu es intéressé je peux essayer de pousser ton travail sous Fedora Linux (après on peut avoir un effet cascade sur Red Hat Linux, les autres variantes libres, OpenOffice.org, Firefox, etc). Ça ne demandrait pas beaucoup de travail de ta part (juste formaliser le nommage/l'url de ton .zip et y ajouter un fichier de license serieux), et aiderait beaucoup de pauvres francophones.

Sinon j'ai largement de quoi m'occuper ailleurs, et je n'ai pas l'intention de perdre mon temps à essayer de le faire sans toi.

Il est encore trop tôt pour mettre ce dictionnaire à la disposition de tous, parce que je n'arrête pas de le modifier.
La licence, je n'y attache aucune importance. Mon travail est Copyleft. Les gens d'OpenOffice pourront y mettre celle qu'ils veulent, le moment venu.

Mais je retiens ta proposition.

@+
Avatar de l’utilisateur
Vazkor
 
Messages: 9808
Inscription: 05 Nov 2002, 23:39
Localisation: Ans, BE

Messagede jpj » 22 Juin 2007, 10:14

Bonjour Vazkor,
Vazkor a écrit:La licence, je n'y attache aucune importance. Mon travail est Copyleft. Les gens d'OpenOffice pourront y mettre celle qu'ils veulent, le moment venu.
Il me semble, compte tenu du fait que la licence d'origine est GPL, qu'il faut obligatoirement conserver la même licence, et en respecter les termes (en ce sens, le "...tendant à protéger..." n'est pas possible dans le lisezmoi.txt). Bref, juridiquement, il n'est pas possible de passer le dictionnaire en Copyleft. Sur le fond, cela ne change rien: liberté d'utilisation, d'analyse et d'adaptation, de redistribution et d'amélioration et publication.

A+
Quand tout le reste a échoué, lisez le mode d'emploi.
Mes configs
Avatar de l’utilisateur
jpj
 
Messages: 1338
Inscription: 30 Juil 2005, 21:28
Localisation: France

Messagede nim-nim » 22 Juin 2007, 13:48

Vazkor a écrit:Pourtant des milliers d'utilisateurs auraient dû s'étonner de voir soulignés en rouge des mots qui figurent au dictionnaire, mais avec des drapeaux incorrects, et de voir que des mots maintenant courants comme "télécharger, téléchargement, ..." ne sont pas repris.


Les milliers d'utilisateurs (voire plus) s'étonnent mais la plupart n'ont pas le courage d'essayer de corriger le dictionnaire. Et en plus comme il n'y a personne pour coordonner les travaux de manière active, on est au point mort.

Vazkor a écrit:Tu parles du problème des ligatures œ qui ne sont pas prises en compte. Il y a bien pire cependant ! Aucun mot composé n'est reconnu si tous ses éléments ne figurent pas au dictionnaire comme mot simple.


Les ligatures m'irritent personnellement parce que j'ai œuvré pour ajouter un bon support de œ au claviers X11/Unix/Linux, et mes utilisateurs se font jeter par le dictionnaire quand ils les utilisent.

Vazkor a écrit:Mais cela c'est dû aux programmes utilisés. Même si Hunspell est prometteur, il ne traitre pas le trait d'union autrement que comme séparateur.


As-tu remonté le problème aux développeurs d'Hunspell (sinon je peux le faire)
Un autre anglicisme très irritant est le fait que l'apostrophe ne soit pas elle traitée comme un séparateur.

Vazkor a écrit:
Si tu es intéressé je peux essayer de pousser ton travail sous Fedora Linux (après on peut avoir un effet cascade sur Red Hat Linux, les autres variantes libres, OpenOffice.org, Firefox, etc). Ça ne demandrait pas beaucoup de travail de ta part (juste formaliser le nommage/l'url de ton .zip et y ajouter un fichier de license serieux), et aiderait beaucoup de pauvres francophones.

Sinon j'ai largement de quoi m'occuper ailleurs, et je n'ai pas l'intention de perdre mon temps à essayer de le faire sans toi.

Il est encore trop tôt pour mettre ce dictionnaire à la disposition de tous, parce que je n'arrête pas de le modifier.


C'est pas grave je gère déjà des projets qui sortent une version par mois (avec une béta une semaine avant). La fréquence de révision est accessoire, ce qui est important c'est avoir un formalisme stable dans les versions histoire de ne pas avoit à refaire la plomberie toute les semaines. Du moment que ton dictionnaire est au moins aussi bien que le dictionnaire actuel, il est diffusable.


Vazkor a écrit:La licence, je n'y attache aucune importance.


Vu que ton travail est dérivé d'un projet GPL il doit être GPL aussi (et pour des fichiers texte les obligations de la GPL sont trivialement remplies, on ne peut diffuser les fichiers sans leur source). Maintenant ton lisez-moi actuel bien qu'amusant sent le souffre. Comme les bénévoles comme moi ne veulent pas avoir d'ennui avec la justice, personne ne va diffuser ton travail dans ces conditions (c'est pas qu'on est des fans des licences, mais être réglo c'est aussi pouvoir se consacrer à autre chose)
Avatar de l’utilisateur
nim-nim
 
Messages: 9
Inscription: 21 Juin 2007, 18:27

Messagede Vazkor » 22 Juin 2007, 14:44

Salut,
Vu que ton travail est dérivé d'un projet GPL il doit être GPL aussi (et pour des fichiers texte les obligations de la GPL sont trivialement remplies, on ne peut diffuser les fichiers sans leur source). Maintenant ton lisez-moi actuel bien qu'amusant sent le souffre.


Comme mon travail est personnel, j'aurais surtout eu le droit de le garder pour moi et de n'en faire profiter personne. Alors il faut se calmer un peu.

A ce stade mon dictionnaire même s'il tient bien la route est encore loin de me satisfaire.
Cette nuit, je viens encore de virer plus de 7000 lemmes inutiles en appliquant mieux les règles d'affixes p et q aux verbes pronominaux des premier et deuxième groupes précédés de "s' " du coup mon dictionnaire passe de 88684 à la date du 13/06 à 81.440 lignes à la date du 22/06. Pour rappel, le dictionnaire d'origine datant de septembre 2003 comporte 92482 lignes.

Si j'ai mis le dictionnaire sur mon site, c'est pour que les membres d'Assite et de deux autres forums puissent déjà en profiter mais surtout en espérant avoir des retours d'expérience.
Je ne m'attendais pas à ce que Pierre Pinard le mette déjà à disposition sur son site.

Pour le problème de licence, va pour la licence GPL quand on pensera à une diffusion éventuelle de mon travail.
Mon "lisez-moi" sentait le souffre. Hé hé, cela ça me plaît assez parce que j'aime appeler un chat un chat.
Vous ne saurez de toute façon jamais ce que je pense du dictionnaire d'origine, de ceux qui l'ont recopié bêtement sans le vérifier et des discussions interminables sur Geckozone à propos de son installation sous Firefox et Thunderbird.

Juste au moment d'uploader la toute dernière version du dico sur mon site, je constate qu'il y a une ligne bouseux/S.
Une recherche sur x/S me montre qu'il y a treize cas semblables que je corrige et par curiosité je vérifie dans le fichier non_verbes.dico créé par Christophe Pythoud en 1999. Ces erreurs étaient déjà là!
Voilà la série complète : bouseux/S croix/S freux/S macareux/S manganeux/S mercureux/S motteux/S noix/S périgueux/S pucheux/S pyroligneux/S quadruplex/S sélénieux/S
En clair, on pouvait taper "croixs" - ce qui est une hérésie - sans que le vérificateur réagisse !

Comme les bénévoles comme moi ne veulent pas avoir d'ennui avec la justice, personne ne va diffuser ton travail dans ces conditions (c'est pas qu'on est des fans des licences, mais être réglo c'est aussi pouvoir se consacrer à autre chose)
Mais je n'ai demandé à personne de diffuser mon travail maintenant.
Je vais supprimer carrément mon fichier lisez-moi et ne plus fournir que les fichiers fr-FR.dic et fr-FR.aff, comme cela tout le monde sera content et cela sera bien plus facile pour moi de les tenir à jour.
Et pour la licence j'ai recopié le fichier d'origine en me contentant de corriger les fautes ...

@+
Avatar de l’utilisateur
Vazkor
 
Messages: 9808
Inscription: 05 Nov 2002, 23:39
Localisation: Ans, BE

Messagede nim-nim » 22 Juin 2007, 16:29

Vazkor a écrit:
Comme les bénévoles comme moi ne veulent pas avoir d'ennui avec la justice, personne ne va diffuser ton travail dans ces conditions (c'est pas qu'on est des fans des licences, mais être réglo c'est aussi pouvoir se consacrer à autre chose)
Mais je n'ai demandé à personne de diffuser mon travail maintenant.
Je vais supprimer carrément mon fichier lisez-moi et ne plus fournir que les fichiers fr-FR.dic et fr-FR.aff, comme cela tout le monde sera content et cela sera bien plus facile pour moi de les tenir à jour.


Ouh, il ne faut pas le prendre comme ça :roll: Je ne veux pas t'imposer quoi que ce soit, et tu peux mener ta barque comme tu l'entends. De mon côté, je n'ai pas trop envie de passer du temps et de l'énergie sur quelque chose s'il y a un risque de se retrouver grosjean comme devant parce qu'on ne s'est pas mis d'accord dès le départ.

J'ai compris et je repasserai voir dans quelques mois s'il y a du progrès.
Avatar de l’utilisateur
nim-nim
 
Messages: 9
Inscription: 21 Juin 2007, 18:27

Messagede Vazkor » 24 Juin 2007, 07:47

Salut,

Il ne sera pas nécessaire de repasser dans quelques mois, parce que je ne compte pas passer ma vie à corriger ce dico français. Plus tôt je pourrais vous donner le feu vert, mieux ce sera.

Je dis simplement qu'il est encore trop tôt pour le proposer maintenant à la communauté.
Pas plus tard que cette nuit, j'ai constaté bêtement en corrigeant une page de Wikipédia, que "des" étaient soulignés alors que je suis certain que ce mot est correctement géré par le dictionnaire.

J'ai retrouvé la séquence suivante dans fr-FR.dic:
de
de/S
dé/S
Eh oui, il y est bien, mais le malheureux "de" qui s'est glissé à mon insu dans le dictionnaire faisait que "de/S" n'était plus pris en compte.
De même un "s'avère" était souligné alors que je viens de revoir et d'optimiser complètement cette liste de verbes pronominaux précédé de s'. "s'avère" fait justement partie de ceux qui demandent un traitement spécial à cause du "è" au présent qui devient un "é" au futur et au conditionnel. Le "s'avère" (sans /p) s'était perdu dans la bagarre (erreur lors d'un copier coller, sans doute).

Voilà le genre de problèmes que je cherche maintenant à débusquer.

Après avoir passé près d'un an à relire, corriger, optimiser ce dictionnaire (et d'autres pour vérifier le bien fondé des entrées), je commence à saturer et je n'y consacre plus toutes mes journées et mes nuits comme je le faisais en novembre et décembre 2006. Un ulcère m'a servi de leçon ! J'aurais laissé tomber si je n'avais pas passé tant de temps sur ce projet.

Pour ce qui est de proposer le dictionnaire à OpenOffice, Mozilla, Linux et compagnie, je vous laisserai à vous, nim-nim et jpj, le soin de le faire et d'emballer les fichiers dic et aff dans un fichier xpi parce que je suis trop nul en anglais quand il s'agit de rédiger autre chose que de très courtes phrases et que je ne connais rien au monde Linux.

Pour la gloriole, que Vazkor soit simplement cité comme celui qui s'est tapé la corvée de corriger le dico me suffit. Je ne tiens pas à ce que ma vraie identité soit mentionnée.

@+
Avatar de l’utilisateur
Vazkor
 
Messages: 9808
Inscription: 05 Nov 2002, 23:39
Localisation: Ans, BE

Messagede Vazkor » 24 Juin 2007, 08:04

Salut,

Pour rappel, mon fichier fr-FR.aff est légèrement différent de celui proposé par FF, parce que j'y ai ajouté des règles V (pour gérer contr(e)-) et T (pour gérer sur-)
Les dernières versions de mes fichiers fr-FR.dic et fr-FR.aff sont disponibles sur mon site, mais je ne perds plus mon temps à les insérer dans un fichier xpi.
Il suffit d'installer le dictionnaire officiel et de remplacer ces deux fichiers par les miens (prendre le dictionnaire French proposé dans le tableau et non celui qui est proposé par défaut ! ) sur la page https://addons.mozilla.org/fr/firefox/browse/type:3
C'est ce fichier au nom folklorique et complètement illisible qu'il faut télécharger :
https://addons.mozilla.org/fr/firefox/d ... +zm+tb.xpi

Certaines conventions de nommage sont parfois bizarres, mais celui qui a créé cette page est vraiment tombé sur la tête.
Les autres dicos ont aussi des noms de 32 à 84 caractères! Mais ce sont les noms des deux dictionnaires français qui remportent le pompon !

Remarquez que vous n'avez pas droit à un seul mot d'explication sur la nouvelle page de téléchargement !
Et le dictionnaire français proposé par défaut est le dictionnaire (réforme 1990), nouvelle orthographe qui n'a guère de succès puisque la grande majorité des forumeurs et rédacteurs de messages en sont restés à l'ancienne orthographe.

Nouveau : La toute dernière version de mon dictionnaire fr-FR est désormais accessible sur mon site (mise à jour quotidienne).
Cliquez sur l'icône Image au bas d'un de mes messages et suivez les indications de Rocky.

@+
Avatar de l’utilisateur
Vazkor
 
Messages: 9808
Inscription: 05 Nov 2002, 23:39
Localisation: Ans, BE

Messagede nim-nim » 25 Juin 2007, 09:09

Vazkor a écrit:Pour ce qui est de proposer le dictionnaire à OpenOffice, Mozilla, Linux et compagnie, je vous laisserai à vous, nim-nim et jpj, le soin de le faire et d'emballer les fichiers dic et aff dans un fichier xpi parce que je suis trop nul en anglais quand il s'agit de rédiger autre chose que de très courtes phrases et que je ne connais rien au monde Linux.


Côté Fedora c'est pas compliqué il n'y a pas de xpi et toutes les applis utilisent le même dictionnaire hunspell/myspell centralisé.

Notre plomberie ce n'est pas de proposer des fichiers qui font bling et ne sont jamais mis à jour, mais de bien automatiser le processus fichiers source -> installation système -> mises à jour automatique -> demandes de correction/amélioration (donc tracer les auteurs). Donc un livrable statique « finalisé » (comme le dico français actuel) nous va beaucoup moins bien que des fichier mis à jour régulièrement. L'expérience prouve que le 100% parfait n'existe pas, donc mettre en place le processus de maintenance est aussi important que la qualité du livrable initial. Ce n'est pas l'approche windows et je dois dire que reprendre des applis qui ont été réalisées dans l'optique « fire and forget » est la plaie la plus totale (fichiers copiés d'on ne sais où, non-respect des licenses, auteurs aux abonnés absents, etc).

J'espère que ça ne te gène pas, et que tu ne vas pas nous faire un Pythou-bis après la livraison initiale.
Avatar de l’utilisateur
nim-nim
 
Messages: 9
Inscription: 21 Juin 2007, 18:27

Messagede Félix le Chat » 25 Juin 2007, 10:18

Bonjour,

Qui fait la maintenance ? L'auteur, le voilà enchaîné à vie à son projet comme le galérien à sa rame, peut-être même que ses héritiers, héritent du bébé...

Pour ce que j'en dis, vaut mieux attendre que les autres fassent le boulot que de mettre la main à la pâte.
Félix le Chat
Avatar de l’utilisateur
Félix le Chat
 
Messages: 824
Inscription: 20 Aoû 2004, 08:29

Messagede pierre » 25 Juin 2007, 11:35

Bonjour,

Un grand bravo et un grand merci à Vazkor pour ce magnifique et harassant travail qui se situe dans l'utile le plus absolu et parfaitement d'époque pour contrer la déliquescence de l'usage de notre langue parlée et écrite.

Pour mémoire, Vazkor est arrivé le premier sur ce site (et son forum), il y a très longtemps, pour justement corriger mes fautes d'orthographe et de grammaire.

Se souvenir et dire merci est la moindre de chose.

Amitiés à lui
Image
__________________
Pierre (aka Terdef)
Appel à donation - Le site a besoin de votre aide

Comment je me fais avoir/infecter ? - Protéger navigateur, navigation et vie privée - Bloquer publicité et surveillance sur le Web
Accélérer Windows - Accélérer Internet - Décontamination - Installer Malwarebytes - Forums d'entraide

Il ne sera répondu à aucune demande de dépannage posée en MP (Messagerie Privée). Les demandes doivent être publiques et les réponses doivent profiter au public.
Image
Avatar de l’utilisateur
pierre
 
Messages: 27330
Inscription: 20 Mai 2002, 23:01
Localisation: Ici et maintenant

PrécédenteSuivante

Retourner vers Firefox

Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 6 invités