Dictionnaire français amélioré pour Firefox 2.0 et plus

Modérateur: Modérateurs et Modératrices

Messagede Vazkor » 04 Juin 2007, 12:09

Salut,

Pour les mots en -ette . Il y en a relativement peu dans le dico (504 en tout)

"défragmenter" est déjà inscrit pour la prochaine Màj à effectuer.
"l'antivirus" et "soufflette" sont déjà dans mon dico, et ce depuis longtemps :

souffletai/w
souffletais/v
souffleter/y
soufflette/u <------- ICI !!! donc soufflette, soufflettes, et tout le reste généré par le "flag" u.
souffletterai/x

@+
Avatar de l’utilisateur
Vazkor
 
Messages: 9808
Inscription: 05 Nov 2002, 23:39
Localisation: Ans, BE

Messagede Vazkor » 04 Juin 2007, 17:04

Salut,

Je viens de récupérer tous les termes informatiques d'un Wiki spécialisé.
Plus de 12000 lignes dans mon fichier de travail : rien que 5600 acronymes, noms propres et noms de marque.

Il me reste à sortir tous les mots déjà présents dans le dico de FF.
Cela fera un dictionnaire spécial informatique, tout spécialement pour Pierre.

@+

[édité] Après un gros nettoyage, il reste 7300 lignes dans un fichier de 53 Ko.
Avatar de l’utilisateur
Vazkor
 
Messages: 9808
Inscription: 05 Nov 2002, 23:39
Localisation: Ans, BE

Mise à jour du 13/06/2007

Messagede Vazkor » 13 Juin 2007, 04:22

Salut,

Je viens de mettre sur mon site la dernière mouture de mon dictionnaire.

Celui-ci a été complètement testé sur une liste sérieuse de 138229 mots français, pas trop capillo-tractés. Il n'y a que 1076 mots soulignés, qui n'ont donc pas été reconnus.
Après vérification, certains lemmes manquaient effectivement dans mon dico et certains drapeaux étaient incorrects pour d'autres.
D'autres mots de la liste utilisée pour la vérification étaient en fait des erreurs (principalement des participes déclinés au masculin pluriel et au féminin alors qu'il s'agissait de verbes intransitifs ou transitifs indirects).

J'ai ensuite ajouté les mots manquants, qui me paraissaient intéressants. Lors de cette Nième relecture de la liste de mots pour ajouter les drapeaux aux nouveaux lemmes (qui n'en avaient bien sûr pas), j'ai encore retrouvé des erreurs dans les drapeaux, expliquant pourquoi certains mots n'étaient pas reconnus. En général, il s'agissait de formes du futur affublées du drapeau w du passé simple (w au lieu de x, fautes que je retrouve 21 fois dans un dictionnaire officiel de septembre 2003!).

Je ne pense plus ajouter de nouveaux mots à ce dictionnaire. Bien au contraire, je vais essayer d'en sortir des lemmes trop rares pour les mettre dans un ou plusieurs dictionnaires spécialisés.

Téléchargement de ce dictionnaire ici (vérifié le 31/03/2007)

@+
Avatar de l’utilisateur
Vazkor
 
Messages: 9808
Inscription: 05 Nov 2002, 23:39
Localisation: Ans, BE

Messagede paulposition » 13 Juin 2007, 14:30

Bonjour Vaskor :D Mise a jour faite, merci :D

(J'en ai profite pour ajouter le fichier persdict-oe.txt a mon persdict.dat )

Paul
paulposition
 
Messages: 174
Inscription: 22 Oct 2006, 15:38

Messagede sebtoc » 13 Juin 2007, 17:29

Salut,

Merci Vazkor pour nous faire partager ton travail:D

J'ai fait la MAJ pour le dictionnaire dans Firefox et Thunderbird.
Par contre, mon petit souci réside dans l'absence totale du fichier persdict.dat :shock:

J'ai fait une recherche dans mes profils et sur le reste de ma bécane mais nada!!

Comment puis-je faire pour bénéficier du fichier persdict-oe.txt SVP??

Merci
@+ :wink:
sebtoc
 
Messages: 142
Inscription: 19 Juil 2006, 20:53
Localisation: Blaye (33)

Messagede Vazkor » 13 Juin 2007, 21:14

Bonsoir,

Ton dictionnaire personnel (persdict.dat) est créé dans ton profil utilisateur de Firefox et c'est un fichier normal sans attribut particulier.
Si tu ne le trouves pas, c'est parce qu'il est vide et n'a pas encore été créé dans ton profil.
Après avoir activé la vérification orthographique dans un message que tu rédiges, fais un clic droit sur un mot non reconnu comme nada par exemple et choisis Ajouter au dictionnaire.
Tu ne verras rien tout de suite dans l'explorateur, parce que ce fichier réside en mémoire et est seulement enregistré quand tu quittes Firefox.

Si tu n'as que notepad ou Wordpad pour afficher les fichiers txt ne t'étonne pas de l'affichage un peu bizarre. En fait c'est un codage UTF8 UNIX qui est utilisé et non un codage DOS ou ANSI.

Pour le dictionnaire persdict-oe.txt il ne s'agit que d'un liste de mots contenant des œ (ligature e dans o). Ce n'est utile de les ajouter que si tu corriges souvent des textes en contenant.
C'est mon cas avec les pages sur Wikipedia.

Tu peux ajouter le contenu de ce fichier à celui de persdict.dat et enregistrer le tout. Firefox s'occupera de la conversion éventuelle en U8-UNIX.

@+
Avatar de l’utilisateur
Vazkor
 
Messages: 9808
Inscription: 05 Nov 2002, 23:39
Localisation: Ans, BE

Messagede sebtoc » 15 Juin 2007, 20:41

Salut,

Effectivement, ne corrigeant aucun texte, je vais me passer pour l'instant du dictionnaire persdict-oe.txt.
Et avec une mère professeur de français très à cheval sur la syntaxe et l'orthographe, je devrais m'en sortir...

Je te remercie tout de même pour la marche à suivre afin de créer prochainement mon fichier persdict.dat :D

@+ :wink:
sebtoc
 
Messages: 142
Inscription: 19 Juil 2006, 20:53
Localisation: Blaye (33)

Messagede pierre » 16 Juin 2007, 08:18

Bonjour Vazkor

Le fichier lisezmoi.txt est illisible (retour charriot).

Tiens, Vazkor n'est pas dans le dico :shock:

Je met la dernière mise à jour sur le site sous le nom de
Dico_fr-FR.zip
sans indication de version de manière à ce que le lien de téléchargement pointe toujours vers la dernière version (ton numéro de version est dans le fichier lisezmoi.txt)

Je vais créer une fiche pour le dico dans la logithèque.

Amitiés
Image
__________________
Pierre (aka Terdef)
Appel à donation - Le site a besoin de votre aide

Comment je me fais avoir/infecter ? - Protéger navigateur, navigation et vie privée - Bloquer publicité et surveillance sur le Web
Accélérer Windows - Accélérer Internet - Décontamination - Installer Malwarebytes - Forums d'entraide

Il ne sera répondu à aucune demande de dépannage posée en MP (Messagerie Privée). Les demandes doivent être publiques et les réponses doivent profiter au public.
Image
Avatar de l’utilisateur
pierre
 
Messages: 27610
Inscription: 20 Mai 2002, 23:01
Localisation: Ici et maintenant

Messagede Vazkor » 16 Juin 2007, 18:34

Salut Pierre,

Normal.
Tous les fichiers dic aff et txt originaux sont au format UNIX, qui se caractérise par un Line Feed d'un seul caractère hexadécimal "OA" et non un CR+LF "OD OA" comme les fichiers DOS.

Je n'ai pas de problème parce que mon brave UltraEdit gère très bien tout cela et m'affiche au bas d'écran le format utilisé parmi une dizaine de conversions possibles. UE reconnaît le format utilisé et si c'est de l'UNIX il me demande si je veux le convertir au format DOS.

J'ai oublié de reconvertir ce fichier au format DOS. Maintenant c'est chose faite sur mon PC et sur le site.

Le contenu de ce fichier lisezmoi.txt n'est pas vraiment important.
Après le début, à peine informatif,
Dictionnaire fr-FR.dic et règles d'affixes fr-FR.aff pour Mozilla, Firefox, Thunderbird et Nvu.
(également pour OpenOffice.org en les renommant en fr_FR.dic et fr_FR.aff )

Version 2007.06, basée sur la version 1.0.1 officielle mais complètement remaniée depuis juillet 2006
(Dernière mise à jour le 13 juin 2007).
vient tout un blabla à propos de la licence GPL.

Pour le numéro de version, c'est plutôt pour moi.
J'ai adopté le système basé sur l'année et le mois, plutôt que 1.n.n, non seulement pour me démarquer des anciennes versions, mais aussi pour plus de facilité.
Sur mon PC c'est même aaaa.mm.jj pour m'y retrouver sans devoir ouvrir les fichiers qui se suivent et se ressemblent tous.

Mon dictionnaire étant déjà bien trop complet, je n'ajouterai probablement plus guère de nouveaux lemmes (sauf mots courants que je rencontrerai encore et qui ne seront pas reconnus).

Je pense maintenant continuer à élaguer le dictionnaire principal des mots trop rares, voire dangereux parce trop proches de mots courants, pour les mettre dans des dictionnaires spécialisés que les intéressés pourront fusionner au dico principal seulement si cela les intéresse.

Tout à fait entre nous, je conseille de télécharger PSPad, freeware très puissant, pour remplacer le pauvre Bloc-Notes de Windows.
Mais personnellement, sans doute parce que je suis trop habitué à UltraEdit, j'ai abandonné PSPad pour ne garder que UltraEdit que je trouve irremplaçable quand on a besoin de triturer des fichiers quelconques en mode texte (txt et autres) en tous sens.
UE vaut parfaitement la trentaine d'euros qu'il coûte, au vu de ses énormes possibilités.
PSPad a pratiquement les mêmes possibilités qu'UE mais il lui manque toujours un petit quelque chose.
J'ai aussi testé SciTE quelque temps mais je ne suis pas arrivé à m'y faire.

@+
Avatar de l’utilisateur
Vazkor
 
Messages: 9808
Inscription: 05 Nov 2002, 23:39
Localisation: Ans, BE

Messagede nim-nim » 21 Juin 2007, 19:02

Bonjour Vazkor,

Je viens de tomber sur ton projet en butinant sur un autre sujet.

Beaucoup de monde serait heureux de voir quelqu'un reprendre le dictionnaire français utilisé par toutes les applications libres, vu son état d'abandon actuel. Pour le moment il est de facto géré par l'équipe d'Openoffice.org qui n'a pas le temps de s'en occuper et refuse d'introduire les ligatures tant que leur application sera diffusée sur des plates-formes (vieilles versions de windows) où on ne peut pas les taper.

Si tu es intéressé je peux essayer de pousser ton travail sous Fedora Linux (après on peut avoir un effet cascade sur Red Hat Linux, les autres variantes libres, OpenOffice.org, Firefox, etc). Ça ne demandrait pas beaucoup de travail de ta part (juste formaliser le nommage/l'url de ton .zip et y ajouter un fichier de license serieux), et aiderait beaucoup de pauvres francophones.

Sinon j'ai largement de quoi m'occuper ailleurs, et je n'ai pas l'intention de perdre mon temps à essayer de le faire sans toi.
Avatar de l’utilisateur
nim-nim
 
Messages: 9
Inscription: 21 Juin 2007, 18:27

PrécédenteSuivante

Retourner vers Firefox

Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 4 invités