[NeW] ISO ASCII Entités-HTML ANSI MacRoman Unicode

La vie du site, boîte à idées, feedback

Modérateur: Modérateurs et Modératrices

[NeW] ISO ASCII Entités-HTML ANSI MacRoman Unicode

Messagede pierre » 22 03 2008

Confronté à un travail de pur webmastering et devant l'incroyable imbroglio des normes et des déclarations péremptoires des uns et des autres, j'ai fais ma propre table de comparaison et rapprochement des jeux de caractères, confrontant :

ASCII
ISO-8859-1
ANSI (Windows-1262 ou CPC1262) - Cette "norme" Microsoft est invalide.
MacRoman
Unicode
Codage Microsoft - Ce codage Microsoft est invalide
Codage en entités HTML 4.0
Codage Unicode numérique
Codage Unicode héxadécimal
Codage en Echappement % (Escape code)

Pourquoi ?
Parce qu'on me serine depuis la nuit des temps (depuis mon tout premier apprentissage, depuis que j'ai fait mon premier site Internet) qu'on ne peut accepter dans les liens Internet et les noms de fichiers Internet que les caractères a-z, A-Z, 0-9, "-", "_" et c'est tout. Voila 10 ans que je crois à ce que l'on m'a transmis.

Non ! C'est faux !

Confronté à un travail dans lequel des caractères tordus et prétendument interdits sont utilisés, j'ai voulu en savoir plus et j'ai donc testé (ou suis allé à la pêche aux informations disparates sur le Net), 1 par 1, tous les 192 premiers caractères (table des 256 premiers caractères sauf les caractères de contrôle) :

dans un nom de fichier local dans un système de fichier NTFS (Monde Microsoft / Windows)
dans un nom de fichier local dans un système de fichier Linux
dans un nom de fichier local dans un système de fichier Unix
dans un nom de fichier local dans un système de fichier BSD
dans un nom de fichier local dans un système de fichier Mac OS
dans un nom de fichier local dans un système de fichier Mac OSX
dans un nom de fichier local dans un système de fichier Dos (ancien monde Microsoft)
dans un nom de fichier distant sur un serveur Apache
dans une URL (un lien)

Voici la preuve (les caractères sont groupés par paquets de 16 pour ne pas vous infliger les 192 pages de tests - soit les 256 premiers caractères moins les 64 caractères de contrôle (Hex-00 à Hex-1F et Hex-80 à Hex-9F) :

Fichiers aux noms plein de caractères extraordinaires manipulés tout à fait normalement localement

Image

Les mêmes fichiers manipulés tout à fait normalement sur un serveur distant sous Apache

Image

Les liens utilisés vers ces pages distantes avec ces caractères dans les liens et le tableau de rapprochement des normes
http://assiste.com.free.fr/p/faq_webmaster/!_faq_webmasters.html
Avatar de l’utilisateur
pierre
 
Messages: 14536
Inscription: 21 05 2002
Localisation: Ici et maintenant

Retourner vers Mises à jour du site

Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 1 invité