Caractères autorisés pour noms de domaine

Fermé
Signaler
Messages postés
21
Date d'inscription
vendredi 7 janvier 2011
Statut
Membre
Dernière intervention
5 décembre 2015
-
Messages postés
21
Date d'inscription
vendredi 7 janvier 2011
Statut
Membre
Dernière intervention
5 décembre 2015
-
Bonjour,

Je cherche les références officielles qui décrivent les caractères autorisés dans les labels des noms de domaines. En particulier les références concernant

Avec google je tourne en rond sur des sites qui me parlent des caractères ASCII pour les A-Label et des caractères Unicode pour les U-Label comme si tout ça était d'une évidence déconcertante. Mais je serais quand même très étonné d'apprendre que les caractères de retour à la ligne ou de tabulation (par exemple) soient autorisés. J'ai aussi du mal à voir comment les points pourraient être autorisés puissent ce sont eux qui délimitent les labels dans les noms de domaines.

Bref, je cherche vraiment les références officielles, ça doit être sur un site officiel évident pour les connaisseurs mais google me fait tourner en rond sur des pages qui ne citent pas leurs sources...

Je cherche à la fois les références pour l'ASCII et pour l'IDN (Unicode).
Par exemple, si vous essayez www.commentçamarche.net vous verrez que ça ne vous renvoie pas vers le même site que https://www.commentcamarche.net/


Merci aussi à ceux qui n'y connaissent rien et qui auront l'intelligence ne pas poluer cette question.

Configuration: Windows XP / Safari 535.2

3 réponses

Bonsoir,

IL existe au contraire de nombreuses extensions qui autorisent des caractères accentués, à commencer par le .com (il est possible de déposer société.com par exemple). Il existe plus de 70 extensions dans le monde qui le permettent, en incluant des extensions qui autorisent des caractères autres que latins (chinois, cyrilliques, arabes, ...) et même des extensions qui sont elles mêmes dans ce type de caractères. Cette famille s'appelle les "IDNs" pour Internationalized Domain Names.

Vous trouverez sur http://domaines.mailclub.fr un moteur de recherche disposant d'un clavier virtuel pour effectuer des recherches de disponibilité sur ce type de domaines, et sur http://www.mailclub.info/?-idns- toutes les infos à jour sur ces IDNs.

Eh oui, les noms de domaine, c'est un métier ;-)
5
Merci

Quelques mots de remerciements seront grandement appréciés. Ajouter un commentaire

CCM 41989 internautes nous ont dit merci ce mois-ci

Messages postés
21
Date d'inscription
vendredi 7 janvier 2011
Statut
Membre
Dernière intervention
5 décembre 2015
16
J'ai hésité à réponde, mais SVP relisez ma question.

Tout ça je l'ai déjà lu sur tous les sites internet que j'ai trouvé, et qui eux non plus ne sites pas leurs sources.

Je cherche les documents "officiels", les normes (RFC, IEEE, ... ?) qui listent exhaustivement ce qui est autorisé/interdit dans chacun des systèmes (ascii ou idn). Pas une discussion sur le sujet.


L'objectif étant pour moi de tester la conformité de renseignement fournis par des utilisateurs sur un site web, par exemple leur email. Il n'est pas envisageable de refuser une adresse mail sous prétexte qu'elle aura été écrite avec des caractères chinois, puisque c'est autorisé. D'un autre côté il est important d'avoir un filtre efficace pour signaler les erreurs de frappe évidentes.

La question est donc savoir exactement ce qui doit être refusé/autorisé.

Toutes les expressions régulières de reconnaissance d'email qu'on trouve ici et là sur le net sont fausses puisqu'elles refusent de fait les caractères non ascii, rien ne me dit d'ailleurs que les seuls caractères mis dans ces expressions régulières sont bien exactement les seuls autorisé en ascii.

Pour le moment je me contente de faire un "^[^@ ]+@[^@ ]+.[^@. ]+$" pour essayer d'être le plus large possible, en ayant supprimé tous les sauts de lignes et tabulations en amont. Mais c'est vraiment très large, trop large sans aucun doute.


Merci
Messages postés
21
Date d'inscription
vendredi 7 janvier 2011
Statut
Membre
Dernière intervention
5 décembre 2015
16
Même en pur ascii d'ailleurs, je trouve que les adresses suivantes doivent être considérées comme valide, donc ma regexp que j'espérait large, ne l'est pas suffisamment...

"Abc\@def"@example.com
"Fred Bloggs"@example.com
"Joe\\Blow"@example.com
"Abc@def"@example.com
customer/department=shipping@example.com
$A12345@example.com
!def!xyz%abc@example.com
_somename@example.com
Messages postés
222
Date d'inscription
jeudi 13 octobre 2011
Statut
Membre
Dernière intervention
8 novembre 2011
37
Aucun caractère spéciaux n'est autorisé (apostrophe, accent, etc) à part le tiret dans un nom de domaine. Ensuite tu peux avoir un point dans le nom mais seulement dans un sous-domaine. Ci-après tu as pas mal d'infos :
https://fr.wikipedia.org/wiki/Nom_de_domaine