IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

L'Unicode utilisé pour près de 50% de l'Internet mondial
D'après des statistiques de Google

Le , par Katleen Erna

63PARTAGES

1  0 
L'Unicode utilisé pour près de 50% de l'Internet mondial, d'après des statistiques de Google

Google vient de publier un graphique analysant les divers encodages de caractères sur Internet (ASCII, Latin-1, Windows 1252 ou l'Unicode). La plupart des encodages ne sont compatibles qu'avec un (ou une poignée) de langages, alors que l'Unicode les prend tous en charge, du chinois au zoulou.

Longtemps, l'Unicode a été utilisé en interne par le géant de Mountain View pour tous les textes recherchés. Tout autre encodage est préalablement converti en Unicode avant que le moteur de recherche ne se mette en marche.

La graphique suivant est tiré de données de Google obtenues lors de l'indexation des pages webs. La position dominante de l'Unicode s'y voit clairement. Son utilisation majoritaire autour du globe ne fait aucun doute, et allège pour Google le processus de prise en charge des différents langages.



Mais l'Unicode ne s'étend pas qu'en terme d'usage, mais aussi par le nombre de caractères qu'il prend en charge. Sa dernière version, la 5.2, en rajoute plus de 6.000 nouveaux.

Source : Le blog de Google

Une erreur dans cette actualité ? Signalez-nous-la !

Avatar de s4mk1ng
Membre expérimenté https://www.developpez.com
Le 29/01/2010 à 10:55
Bah ce qui m'etonnes c'ets pourquoi il n'a "que" 50% si il prend en cherge un panel de languages assez importants.
1  0 
Avatar de Uther
Expert éminent sénior https://www.developpez.com
Le 29/01/2010 à 12:00
Certainement parce que ce n'est pas l'encodage par défaut de pas mal d'OS et d'outils de développement.
1  0 
Avatar de khayyam90
Rédacteur https://www.developpez.com
Le 29/01/2010 à 15:22
Citation Envoyé par Uther Voir le message
Certainement parce que ce n'est pas l'encodage par défaut de pas mal d'OS et d'outils de développement.
Et parce que ça nécessite des objets particuliers puisque traditionnellement en développement un caractère équivaut à un octet, ce qui n'est plus toujours vrai si on travaille en utf8.
La progression en flèche de l'Unicode montre bien que c'est la voie à suivre pour tous les futurs développements web.
1  0 
Avatar de Aurelien.Regat-Barrel
Expert éminent sénior https://www.developpez.com
Le 30/01/2010 à 14:50
Citation Envoyé par Katleen Erna  Voir le message
[B][SIZE="3"]La plupart des encodages ne sont compatibles qu'avec un (ou une poignée) de langages, alors que l'Unicode les prend tous en charge, du chinois au zoulou.

Apparement le Zoulou est un mauvais exemple, puisqu'il semble que ce soit une des rares langues qui puissent s'écrire en bon vieux ASCII ! Pour le fun, voici la liste des langues qu'on peut écrire en ASCII constituée par cet auteur :
http://blogamundo.net/dev/2006/12/06...nly-languages/

Bali
Basque
Bemba
Bicolano, Central
Bislama
Bugis
Cebuano
Chokwe
Chuukese
English
Ganda
Hiligaynon
Hmong Njua
Hmong, Northern Qiandong
Hmong, Southern Qiandong
Ido
Ilocano
Indonesian
Interlingua
Inuktitut, Greenlandic
Javanese
K'iche', Central
Kaonde
Konjo
Koongo
Latin
Latin (1)
Lozi
Luba-Kasai
Lunda
Luvale
Madura
Malagasy, Plateau
Mam, Northern
Marshallese
Ndebele
Ndonga
Nyanja (Chechewa)
Nyanja (Chinyanja)
Nyankore
Oromo, Borana-Arsi-Guji
Palauan
Pampangan
Pidgin, Nigerian
Pijin
Pohnpeian
Q'eqchi'
Rundi
Rwanda
Shona
Somali
Sotho, Southern
Sunda
Swahili
Swati
Tagalog
Tetun
Tonga
Totonac, Papantla
Uzbek, Northern (Latin)
Waray-Waray
Xhosa
Yao
Zhuang, Northern
Zulu

1  0