La version 13.0 de la norme Unicode est disponible,

Avec 5390 nouveaux caractères, y compris 4 nouveaux scripts et 55 nouveaux caractères émoji

Le 11 mars 2020 à 17:11, par Stan Adkens

688PARTAGES

La version 13.0 de la norme Unicode est disponible,
Avec 5 390 nouveaux caractères, y compris 4 nouveaux scripts et 55 nouveaux caractères émoji

Un an après qu’Unicode Inc. ait publié la version 12.0 du standard informatique qui permet des échanges de textes dans différentes langues à un niveau mondial, le Consortium Unicode a publié mardi la version 13.0 de la norme Unicode, y compris la spécification de base, les annexes et les fichiers de données. Selon un article publié hier sur le blog d’Unicode, cette dernière version ajoute 5 390 nouveaux caractères, portant le total de caractères dans la norme à 143 859 caractères, contre un total de 137 912 au lancement d’Unicode 12.0. Ces ajouts comprennent quatre nouveaux scripts, pour un total de 154 scripts, ainsi que 55 nouveaux caractères emoji.

Ces caractères sont disponibles pour aider le travail du Consortium Unicode sur les langues numériquement défavorisées. Les nouveaux scripts et caractères de la version 13.0 prennent en charge les groupes de langues modernes d'Afrique, du Pakistan, d'Asie du Sud et de Chine. Cette version ajout des caractères arabes pour écrire le haoussa, le wolof et d'autres langues en Afrique, et d'autres ajouts pour écrire le hindko et le panjabi au Pakistan. Un caractère a été ajouté pour Syloti Nagri, un script en voie de disparition utilisé pour écrire la langue Sylheti en Asie du Sud, et un autre pour Bopomofo, un alphabet créé pour être utilisé dans la transcription du mandarin à des fins pédagogiques et didactiques pour le cantonais.

Les mises à jour dans Unicode 13.0 étendent le soutien aux travaux universitaires à l’échelle mondiale, notamment :

Yezidi, utilisé historiquement en Irak et en Géorgie à des fins liturgiques, avec un certain renouveau de l'usage moderne
Chorasmian, historiquement utilisé en Asie centrale en Ouzbékistan, au Kazakhstan et au Turkménistan pour écrire une langue iranienne orientale éteinte
Dives Akuru, historiquement utilisé aux Maldives jusqu'au 20e siècle
Khitan Small Script, historiquement utilisée dans le nord de la Chine.

Les ajouts de symboles populaires comprennent :

Mises à jour des émojis : 55 caractères emoji, dont plusieurs nouveaux emoji pour les smileys, les personnes neutres, les animaux et la plante en pot. Ces mises à jours font suite à l'annonce du mois dernier de la liste finale des 117 nouveaux emojis pour 2020, et ouvre la voie à l'ajout d'un nouveau support des emojis sur les principales plateformes tout au long de l'année, selon un article de blog d’Emojipedia. Les nouveaux caractères émoji incluent des ajouts tels que "Smiling Face with Tear", "People Hugging", "Bubble Tea" et "Ninja".

La documentation relative à la norme Unicode publiée mardi ne fournit que des glyphes en noir et blanc et, de par leur nature, les implémentations d'emoji en couleur seront différentes de ces modèles. Parmi les nouvelles entrées, un piston, une mouche, un cœur anatomique et des myrtilles et autres.

Selon Emojipedia, la sortie d'Unicode 13.0 ne signifie pas que les utilisateurs peuvent accéder ou utiliser les nouveaux emoji 2020. Selon le site Web, ce que les mises à jour du Consortium Unicode indiquent, c'est quand les principaux fournisseurs tels qu'Apple, Google ou Samsung pourront mettre en œuvre ces nouveaux émojis dans leurs logiciels.

Symboles de licence Creative Commons : Six symboles de licence Creative Commons utilisés pour décrire les fonctions, les autorisations et les concepts liés à la propriété intellectuelle qui sont largement utilisés sur le web. A ces derniers, le Consortium Unicode ajoute d'autres glyphes connexes pour les licences non commerciales, ou pour indiquer où l'attribution est requise. Ces nouveaux ajouts aideront les créateurs à répertorier les informations appropriées sur les licences sous forme de texte, de la même manière que © ® et ™ peuvent déjà être insérés dans le texte, lorsqu'ils sont soutenus par les principaux fournisseurs.

Nouvelles marques de lecture vietnamiennes: deux marques de lecture vietnamiennes ajoutées qui marquent les idéogrammes comme ayant une lecture distincte et familière.

214 nouveaux caractères graphiques : 214 caractères graphiques qui assurent la compatibilité avec divers ordinateurs domestiques du milieu des années 70 au milieu des années 80 et avec les premières normes de diffusion du télétexte. Ces derniers permettront aux émulateurs d'afficher correctement le texte qui serait apparu sur les ordinateurs pendant ces périodes-là, s'ils sont réintroduits en 2020, d’après l’article de blog. Beaucoup de ces glyphes s'assemblent en séquence horizontale pour créer des formes ou des symboles plus grands.

Le support des idéogrammes unifiés chinois, japonais et coréens (CJK) a été amélioré dans la version 13.0 par l'ajout de 4 939 caractères dans l'extension G, qui est le premier bloc à être encodé dans le plan 3, ainsi que par des corrections et des améliorations importantes de la base de données Unihan. Les modifications apportées à Unihan comprennent la mise à jour des expressions régulières pour de nombreuses propriétés, l'ajout de plusieurs nouvelles propriétés et la suppression de trois propriétés provisoires obsolètes.

Unicode 13.0 vient aussi avec des mises à jour importantes des polices de caractères des graphiques, notamment : une mise à jour des tableaux de codes pour le script Adlam, qui utilise désormais la police Ebrima. Cette police a une conception améliorée et a été largement acceptée par la communauté des utilisateurs ; et une police complètement mise à jour pour les blocs CJK Radicals Supplement et Kangxi Radicals. Un soutien supplémentaire a été accordé aux langues moins utilisées et aux travaux universitaires, notamment un caractère utilisé en cinghalais pour écrire le sanskrit.

Les propriétés et les spécifications d'Unicode déterminent le comportement du texte sur les ordinateurs et les téléphones. Dans la version 13.0 du standard Unicode, les annexes standards Unicode suivantes présentent des modifications notables liées aux modifications apportées aux propriétés des caractères. En particulier, cinq annexes Unicode importantes ont été mises à jour :

UAX n° 14 : algorithme de rupture de ligne Unicode
UAX n° 29 : segmentation de texte Unicode
UAX n° 31 : identificateur Unicode et syntaxe des motifs
UAX n° 38 : base de données Han Unicode (Unihan)
UAX n° 45 : idéogrammes de source U

Trois importantes spécifications Unicode ont également été mises à jour pour la version 13.0 :

UTS n° 10 : algorithme de collationnement Unicode - tri du texte Unicode
STE n° 39 : mécanismes de sécurité Unicode - réduire l'usurpation d'identité Unicode
UTS n° 46 : traitement de la compatibilité Unicode IDNA - traitement compatible des URL non ASCII

Le standard Unicode est la base de tous les logiciels et communications modernes dans le monde, y compris les systèmes d'exploitation, les navigateurs, les ordinateurs portables et les téléphones intelligents, ainsi que l'Internet et le Web (URL, HTML, XML, CSS, JSON, etc.). La norme Unicode, les normes qui lui sont associées et les données constituent la base des versions CLDR et ICU. L'émergence de la norme Unicode et la disponibilité des outils qui la prennent en charge comptent parmi les tendances les plus récentes de la technologie logicielle mondiale.

Source : Unicode

Et vous ?

Que pensez-vous des nouveaux ajouts Unicode 13.0 ?

Lire aussi

La version 12.0 du standard Unicode est disponible, apporte 554 nouveaux caractères, et prend en charge les langues moins utilisées

Unicode donne la liste finale des emoji avec la version Emoji 12.0, l'un d'eux est bien parti pour s'ajouter dans la liste des emoji suggestifs

La version 9.0 du standard Unicode est disponible et apporte 7500 nouveaux caractères, parmi lesquels 72 emojis

Vous avez lu gratuitement 22 402 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Votre nom : Votre e-mail :

Décrivez l'erreur que vous souhaitez porter à notre connaissance :

Identifiez-vous

Créer un compte

La version 13.0 de la norme Unicode est disponible,

Avec 5390 nouveaux caractères, y compris 4 nouveaux scripts et 55 nouveaux caractères émoji

Identifiant
Mot de passe

Mot de passe oublié ?

Identifiez-vous

Créer un compte

La version 13.0 de la norme Unicode est disponible, Avec 5390 nouveaux caractères, y compris 4 nouveaux scripts et 55 nouveaux caractères émoji

La version 13.0 de la norme Unicode est disponible,

Avec 5390 nouveaux caractères, y compris 4 nouveaux scripts et 55 nouveaux caractères émoji