IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Unicode 14.0 est disponible et s'accompagne 37 nouveaux émojis pour un total de 112 nouveaux personnages
Disponibles dans les mois à venir sur tous les appareils

Le , par Stéphane le calme

110PARTAGES

12  0 
En juillet, le Consortium Unicode a validé de nouveaux emojis dans le cadre de l’itération Unicode 14, le standard informatique qui permet des échanges de textes dans différentes langues à un niveau mondial.

Depuis le 14 septembre, la version 14.0 de la norme Unicode est désormais disponible, y compris la spécification de base, les annexes et les fichiers de données. Cette version ajoute 838 caractères, pour un total de 144 697 caractères. Ces ajouts incluent cinq nouveaux scripts, pour un total de 159 scripts, ainsi que 37 nouveaux caractères emoji. Parmi les 838 caractères qui ont été ajoutés dans Unicode 14 figurent 37 nouveaux emojis, ainsi que 75 tons de peau, pour un total de 112 nouveaux personnages disponibles dans les mois à venir sur tous les appareils.

Parmi les emojis, nous retrouvons de nombreux visages (visage avec les yeux ouverts et la main sur la bouche, visage en pointillé, visage avec les larmes aux yeux, etc.) mais aussi d'autres emojis comme un troll, une boule à facettes, une fleur de lotus, un nid vide, des bulles de savon, une radiographie ou encore un corail. L'inclusivité s'invite avec l’apparition d’un personnage non genré, représenté comme étant enceinte.

La prise en charge d'Unicode constitue le fondement de la représentation des langues et des symboles dans les principaux systèmes d'exploitation, moteurs de recherche, navigateurs, ordinateurs portables et téléphones intelligents, ainsi qu'Internet et le Web (URL, HTML, XML, CSS, JSON, etc.). La prise en charge de l’Unicode est un moyen de mettre en œuvre ISO/CEI 10646. L'émergence de la norme Unicode et la disponibilité des outils qui la prennent en charge comptent parmi les tendances les plus récentes de la technologie logicielle mondiale.


Les nouveaux scripts et caractères de la version 14.0 ajoutent la prise en charge des groupes de langues modernes en Bosnie, Inde, Indonésie, Iran, Java, Malaisie, Mongolie, Myanmar, Pakistan et Philippines, ainsi que d'autres langues en Afrique et en Amérique du Nord, notamment :
  • ajouts d'écriture arabe qui incluent des titres honorifiques et des ajouts à usage coranique, et des caractères utilisés pour écrire des langues à travers l'Afrique, les Balkans et l'Asie du Sud et du Sud-Est ;
  • le script Vithkuqi historiquement utilisé pour écrire l'albanais et actuellement en cours de renouveau moderne ;
  • l'écriture Tangsa utilisée pour écrire la langue Tangsa, parlée en Inde et au Myanmar ;
  • l'écriture Toto utilisée pour écrire la langue Toto dans le nord-est de l'Inde ;
  • de nombreux ajouts d'écriture latine pour l'IPA étendue.

Les ajouts de symboles populaires incluent :
  • 37 personnages emoji, dont plusieurs nouveaux emoji pour les émotions et les gestes de la main (smileys, mains, animaux et nature, nourriture et boisson, transport et activités). Parmi les nouveautés, quelques bonshommes sourire supplémentaires, des gestes de la main, un nid (vide et avec des œufs), une boule à facettes, un troll, une pile vide, etc.

Les autres ajouts de symboles et de notations incluent :
  • le signe monétaire som utilisé en République kirghize ;
  • la notation musicale Znamenny développée en Russie.

La prise en charge d'autres langues vivantes et travaux universitaires s'étend dans le monde entier, notamment :
  • cypro-minoan, historiquement utilisé principalement sur l'île de Chypre ;
  • vieux ouïghour, historiquement utilisé en Asie centrale et ailleurs pour écrire les langues turque, chinoise, mongole, tibétaine et arabe ;
  • ahom, balinais, brahmi, langues autochtones canadiennes, glagolitique, kaithi, kannada, mongol, tagalog, takri et télougou ;
  • prise en charge de l'arabe pour le haoussa, le wolof, l'hindou et le pendjabi, et la prise en charge de l'éthiopien pour le Gurage.

Mises à jour importantes de la police des graphiques, notamment :
  • mises à jour importantes des blocs auxiliaires CJK et des caractères alphanumériques inclus.

Si le lancement d’Unicode 14.0 a commencé le 14 septembre, il faudra patienter avant de voir apparaître les nouveaux emojis sur votre smartphone et sur les différentes plateformes. Ainsi, Google devrait proposer ces nouveaux emojis entre octobre et décembre 2021, tandis qu’ils devraient être disponibles sur iPhone, les autres smartphones et les réseaux sociaux tout au long de l’année 2022.

Sources : blog Unicode, liste des émojis et significations

Et vous ?

Que pensez-vous des nouveaux ajouts Unicode 14.0 ?

Voir aussi :

La version 9.0 du standard Unicode est disponible et apporte 7500 nouveaux caractères parmi lesquels 72 emojis
Le standard Unicode (traitement de données XML)
Java : le JDK 12 est disponible en version bêta, il prend en charge Unicode 11 et dispose d'un nouveau format de clé privée codé x25519 et x448
Unicode donne la liste finale des emoji avec la version Emoji 12.0 l'un d'eux est bien parti pour s'ajouter dans la liste des emoji suggestifs

Une erreur dans cette actualité ? Signalez-le nous !

Avatar de 6h0u1
Nouveau membre du Club https://www.developpez.com
Le 21/09/2021 à 9:35
Je ne vois toujours pas le drapeau breton...
1  0 
Avatar de Christian_B
Membre éclairé https://www.developpez.com
Le 17/11/2021 à 20:11
L'inclusivité s'invite avec l’apparition d’un personnage non genré, représenté comme étant enceinte.
Là, il me semble qu'ils font de la biologie-fiction. À quand une émoticône de barbu⋅e baraqué⋅e enceint⋅e ?

Plus sérieusement, le problème des ajouts concernant des thèmes, domaines, langues ... déjà présents, c'est que les caractères se retrouvent dans le plus grand désordre. Et les "scripts" du site Unicode ne sont que des liens vers les blocs Unicode, présentés en PDF. Il manque de vrais scripts thématiques.

D'autre part, ils préviennent de ne pas copier directement les caractères dans ces fichiers car pour des raisons de bonne présentation ils peuvent ne pas correspondre à la description (tiens on retrouve la question des homoglyphes évoquée dans l'article sur l'exploit "Trojan Source".

Si on n'a pas d'outils spécialisés pour exploiter l'Unicode (je ne sais pas lesquels, n'étant pas typographe), il faut aller plutôt sur Wikipedia et se constituer de petites collections de caractères utiles (par thème, par forme : ex. flèches).

Autrement, pour ce qui est des caractères linguistiques et autres signes typographiques spécialisés, c'est bien d'arriver à les compléter (progressivement parce que c'est sans doute compliqué de trouver des gens pour bien le faire dansc ertains cas).

Pour les émoticônes, c'est potentiellement illimité, heureusement qu'avec des codes de 21 bits il y a de la marge.
Mais peut-être dans certains cas serait-il plus astucieux de faire des émoticônes combinantes, un peu comme dans un système policier de portraits-robots où on choisissait une un menton, une bouche, un nez, des yeux ...
On pourrait définir des modificateurs pour le "genre" , l'âge la couleur de peau (évoquée par l'article, etc, chacune étant alors applicable à une collection d'émoticônes-types (humaines dans ce cas) sans multiplier les codes.
Ou l'abondance capillaire, la couleur des cheveux, voire la taille des oreilles, l'humeur, un couvre-chef, etc
Ça ferait des combinaisons de caractères plus compliquées qu'actuellement, mais le seul point délicat, c'est que pour bien faire, il ne faudrait pas seulement combiner des éléments graphiques de forme fixe, mais définir un algorithme produisant un résultat d'ensemble cohérent.
0  0 
Avatar de Pyramidev
Expert confirmé https://www.developpez.com
Le 17/11/2021 à 20:38
Citation Envoyé par Christian_B Voir le message
Mais peut-être dans certains cas serait-il plus astucieux de faire des émoticônes combinantes, un peu comme dans un système policier de portraits-robots où on choisissait une un menton, une bouche, un nez, des yeux ...
On pourrait définir des modificateurs pour le "genre" , l'âge la couleur de peau (évoquée par l'article, etc, chacune étant alors applicable à une collection d'émoticônes-types (humaines dans ce cas) sans multiplier les codes.
Ou l'abondance capillaire, la couleur des cheveux, voire la taille des oreilles, l'humeur, un couvre-chef, etc
Ça ferait des combinaisons de caractères plus compliquées qu'actuellement, mais le seul point délicat, c'est que pour bien faire, il ne faudrait pas seulement combiner des éléments graphiques de forme fixe, mais définir un algorithme produisant un résultat d'ensemble cohérent.
En tout cas, pour la couleur de peau, cela existe déjà. Il y a quelques mois, j'avais lu un article, Bear plus snowflake equals polar bear, qui illustrait des émoticônes formées par combinaisons.

Par exemple, voici une émoticône qui fait 35 octets en UTF-8 :



Il existe aussi des combinaisons amusantes pour les métiers :


Enfin, voici la combinaison à laquelle correspond le titre de l'article :
0  0 
Avatar de Christian_B
Membre éclairé https://www.developpez.com
Le 18/11/2021 à 11:32
Citation Envoyé par Pyramidev Voir le message
En tout cas, pour la couleur de peau, cela existe déjà.
Ça alors, j'ignorais complètement
Je vois sur les exemples qu'il y a de nombreuses possibilités, presque comme je l'avais imaginé, mais en plus astucieux avec, sur l'exemple détaillé, seulement deux codes spéciaux "U+200D : zero-width join" et "U+FE0F : variation selector".
Est-ce que c'est actuellement dans la norme ?

Je n'ai rien trouvé à ce sujet sur le site Unicode, qui paraît plus préoccupé actuellement de mettre en avant le gag (?) "Adoptez un caractère" Est-ce qu'il proposent aussi des enfants à l'adoption ?
Quand à la norme ISO :
https://standards.iso.org/ittf/Publi...46_2020(E).zip
C'est un monument de 2814 pages dans lequel je n'ai pas trouvé le cas des émoticônes combinées.

Je me demande comment c'est fait et comment c'est utilisable actuellement.
Il n'existe pas dans les éditeurs et traitements de texte courants, à ma connaissance, d'outil pour employer effectivement ces caractères.
Je me demande s'il comprennent ces séquences.

À moins que quelqu'un ait des infos à ce sujet, j'essayerai de le tester soit avec la table des caractères si c'est possible, soit à la rigueur en binaire.
0  0 
Avatar de Christian_B
Membre éclairé https://www.developpez.com
Le 21/11/2021 à 0:43
Finalement c'est assez simple de tester un séquence avec la table des caractères.
Encore plus simple : copier l'exemple à 35 octets de l'article :
👩🏾*❤️*💋*👩🏻
Xed (et mon navigateur) font l'assemblage, tandis que LibreOffice (version Version : 6.4.7.2) ne le fait pas et affiche 4 émoticônes. En attendant peut-être LibreOffice 7.x.
0  0