Developpez.com

Le Club des Développeurs et IT Pro

Apple révèle qu'il stocke les données vocales pendant deux ans

Pour les applications Siri et Dictation

Le 2013-04-22 14:16:47, par Stéphane le calme, Chroniqueur Actualités
Après qu’un groupe de défense des libertés civiles a averti qu’Apple n’en fait pas assez pour informer ses clients de leurs droits à la vie privée, la firme a dévoilé qu’elle stocke les données vocales créées lorsque des personnes utilisent ses deux services de commande vocale Siri et Dictation.


La politique de confidentialité des deux services ne décrit pas exactement comment fonctionne la technologie ou pendant combien de temps la firme conserve les données des clients.

Truddy Muller, un porte-parole d’Apple, a révélé que la firme conserve ces données pendant deux ans.

Siri (retrouvé sur iOS) et Dictation (à la fois sur iOS et OS X) utilisent des données d'entrées vocales et les envoient, par voie hertzienne, aux serveurs d'Apple. Un nombre aléatoire est généré pour rendre l'utilisateur anonyme ; les données excluent donc l'adresse électronique, le numéro de téléphone et l’identifiant Apple de l’utilisateur.

Après six mois, ces données sont « dissociées » du nombre aléatoire généré. Apple les utiliserait alors pour « améliorer de façon générale Siri/Dictation ainsi que d’autres produits et services Apple ». La firme précise que les données pourraient inclure des « données diagnostiques connexes telles que les spécifications systèmes matériels et les statistiques de performance ».

En clair, pendant six mois, Apple serait capable d’associer une requête particulière à un nombre lié à une personne. Dans le cas où l’individu parle de la pluie et du beau temps, cela n’a rien d’alarmant. Mais dans un scénario plus critique où, par exemple, une information sensible pour une entreprise serait divulguée, le sujet pourrait devenir préoccupant.

Raison pour laquelle certaines entreprises, comme IBM, en ont interdit l'utilisation dans leur milieu de travail parce qu'ils ne pouvaient pas garantir la sécurité de leurs données.

Les deux services ont été mis à la disposition du public depuis octobre 2011.

Source : politique de confidentialité d’Apple et Siri (au format PDF)

Et vous ?

Quel est votre avis sur la question ? Les réponses d’Apple sont-elles rassurantes ou préoccupantes ?
  Discussion forum
6 commentaires
  • gangsoleil
    Modérateur
    Envoyé par Stéphane le calme
    Mais dans un scénario plus critique où, par exemple, une information sensible pour une entreprise serait divulguée, le sujet pourrait devenir préoccupant.

    Quel est votre avis sur la question ?
    En meme temps, si les gens etaient formes un minimum a la securite et a la gestion de la confidentialite des donnees, peut-etre qu'ils arreteraient d'utiliser "siri" pour retrouver un mail ultra-confidentiel qui parle du prochain contrat qui ne doit surtout pas etre devoile -- mail qui a ete allegrement transfere sur gmail pour "y avoir acces partout, car le webmail de la boite, c'est vraiment trop galere".
  • FlqX_-
    Membre du Club
    Gastiflex : Parceque les données personnels ne sont pas stockés mais le numéro aléatoire permet de retrouver l'identité d'une personne, donc jusqu'à 6 mois il n'y a pas de vrai anonymat.
  • AkiroVIII
    Membre habitué
    Ce n'est pas étonnant de la part d'Apple.

    C'est une bonne chose qu'ils le disent, mais combien de personne vont réellement prendre conscience de ce que ça signifie en terme de sécurité ?

    Envoyé par gangsoleil
    En meme temps, si les gens etaient formes un minimum a la securite et a la gestion de la confidentialite des donnees, peut-etre qu'ils arreteraient d'utiliser "siri" pour retrouver un mail ultra-confidentiel qui parle du prochain contrat qui ne doit surtout pas etre devoile -- mail qui a ete allegrement transfere sur gmail pour "y avoir acces partout, car le webmail de la boite, c'est vraiment trop galere".
    Je suis tout à fait d'accord avec toi.
  • Siri (retrouvé sur iOS) et Dictation (à la fois sur iOS et OS X) utilisent des données d'entrées vocales et les envoient, par voie hertzienne, aux serveurs d'Apple. Un nombre aléatoire est généré pour rendre l'utilisateur anonyme ; les données excluent donc l'adresse électronique, le numéro de téléphone et l’identifiant Apple de l’utilisateur.
    Faudrait savoir : si c'est aléatoire et anonyme et que l'email, le tél et l'ID Apple ne sont pas stockés, pourquoi dire :

    En clair, pendant six mois, Apple serait capable d’associer une requête particulière à un nombre lié à une personne. Dans le cas où l’individu parle de la pluie et du beau temps, cela n’a rien d’alarmant. Mais dans un scénario plus critique où, par exemple, une information sensible pour une entreprise serait divulguée, le sujet pourrait devenir préoccupant.
  • sinople
    Membre chevronné
    Le numéros aléatoire ne permet pas d'identifier la personne, il permet de regrouper les échantillons vocaux pendant les 6 derniers mois.

    Le problème c'est que la liste des échantillons vocaux regroupée permet potentiellement d'établir un profil plus ou moins complet d'une personne qui risque de ne plus être anonyme du tout...
  • danman
    Membre du Club
    Non, il n'oserait pas ( )
    La reconnaissance vocale nécessite beaucoup d'échantillons différents pour être vraiment efficace, donc pour Apple qui doit s'imposer devant Google et d'autres ca n'étonne pas grand monde (et ca n'étonnerais personne du tout que google le fasse). Maintenant c'est sur les dérives d'utilisations volontaires que ces entreprises peuvent faire que ca devient inquiétant, et ce qu'on fait pour se protéger.