Le problème de la mémoire n'est-il pas lié au problème de la batterie? Je ne connais pas grand chose dans les technologies mobiles, mais je sais que le problème de la batterie est primordial.
Après, nous en discutions hier soir avec un copain qui bosse aussi dans le data mining, et une chose intéressante est sorti de cette discussion. Je lui disais, en gros, que sur cette histoire de google qui va héberger les données de ses utilisateurs, moi je m'en fiche car je n'utilise pas les services de google et je n'ai pas de smart phone. Et il m'a fait comprendre que, malgré tout, j'étais concerné. On comprend vite le problème lorsqu'on travaille dans ce domaine, mais c'est très difficile à expliquer à quelqu'un de l'extérieur. Mais je vais essayer.
Les algorithmes qui travaillent sur des masses de données, dont certains ne cherchent rien de précis (curiosité artificielle), déterminent des patrons, des motifs (patterns) et des modèles. Ces algorithmes trient les données, écartent celles qui s'éloignent trop des moyennes, et travaillent sur les données dans leur ensemble. Ils ne considèrent pas les données une par une, mais les prennent dans leur ensemble, en travaillant sur des moyennes (means), des groupes (clusters) et autres notions statistiques (bins, catégories, variation, standard deviation, etc.) qui permettent de regrouper des milliers, voir des millions de valeurs. Ces résultats, modèles et motifs, permettent de mettre au point ce qu'on appelle des canevas (canvas), qui sont des représentations de comportements. De nos comportements. Et ces algorithmes sont aujourd'hui suffisamment efficace pour que ces canevas soient, dans l'ensemble, assez exacts et précis d'un point de vue statistique. Parmi ces canevas, il y a par exemple les modèles prédictifs, qui sont des sortes d'équations qui tentent de prévoir à l'avance le comportement des gens. Certains fonctionnent très bien, notamment ceux qui sont utilisés par les grandes surfaces*; ils vont jusqu'à prédire votre parcours dans le magasin (y compris le "parcours" de votre regard), et statistiquement, ils sont parmi ceux qui donnent les meilleurs résultats.
Donc, le problème de ces canevas, c'est qu'ils sont suffisamment efficaces pour prédire les comportements de tout le monde, même ceux qui ne fournissent pas de données. Et donc, si tout le monde donne ses données à google, même si moi je ne les donne pas, je suis quand-même concerné. Je ne sais pas si mon explication est claire, mais ce que j'essaie de de montrer ici apporte beaucoup de questions, qui sont nouvelles, et auxquelles la légendaire opacité des principaux acteurs de cette évolution (google, facebook et amazon) nous empêche d'avoir les éléments nécessaires au débat.
* à ce sujet, je vous engage à vous poser la question de l'utilité des "cartes client" dans les grandes surfaces, et pourquoi est-ce que leur utilisation s'est si rapidement généralisé.
4 |
0 |