IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Mining of Massive Datasets, un livre de Jure Leskovec, Anand Rajaraman et Jeff Ullman,
Critiqué par Thibaut Cuvelier

Le , par dourouc05

0PARTAGES

6  0 
Mining of Massive Datasets


The Web, social media, mobile activity, sensors, Internet commerce and so on all provide many extremely large datasets from which information can be gleaned by data mining. This book focuses on practical algorithms that have been used to solve key problems in data mining and can be used on even the largest datasets.

It begins with a discussion of the MapReduce framework and related techniques for efficient parallel programming. The tricks of locality-sensitive hashing are explained. This body of knowledge, which deserves to be more widely known, is essential when seeking similar objects in a very large collection without having to compare each pair of objects. Stream-processing algorithms for mining data that arrives too fast for exhaustive processing are also explained. The PageRank idea and related tricks for organizing the Web are covered next. Other chapters cover the problems of finding frequent itemsets and clustering, each from the point of view that the data is too large to fit in main memory. Two applications: recommendation systems and Web advertising, each vital in e-commerce, are treated in detail. Later chapters cover algorithms for analyzing social-network graphs, compressing large-scale data, and machine learning.

This third edition includes new and extended coverage on decision trees, deep learning, and mining social-network graphs. Written by leading authorities in database and Web technologies, it is essential reading for students and practitioners alike.

[Lire la suite]



Une erreur dans cette actualité ? Signalez-nous-la !

Avatar de dev_ggy
Membre éprouvé https://www.developpez.com
Le 30/12/2022 à 15:12
Bonjour dourouc05,

Les entreprises françaises reviennent après avoir perdu des plumes à des pratiques plus raisonnables après l'engouement pour le Big Data.

Les seules applications massives qui ont un intérêt sont liées au Deep Learning : pour l'apprentissage du langage, de certains réseaux de convolution et pour la recommandation et le profilage des individus. Tout cela concerne très peu d'entreprises, la majorité des entreprises traitent de petits Dataset voir des moyens pour des problèmes de Machine Learning qui pour des raisons propres à ce type d'algorithmes ont besoin que de petit volume.

Le Big Data a été un mauvais choix stratégique, très couteux en terme humain et financier pour de nombreuses entreprises.

Merci de m'avoir lu,
0  0