IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

ClickHouse Cloud : annonce de la version bêta de la base de données en cloud,
Elle améliore les performances et atténue les temps de latence grâce à la mise en cache multi-niveaux

Le , par Bruno

7PARTAGES

3  0 
ClickHouse, Inc. a annoncé le lancement de ClickHouse Cloud, une base de données en cloud qui serait ultra-rapide selon ses concepteurs et qui simplifierait les analyses pour les entreprises du secteur technologique. « Depuis sa création, ClickHouse est synonyme de vitesse d'interrogation fulgurante sur des ensembles de données massifs. En tant que créateurs de la technologie open source ClickHouse, notre objectif a toujours été d'aider notre communauté d'utilisateurs à tirer parti de cette capacité avec le moins de contraintes possible. C'est pourquoi nous sommes ravis d'annoncer la version bêta de ClickHouse Cloud », a annoncé l’équipe ClickHouse dans un post publié le 4 octobre.

Sans infrastructure à gérer, l'architecture de ClickHouse Cloud dissocie le stockage et le calcul et évolue automatiquement pour s'adapter aux charges de travail modernes. Les utilisateurs n'ont donc pas besoin de dimensionner et de régler leurs clusters pour obtenir des vitesses de requête ultrarapides. De plus, ils ne paient que pour le travail effectué, pas pour les ressources inutilisées.


« Nous sommes fiers d'être l'un des projets open source les plus appréciés et à la croissance la plus rapide, et nous constatons une demande toujours croissante pour les capacités uniques de ClickHouse. C'est pourquoi nous avons voulu éliminer les derniers obstacles à l'adoption en proposant ces fonctionnalités sous la forme d'un produit sans serveur, sans qu'il soit nécessaire de gérer une infrastructure de serveur », écrit l’équipe ClickHouse.

MySQL, un SGBD médiocre ?

MYSQL par exemple est une base de données relationnelle avec une architecture en couches. Les couches de l'architecture comprennent une extrémité de ressources serveur au milieu, le moteur de stockage en bas et l'extrémité client ou l'extrémité d'exécution des requêtes en haut. Il s'agit d'un système de base de données à architecture en trois couches. L'architecture de la base de données explique la relation et l'interaction entre l'extrémité client, l'extrémité serveur et l'extrémité stockage du système. Les différentes couches du système de base de données sont présentées ci-dessous :


Côté client

Le côté client de l'architecture MYSQL est la partie avec laquelle interagissent les utilisateurs finaux du système de base de données. L'utilisateur utilise l'écran de l'interface utilisateur graphique ou l'invite de commande pour soumettre diverses commandes MYSQL au serveur. Pour chaque soumission de commande valide, il y a une sortie valide sur l'écran ; pour chaque soumission de commande incorrecte, il y a un message d'erreur envoyé en retour sur l'écran. Lorsqu'un utilisateur envoie une demande au serveur et que celui-ci l'accepte, une connexion est immédiatement établie pour permettre à l'utilisateur d'effectuer d'autres demandes. C'est ce qu'on appelle la gestion des connexions, une fonction assurée par le côté client de l'architecture.

Côté serveur

Le côté serveur de l'architecture comprend la logique du système de base de données. C'est le cerveau de l'architecture MYSQL. Il reçoit toutes les requêtes envoyées par le client et renvoie également un retour d'information après le traitement de chaque requête. Pour chaque demande envoyée par le client, une connexion est établie, cette connexion est connue sous le nom de thread du côté serveur. Le côté serveur de l'architecture aide à gérer chaque fil établi, ce que l'on appelle la gestion des fils. La gestion des threads est une fonction exécutée par le côté serveur de l'architecture.

Côté stockage

La base de données MYSQL contient différents types de moteurs de stockage qui existent en raison des besoins variables des bases de données. Les moteurs de stockage sont utilisés pour contenir chaque table créée par l'utilisateur dans le système de base de données. Le moteur de stockage facilite le stockage et la récupération des données MYSQL. Le moteur de stockage dispose d'une API qui aide à l'exécution des requêtes à partir de l'extrémité client de l'architecture, simplement en faisant passer des lignes dans les deux sens.

Avec l'émergence du big data, couplée au passage au cloud computing et à la croissance des technologies mobiles, sociales et web, MySQL est idéalement positionné pour se développer dans certaines des startups et entreprises les plus exigeantes et innovantes de la planète. Cependant, Steinar Gunderson qui travaille actuellement pour Google, sur le navigateur Web Chrome, mais qui a également travaillé dans l'équipe chargée de l'optimisation de MySQL pour Oracle, a tout récemment déclaré que « MySQL est une base de données plutôt médiocre… ».

Selon l'équipe ClickHouse, l'infrastructure de données et les solutions d'analyse habituelles sont coûteuses et difficiles à gérer. Les entreprises ont souvent dû faire appel à des experts spécialisés et à des équipes chargées de l'infrastructure, pour obtenir en retour des performances inacceptables, car les solutions existantes avaient du mal à évoluer. L'introduction de ClickHouse Cloud, conçu par les créateurs du projet open source, met à la portée du plus grand nombre des analyses de données de niveau entreprise et « des informations rapides comme l'éclair ». Un utilisateur de ClickHouse Cloud peut se connecter et lancer un nouveau service en quelques clics, et commencer à analyser ses propres données en moins de cinq minutes.

Voici, quelques innovations apportées à la version bêta de ClickHouse Cloud :

  • Le développement d'une mise à l'échelle flexible à la fois du calcul et du stockage en les découplant ;
  • La suppression de la nécessité d'une réarchitecture fastidieuse grâce à l'utilisation d'un stockage objet optimisé comme stockage primaire ;
  • Améliorer les performances et atténuer les temps de latence grâce à la mise en cache multi-niveaux ;
  • Améliorer le rapport coût-efficacité avec une compression des données plus élevée par défaut.

« Avec ClickHouse Cloud, nos développeurs peuvent passer de la conception à la livraison d'une nouvelle fonction analytique en quelques jours, au lieu de plusieurs semaines. Et nos équipes d'exploitation n'ont pas à passer des cycles à régler les performances des clusters, même pour les charges de travail les plus exigeantes », explique Varun Krishnani d'Adevinta. « L'architecture de stockage et de calcul découplée et la tarification basée sur l'utilisation garantissent que nous n'avons pas à surprovisionner l'infrastructure et, par conséquent, notre activité évolue encore plus rapidement pour offrir de la valeur à nos utilisateurs à un coût réduit. »

ClickHouse Cloud, initialement lancé en version bêta sur AWS, et bientôt sur d'autres fournisseurs de cloud, est disponible et sécurisé par défaut, de sorte que les utilisateurs peuvent se concentrer sur le développement d'applications critiques pour l'entreprise sans avoir à régler les paramètres de topologie des clusters. Les développeurs peuvent adopter les dernières fonctionnalités de ClickHouse sans avoir à se préoccuper de mises à jour manuelles. Construit sur des bases solides en matière de sécurité et de confidentialité, le service est déjà conforme aux normes SOC 2 Type I et RGPD.

« Nous utilisons ClickHouse Cloud pour surveiller des millions de points de données sur les performances web en temps réel, afin de nous assurer que nous devenons plus rapides en permanence », explique Daunish Aboobaker, vice-président de l'ingénierie chez Minted. « La plateforme assure une gestion rapide et fiable des données, tout en s'avérant rentable et conviviale. »

Voici, ci-dessous, quelques-unes des caractéristiques de ClickHouse Cloud :

Écosystème

ClickHouse Cloud a la capacité d'interagir de manière transparente avec d'autres systèmes, tels que les sources de données, les interfaces utilisateur et les langages de programmation, souvent avec la simplicité de quelques clics dans le Cloud Console. En s’appuyant sur une base open source solide, l’équipe ClickHouse réalise des investissements importants dans le développement et la maintenance d'un ensemble stratégique d'intégrations, et a un partenariat actif avec de nombreux fournisseurs clés de son écosystème pour les aider à s'intégrer à sa plateforme.

Simplicité

L'une des raisons pour lesquelles la base de données autogérée ClickHouse est devenue si populaire est la simplicité et la facilité avec lesquelles tout le monde peut se lancer. Télécharger un binaire et l'exécuter est essentiellement tout ce qui est nécessaire pour commencer à utiliser le logiciel open source. Et en raison de ses performances, de nombreux utilisateurs se contentent d'un seul serveur de ClickHouse. « Avec ClickHouse Cloud, nous avons poursuivi notre engagement en faveur de la simplicité pour tous les utilisateurs, qu'ils soient opérateurs, développeurs ou analystes », déclare l’équipe ClickHouse.

Cela commence par la mise à disposition d'une interface utilisateur intuitive permettant à un utilisateur de provisionner les services ClickHouse Cloud en quelques minutes. Cette offre sans serveur ne nécessite aucune entrée en ce qui concerne la taille, le nombre ou la topologie des serveurs. Ce travail est effectué par ClickHouse Cloud et n'est pas pris en compte par l'utilisateur.

Une fois qu'un service est opérationnel, les tâches administratives telles que les mises à niveau et l'équilibrage des charges sont effectuées automatiquement et en toute transparence dans ClickHouse Cloud. ClickHouse utilise le stockage objet S3 en tant que stockage principal dans ClickHouse Cloud. Ce qui offre beaucoup plus de flexibilité lors de l'augmentation de la capacité.

Efficacité

La grande majorité des charges de travail analytiques ont une utilisation irrégulière : des charges élevées d'insertions et de requêtes à certains moments de la journée et une charge nettement plus faible à d'autres moments. Les périodes entre les changements de la demande sont généralement trop courtes pour qu'un administrateur puisse ajuster manuellement les serveurs provisionnés. Les ressources restent donc inactives la plupart du temps, ce qui entraîne des dépenses inutiles.

C'est pourquoi ClickHouse Cloud augmente ou réduit automatiquement les ressources, voire interrompt les services en fonction de la demande, afin d'optimiser l'efficacité des ressources. La séparation du calcul et du stockage permet de fournir la ressource spécifique nécessaire dans une situation donnée, plutôt que de devoir surdimensionner un serveur complet pour répondre à l'augmentation de la demande dans un domaine.

Il convient également de noter que notre utilisation du stockage objet comme stockage primaire a un impact important sur la rentabilité du service, en particulier lorsque de grands ensembles de données sont servis. La réduction du gaspillage des ressources présente également un avantage environnemental, qui prend une importance croissante pour nous et pour nombre de nos clients qui cherchent à réduire leur empreinte carbone dans la mesure du possible.

Sécurité

ClickHouse Cloud a été conçu selon une philosophie de sécurité qui imprègne l'ensemble de la plateforme. L’état d'esprit de « sécurité par défaut » signifie que ClickHouse Cloud génère des mots de passe sécurisés et applique le filtrage IP par défaut. Une équipe de sécurité monitore et évalue en permanence les menaces de sécurité, afin de garantir la protection et l'intégrité des données des utilisateurs.

En outre, la plateforme dispose d'une authentification et d'un contrôle d'accès basé sur les rôles, y compris une authentification fédérée via Google. Elle utilise un chiffrement au repos et en transit, ainsi que des contrôles d'accès au réseau, y compris la prise en charge d'AWS PrivateLink, et fournit des journaux d'activité et d'audit.

benchmark

Les résultats de ClickHouse Cloud sont désormais également indiqués dans les résultats publics de ClickBench. Il est bon de voir que des comparaisons transparentes sont désormais disponibles pour les performances du Cloud par rapport aux résultats des systèmes auto-hébergés, ainsi que pour les résultats des concurrents à ClickHouse Cloud.


Système et machine / Temps relatif (plus c'est bas, mieux c'est)



Source : ClickHouse

Et vous ?

Quel est votre avis sur le sujet ?

Quelle analyse faites-vous des résultats de ClickHouse Cloud qui sont indiqués dans les résultats publics de ClickBench ? Crédible ou pas ?

Êtes-vous pour une base de données en cloud de type ClickHouse Cloud, ou alors préférez-vous travailler avec les SGBD de types MySQL ?

Que pensez-vous de ClickHouse Cloud ?

Voir aussi :

PostgreSQL : Supabase annone la mise en libre accès de Postgres-wasm, un serveur PostgreSQL qui fonctionne dans un navigateur

SQL : en l'absence des MAJ importantes depuis des décennies, des critiques appellent à un remplacement du langage

MySQL est une « base de données plutôt médiocre », déclare un ingénieur Oracle en partance, PostgreSQL est une meilleure option pour un SGBD open source, selon lui

Une erreur dans cette actualité ? Signalez-nous-la !