AWS MemoryDB: La base de données Redis persistée et multizones

Rayed Benbrahim

Publié le 22 août 2021

Rubriques

Découvre ces artices

Le dernier né dans la gamme des technologies de bases de données chez Amazon Web Services vient combler un manque à la populaire technologie Redis en proposant de sauvegarder la donnée sur disque sur plusieurs zones de disponibilité.

Avec MemoryDB, AWS va plus loin que son offre ElastiCache en misant sur une technologie qui plat déjà aux développeurs, tout en venant empiéter sur les platebandes de Redis Labs qui jusque-là était la seule plateforme à proposer la persistance à un cluster Redis.

Qu'est-ce que Redis et ElastiCache ?

Redis ou Memecached sont deux technologies de base de données NoSQL qui stockent la donnée au format clé-valeur dans la mémoire vive (RAM) du serveur qui les héberge dans le but d'offrir un temps de réponse le plus bas.

ElastiCache est l'offre de DBaaS d'Amazon Web Services, permettant de démarrer un serveur Redis ou Memcached dans l'infrastructure d'AWS sans avoir à gérer l'infrastructure de cette base de données.

Redis est la base de données NoSQL, orientée clé-valeur, qui a pour but de donner le meilleur temps de réponse.

Redis est la base de données NoSQL, orientée clé-valeur, qui a pour but de donner le meilleur temps de réponse.

Conçu pour la vitesse

Développée en C++ par Salvatore Sanfilippo, la vocation de Redis était de pouvoir lire et écrire de la donnée en offrant les meilleurs temps de réponse possible. Redis est capable d'offrir des temps de réponse inférieurs à une milliseconde, permettant de traiter des millions de requêtes chaque seconde.

Plébiscité pour des cas d'usage où le facteur temps réel est critique, tels que le gaming, les services financiers ou l'industrie de la publicité en ligne pour les enchères en temps réel, Redis a su se faire une place confortable dans le cœur des développeurs par sa simplicité et son efficacité.

On le retrouve très souvent dans les stack techniques des entreprises pour de la mise en place de cache partagé, la gestion de session, l'analyse en temps réel et parfois utilisé comme middleware de messagerie dans des applications distribuées ou en microservices.

Plébiscité par la communauté

Entre sa création et aujourd'hui, Redis est devenu un des favoris de la communauté des développeurs et continue à gagner leurs faveurs. Redis se positionne actuellement aux portes du TOP5 des bases de données préférées des développeurs, derrière les indétrônables acteurs SQL et MongoDB.

De quoi susciter l'intérêt d'AWS puisque, non seulement Redis est listé comme la base de données préférée des développeurs depuis les 5 derrières années selon Stack Overflow, mais c'est également la base de données la plus déployée sur l'infrastructure d'Amazon Web Services.

Redis est la base de données la plus déployée sur l'infrastructure AWS

Redis est la base de données la plus déployée sur l'infrastructure AWS

Les limites de Redis

La force principale de Redis est de pouvoir rapidement ingérer et rendre disponible la donnée. Pour ce faire, le choix a été fait de ne stocker ces données dans la RAM.

Le problème du stockage sur RAM est que lorsque le serveur fait défaut, et il arrive toujours un moment où il fait défaut, les données stockées en RAM sont perdues au redémarrage.

C'est pourquoi, Redis est le plus souvent utilisé comme base de données secondaire, permettant de stocker des données non critiques et sur un laps de temps déterminé.

Les applications vont utiliser une base SQL ou NoSQL qui va persister les données importantes sur disque de telle sorte à ce qu'elles résistent à un redémarrage.

Redis, quant à lui, servira de point d'accès où on va stocker temporairement les données dont on a besoin d'accès rapide ou le temps de les traiter de manière asynchrone et éventuellement de les stocker sur une base principale.

Pourquoi AWS a créé MemoryDB ?

Qu'est-ce que MemoryDB ?

AWS MemoryDB veut reprendre le flambeau là où Redis, dans son édition communautaire open-source, s'arrête.

Amazon MemoryDB pour Redis est une base de données compatible Redis, alliant la rapidité des temps de réponses via le stockage en mémoire vive et la persistance des données sur de multiples régions.

AWS vient compléter son offre ElastiCache avec MemoryDB pour les développeurs souhaitant bénéficier de Redis en tant que base de données principale.

Grâce à sa stratégie multi-AZ, déjà appliquée sur les autres produits de base de données AWS, les écritures sur MemoryDB pour Redis sont répliquées de manière synchrone sur une autre instance dans une zone de disponibilité différente de celle du serveur principal.

Ainsi, à chaque fois qu'une écriture est validée, on peut être certain que la donnée est stockée et qu'une copie va être appliquée dans une autre zone.

Cette stratégie multi-zone va permettre une haute disponibilité pour MemoryDB. Ainsi, si le nœud principal (master) ne répond plus, le nœud secondaire peut prendre le relais.

Les caractéristiques de MemoryDB

Amazon MemoryDB va être compatible avec toutes les méthodes core disponible sur l'API de la version open source de Redis. Elle pourra stocker la donnée sous forme de strings, lists, sets, sorted sets, hashes, streams, geospatial, bitmaps, et hyperloglogs. I

Chaque cluster MemoryDB pourra stocker jusqu'à 128To et disposera d'un nœud secondaire par shard.

Zones de disponibilité

A l'heure où j'écris cet aricle, MemoryDB est disponible dans les régions suivantes:

  • Asie Pacifique (Mumbai)
  • Europe (Irlande)
  • Amérique du Sud (São Paulo)
  • USA Est (Virginie du Nord)

Combien coûte un Cluster MemoryDB pour Redis ?

Le prix de MemoryDB pour Redis dépend de trois facteurs:

  • Temps de disponibilité du nœud suivant la taille
  • Le volume de données écrites dans le cluster (par Go)
  • Les captures d'état de stockage (Snapshot Storage) pour un éventuel backup

Voici les tarifs annoncés au lancement pour un déploiement en Europe:

Le tarif pour le temps de disponibilité:

NomvCPURAMBande PassanePrix/h (Europe)
db.r6g.large213.07Jusqu'à 10 Go/s$0.344
db.r6g.xlarge426.32Jusqu'à 10 Go/s$0.687
db.r6g.2xlarge852.82Jusqu'à 10 Go/s$1.374
db.r6g.4xlarge16105.81Jusqu'à 10 Go/s$2.748
db.r6g.8xlarge32209.5512$5.496
db.r6g.12xlarge48317.7720$8.243
db.r6g.16xlarge64419.0924$10.991

Le tarif pour l'écriture de données: $0.20/Go

Le tarif pour les backups: $0.021/Go par mois

Un pied dans le plat de Redis Entreprise

Avant MemoryDB, la version Entreprise de Redis était la seule option pour avoir une persistance des données d'un cluster Redis.

Redis Entreprise proposait une fonction d'Intelligent tiered access to memory. Dans sa solution Entreprise, Redis a conçu un tunnel de sauvegarde permettant de "refroidir" la donnée au fur et à mesure en fonction de son utilisation ou son inactivité. Une écriture arrivait en RAM puis était progressivement répliquée sur un SSD puis sur un disque dur. Cela permettait de garder d'excellents temps de réponse tout en offrant une résiliance aux données.

Ce tunnel de refroidissement n'existe pas encore chez MemoryDB mais le fait qu'ils mettent un pied dans la persistance des données d'un cluster redis prouve qu'Amazon veut une part du gâteau qu'a créé Redis Labs.

En plus du tunnel de refroidissement via un stockage Flash (SSD), Redis Enrteprise garde l'exclusivité de certaines fonctionnalités telles que les types de données étendus et la réplication active-active sur plusieurs régions. De plus, Redis travaille toujours sur son Datastore Redis Raft.

En savoir plus

Redis est une technologie qui mérite l'attention des développeurs, du moins ceux qui ne la connaissent pas déjà.

Cet article a été inspiré de ce post qui pourra vous donner un peu plus de détails. Vous trouverez plus d'infos sur MemoryDB sur la page AWS.

Derniers articles

Le dernier né des bases de données AWS, MemoryDB for Redis allie la souplesse et rapidité de Redis avec une sauvegarde résiliente, chose qui aujourd'hui n'existait que pour la solution Redis Entreprise. Avec MemoryDB for Redis, AWS entend bien prendre une part du gâteau de Redis Labs.

MongoDB a mis en service la version 5.0 de sa base de données NoSQL. Dans cet article, découvrez les nouveautés qu'apporte cette release ainsi que leurs explications.

Dans l'univers du Big Data et du Cloud, Snowflake a vu le jour en étant le premier fournisseur d'un Data Warehouse sur le cloud 100% scalable. Dans cet article, découvrez ce qu'est un Data Warehouse et en quoi Snowflake est une solution innovante pour les entreprises.

Souvent portée par une équipe d'analystes, la QA vient supporter l'équipe tech pour assurer que les évolutions en cours de développement et récemment déployés ne viennent pas perturber l'application. Dans cet article, découvrez comment les méthodes Shift-Left et Shift-Right viennent se complémenter pour assurer un bon niveau de qualité du logiciel déployé.

Docker Desktop est le client permettant de faire tourner des containers depuis son poste. Découvre ce tutoriel pour installer Docker sur ton Mac et faire tourner tes premiers containers.

Docker Desktop est le client permettant de faire tourner des containers depuis son poste. Découvre ce tutoriel pour installer Docker sur ton PC Windows et faire tourner tes premiers containers.

Les Jobs