CérénIT

Le blog tech de Nicolas Steinmetz (Time Series, IoT, Web, Ops, Data)

Web, Ops, IoT et Time Series - Janvier 2025

database redis elastcisearch snowflake databricks python poetry ia agent influxdb deepseek zml nvidia stargate openai microsoft llm tailwind french tech

Database

  • Databases in 2024: A Year in Review : rétrospective des faits marquants dans le monde des bases de données en 2024 agrémentée du point de vue d’Andy Pavlo, un commentateur régulier de l’actualité du monde des bases de données. On retrouve forcément Redis et Elasticsearch sur le sujet des licences, le phénomène DuckDB et la guerre Databricks/Snowflake (mais peut-on encore parler de base de données à leur échelle ?)

Economie & Géopolitique

  • Carlos Diaz et Alain Garnier - La tech européenne : copier, inventer, ou s’effacer ? : deux visions de la tech en France et Europe qui s’opposent, se rejoignent, se complètent ou se nuancent. Cela part un peu dans tous les sens mais très intéressant.
  • 2025 : Le grand basculement et 2025 : La fin du monde Tech tel qu’on le connaît ! : Les prédictions 2025 de Carlos Diaz, la première version a l’avantage de permettre de préciser un peu chaque point. On y adhère ou pas mais au moins, les arguments sont exposés et font réfléchir.
  • French Tech : Faut-il fuir la France pour réussir sa startup ? : si le bilan est sévère, on peut se poser la question du mode d’évaluation. Faut-il regarder le bilan selon un prisme américain et où les startups sont financées par les VC ou bien faut-il valoriser un autre modèle plus adapté au marché européen comme le bootstrap (autofinancement ou avec peu de capital externe) ? Après tout, Dassault Systèmes est bien une décacorne… Reste aussi à apprécier la taille des marchés : les finlandais ou l’estonie ont tout de suite admis que leur marché était trop petit - la France serait-elle à une taille intermédiaire mais insuffisante ?

IA

Python

  • Announcing Poetry 2.0.0 : le gestionnaire de package python passe en 2.0 et améliore notamment sa conformité avec les spécifications du fichier pyproject.toml.
  • FastAPI Best Practices : un recueil de bonnes pratiques pour vos projets FastAPI.

Ops

  • Quickwit joins Datadog : Quickwit, un outil de recherche d’indexation et de stockage de données en temps réel, est maintenant intégré à Datadog. Si cela semble un bon choix et une bonne nouvelle pour l’équipe Quickwit, je suis plus réservé sur la capacité de Datadog de maintenir un projet OSS dans le temps.

Time Series

  • InfluxDB 3 Open Source Now in Public Alpha Under MIT/Apache 2 License : InfluxData revoit les plans annoncés en 2023 à l’occasion de la sortie de la version d’InfluxDB3 Core en version alpha. InfluxDB Edge est renommé InfluxDB Core mais ne peut requêter que les dernières 72h de données. La version “Community Edition” (version non OSS mais avec le code source disponible) qui devait avoir le même périmètre fonctionnel que InfluxDB 1.x / 2.x OSS n’existe plus et serait remplacée par InfluxDB v3 Entreperise en mode Free Tier. Les choses peuvent encore bouger et l’on peut comprendre la pression des investisseurs ou la nécessité de mieux monétiser leurs produits mais la communauté et les utilisateurs de la version OSS risquent de ne pas apprécier cette évolution. D’ailleurs, entre les plans de 2023 et les dernières annonces, on voit que le périmètre de la version “OSS” ne fait que se réduire. Pour les plus vieux, cela rappelle un peu le principe du shareware des années 90s/2000s avec des versions gratuites mais limitées des logiciels…
  • Announcing InfluxDB 3 Enterprise free for at-home use and an update on InfluxDB 3 Core’s 72-hour limitation : Finalement InfluxData lève certaines restrictions de la version Core (la vie n’est qu’une suite de boucles de 72h). Pour ceux qui veulent un équivalent de la version OSS 1.x/2.x pour leurs projets personnels, il y aura un “Free Tier” à cet usage dans InfluxDB3 Entreprise. A voir si cela satisfait tout le monde…

Web

  • Tailwind CSS v4.0 : nouvelle version de ce framework css avec une tonne de nouveautés dont je vous laisse prendre connaissance. Un guide de migration pour vos projets existants est disponible.

Web, Ops, IoT et Time Series - Septembre 2024

valkey redis elasticsearch s3 postgres duckdb ibis pandas kestra

Cloud

Database

  • Elasticsearch is Open Source, Again : Elasticsearch et Kibana se voient ajouter une licence AGPL en plus des licences (restrictives) existantes pour revenir dans le monde de l’OSS. La vision positive est de dire que c’est le témoin de la fin d’une époque et que les relations entre les communautés OSS et les CSP américains se sont civilisées. Une vision plus critique consiste à dire qu’il y a toujours les anciennes licences et que le retour à l’OSS est peut être plus symbolique d’autre chose du fait de l’empilement de licences. A voir comment cela évolue mais l’épisode Redis du printemps nuance le sujet…
  • Valkey 8.0: Delivering Enhanced Performance and Reliability - Generally Available: Valkey 8.0.0 Valkey, le fork de Redis 7.2 sous l’égide de la Linux Foundation, a sorti sa version 8.0RC1 en aout et la version finale en septembre - Un point important est la sortie du “single thread model” qui pouvait devenir bloquant pour la scalabilité à force. Pas mal d’autres travaux sur les parties performance / réplication / résilience / observabilité. A ne pas confondre avec Redis 8
  • DuckDB, in-memory, mais pas totalement ! : En fonction de la taille de votre dataset, DuckDB peut être amené à créer (beaucoup) de fichiers temporaires. Utiliser le format interne de DuckDB semble être une bonne option pour éviter de créer ces fichiers temporaires et ne générer que les fichiers parquets ou autre qu’à la fin du process.
  • Announcing DuckDB 1.1.0 : Version 1.1 de DuckDB
  • Search on PostgreSQL, Building Extensions, and pg_analytics with Philippe Noël : Interview du fondateur de ParadeDB qui fait pg_lakehouse, pg_analytics et pg_search avec un retour sur les extensions Postgres.

Middleware

Python

Rendez-vous à la fin du mois prochain pour une nouvelle édition.

Web, Ops, IoT et Time Series - Avril 2024

redis licence xz backdoor valkey ia http2 warp10 duckdb jq hashicorp ibm sxsw

Data

  • DuckDB as the new JQ : DuckDB pouvant lire des fichiers JSON, il était tentant pour certains de manipuler des fichiers JSON en SQL…

Database

  • Redis Adopts Dual Source-Available Licensing | Redis - The race to replace Redis - Linux Foundation Launches Open Source Valkey Community : A compter de la version 7.4, Redis passe d’une version open source (licence BSD) à une double licence “Source Available” pour officiellement contrer les vilains méchants concurrents qui ne reversent pas à la communauté. Bizarrement, la “Common Clause” adoptée en 2018 pour les mêmes raisons n’a pas suffit. La réponse de la communauté ne s’est pas fait attendre avec la création du projet Valkey sous l’égide de la Linux Foundation. Si le passage d’un projet dans le giron d’une fondation peut rassurer ses utilisateurs et contributeurs sur la licence du projet, il n’en reste pas moins qu’il faut sécuriser les revenus de la société éditrice du projet. Cela pose aussi la question de notre attachement à l’Open Source - est-ce par philosophie ou par confort d’utilisation et la gratuité ? La fin de l’argent facile montre aussi les limites du financement des projets OSS via des VC ; certains ont fait évolué leur produit de façon plus subtile (ou pas) ou leur criticité est moindre pour ne pas provoquer une réaction comme pour Redis (Inc).
  • Valkey 7.2.5 : Première version de Valkey, un Redis 7.2.4 nettoyé et avec quelques améliorations. Cela aura été rapide, mais avant de sauter le pas, il va falloir voir comment l’écosystème prend…

IA

Infrastructure as Code

  • HashiCorp joins IBM to accelerate multi-cloud automation : après le changement de licence en aout 2023, il semblait assez évident qu’HashiCorp cherchait à se faire racheter. IBM est donc l’heureux élu avec une valorisation d’HashiCorp à 6.4 Milliards de dollars. Après l’arrivée des projets OpenTofu (fork de Terraform) et OpenBao (fork de Vault) sous l’égide de la Linux Foundation, on pouvait se demander comment cela allait finir pour Hashicorp. Même si IBM contribue à l’open source, on aurait pu espérer meilleure maison pour HashiCorp. IBM n’est pas forcément perçu comme une zone d’innovation. Une piste qui pourrait néanmoins être intéressante avec cette acquisition et pour réconcilier la communauté, c’est que HashiCorp soit rattaché à Red Hat dans une division “Cloud & Automatisation / DevSecOps” au coté de projets comme Ansible par ex.

Sécurité

Time Series

Web, Ops & Data - Mars 2020

ansible molecule test java redis timeseries influxdb warp10

IaC

  • Ansible Molecule 3.0 : l’outil de test des rôles Ansible est passé en version 3.0. Pas mal de changement avec l’externalisation des providers d’infrastructure sous la forme de module python et d’autres rationalisation. Une check list de migration est disponible

Langages

  • What Tens of Millions of VMs Reveal about the State of Java : NewRelic publie une synthèse des versions et configuration de Java déployées dans la nature. ~85% tourne encore sur Java 8 et 11% sur Java 11 et le tout principalement avec les versions fournies par Oracle. On se moquait des communautés PHP (pour PHP 5 à PHP 7) ou Python (2 vers 3) mais visiblement chaque langage d’un certain age rencontre les mêmes soucis.

Time Series

  • RedisTimeSeries Version 1.2 Is Here! : ce module qui apporte des fonctionnalités de séries temporelles à Redis (sans pour autant en faire une base de données orientée séries temporelles) passe en 1.2. On y trouve surtout des améliorations au niveau de la compression des données, des améliorations de performance et une rationnalisation de l’API.
  • SenX publie un guide indiquant les propriétés d’une base de donnée timeseries et comment Warp10 se positionne sur les différents axes. Un joli travaille pédagogique.
  • Warp10 a dépassé les 1000 fonctions
  • InfluxDB 2.0 - beta 6 : améliorations de l’ensemble et l’apparition des premières fonctions géospatiales dans Flux.
  • Le site du Paris Time Series Meetup est en ligne ; à défaut de meetup, vous pourrez y retrouver les vidéos et supports des précédentes éditions.

Paris Time Series Meetup - Edition 4 et 3

timeseries influxdb meetup ptsm telegraf flux tsl redistimeseries redis

L’édition 4 du Paris Time Series Meetup s’est tenue hier soir. J’ai eu le plaisir d’accueillir David McKay, Developer Advocate InfluxData, qui est venu nous présenter la plateforme InfluxDB 2.0, le nouveau langage Flux et l’outil de collecte Telegraf (et les bonnes pratiques associées).

Vous pouvez d’ores et déjà retrouver les vidéos en ligne ; les présentations sont en anglais :

Et pour les ressources complémentaires mentionnées par David McKay :

Concernant l’édition 3 sur TSL et RedisTimeSeries, initiallement prévue en décembre 2019 et replanifiée le 21 janvier, elle aura finalement lieu le mercredi 25 Mars chez OVHCloud. Pour alimenter votre attente et comme indiqué dans le dernier billet de veille mensuelle, OVHCloud a publié erlenmeyer et vient de publier un billet de blog sur le sujet : TSL (or how to query time series databases).

Nous espérons vous y voir nombreux et en attendant, bon visionnage et bonne lecture !

1 2 3