CérénIT

Le blog tech de Nicolas Steinmetz (Time Series, IoT, Web, Ops, Data)

Web, Ops, IoT et Time Series - Janvier 2025

29/01/2025 database redis elastcisearch snowflake databricks python poetry ia agent influxdb deepseek zml nvidia stargate openai microsoft llm tailwind french tech

Database

Databases in 2024: A Year in Review : rétrospective des faits marquants dans le monde des bases de données en 2024 agrémentée du point de vue d’Andy Pavlo, un commentateur régulier de l’actualité du monde des bases de données. On retrouve forcément Redis et Elasticsearch sur le sujet des licences, le phénomène DuckDB et la guerre Databricks/Snowflake (mais peut-on encore parler de base de données à leur échelle ?)

Economie & Géopolitique

Carlos Diaz et Alain Garnier - La tech européenne : copier, inventer, ou s’effacer ? : deux visions de la tech en France et Europe qui s’opposent, se rejoignent, se complètent ou se nuancent. Cela part un peu dans tous les sens mais très intéressant.
2025 : Le grand basculement et 2025 : La fin du monde Tech tel qu’on le connaît ! : Les prédictions 2025 de Carlos Diaz, la première version a l’avantage de permettre de préciser un peu chaque point. On y adhère ou pas mais au moins, les arguments sont exposés et font réfléchir.
French Tech : Faut-il fuir la France pour réussir sa startup ? : si le bilan est sévère, on peut se poser la question du mode d’évaluation. Faut-il regarder le bilan selon un prisme américain et où les startups sont financées par les VC ou bien faut-il valoriser un autre modèle plus adapté au marché européen comme le bootstrap (autofinancement ou avec peu de capital externe) ? Après tout, Dassault Systèmes est bien une décacorne… Reste aussi à apprécier la taille des marchés : les finlandais ou l’estonie ont tout de suite admis que leur marché était trop petit - la France serait-elle à une taille intermédiaire mais insuffisante ?

IA

We’re launching a FREE and CERTIFIED course on Agents! : HuggingFace va lancer un cours sur les agents
Introducing smolagents, a simple library to build agents : HuggingFace lance une librairie d’agents pour créer ses premiers agents.
Comptoir IA - “En 2025, si vous n’utilisez pas l’IA, votre entreprise va mourir” - Rafik Smati et “Comptoir IA - “L’IA va-t-elle voler votre job ? Un économiste révèle tout !” : au-delà des titres un peu “putaclick”, des réflexions intéressantes et plutôt pragmatiques sur l’adoption et les impacts de l’IA
Comptoir IA - Comment révolutionner le compute en IA | La vision de ZML par Steeve Morin : Intéressant pour avoir une meilleure perception sur la partie matérielle de l’IA et les évolutions avec la remise en cause probable du monopole de nvidia et le switch d’une infrastructure très orientée entrainement vers une infrastructure orientée inférence.
CafeTech - Netflix n’en finit plus d’augmenter ses prix : le 2nd et le 3ème point abordés dans cette édition de la newsletter permet de faire le point sur le projet Stargate annoncé par OpenAI/Oracle/Softbank et Trump mais aussi nous apprend la fin de l’exclusivité entre OpenAI et Microsoft sur la partie entrainement. Microsoft reste distributeur exclusif et peut utiliser les produits OpenAI dans ses propres produits jusqu’à 2030 au moins.
DeepSeek V3, DeepSeek R1 sur un Raspberry Pi et DeepSeek R1 & WebGPU : DeepSeek est un peu le modèle du moment, tant par son cout d’entrainement et d’inférence que par les capacités qu’il débloque. Si son origine chinoise peut poser des questions sur ses biais, cela n’en demeure pas moins un projet intéressant.
kmavrodis/noRAG-multiagent-doc-qna: le RAG, c’est so 2023/24 - 2025, ce sont les agents. POC intéressant.
Satellites, désinformation et darkweb (et bonne année hein :scintillements :) : où l’on apprend que l’on peut influencer les résultats d’un LLM avec un empoisonnement de moins de 1% de ces données pour 10% des résultats impactés, voir même 0,1% pour avoir encore 7% de résultats impactés.
DeepSeek FAQ : tout ce que vous avez toujours voulu savoir sur DeepSeek.
DeepSeek: The View from China : A lire à partir de “A High Level Closed door…” : résumé d’une conversation d’investisseurs, d’experts en IA et d’industriels sur DeepSeek avec un prisme asiatique.

Python

Announcing Poetry 2.0.0 : le gestionnaire de package python passe en 2.0 et améliore notamment sa conformité avec les spécifications du fichier pyproject.toml.
FastAPI Best Practices : un recueil de bonnes pratiques pour vos projets FastAPI.

Ops

Quickwit joins Datadog : Quickwit, un outil de recherche d’indexation et de stockage de données en temps réel, est maintenant intégré à Datadog. Si cela semble un bon choix et une bonne nouvelle pour l’équipe Quickwit, je suis plus réservé sur la capacité de Datadog de maintenir un projet OSS dans le temps.

Time Series

InfluxDB 3 Open Source Now in Public Alpha Under MIT/Apache 2 License : InfluxData revoit les plans annoncés en 2023 à l’occasion de la sortie de la version d’InfluxDB3 Core en version alpha. InfluxDB Edge est renommé InfluxDB Core mais ne peut requêter que les dernières 72h de données. La version “Community Edition” (version non OSS mais avec le code source disponible) qui devait avoir le même périmètre fonctionnel que InfluxDB 1.x / 2.x OSS n’existe plus et serait remplacée par InfluxDB v3 Entreperise en mode Free Tier. Les choses peuvent encore bouger et l’on peut comprendre la pression des investisseurs ou la nécessité de mieux monétiser leurs produits mais la communauté et les utilisateurs de la version OSS risquent de ne pas apprécier cette évolution. D’ailleurs, entre les plans de 2023 et les dernières annonces, on voit que le périmètre de la version “OSS” ne fait que se réduire. Pour les plus vieux, cela rappelle un peu le principe du shareware des années 90s/2000s avec des versions gratuites mais limitées des logiciels…
Announcing InfluxDB 3 Enterprise free for at-home use and an update on InfluxDB 3 Core’s 72-hour limitation : Finalement InfluxData lève certaines restrictions de la version Core (la vie n’est qu’une suite de boucles de 72h). Pour ceux qui veulent un équivalent de la version OSS 1.x/2.x pour leurs projets personnels, il y aura un “Free Tier” à cet usage dans InfluxDB3 Entreprise. A voir si cela satisfait tout le monde…

Web

Tailwind CSS v4.0 : nouvelle version de ce framework css avec une tonne de nouveautés dont je vous laisse prendre connaissance. Un guide de migration pour vos projets existants est disponible.

Web, Ops, IoT et Time Series - Janvier 2022

26/01/2022 mqtt tinygo influxdb postgresql openhab awstats goaccess grafana esp32 stm32 gitpod wireguard vpn python socket

IDE

Gitpod à la place d’Intellij ou de VSCode ? : Si l’IDE dans le cloud vous intéresse, cet article est assez détaillé sur sa mise en place et sa personnalisation.

IoT

Use MQTT with the Wio Terminal and TinyGo : TinyGo est une version de Go à destination des micro-controlleurs. Le billet d’écrit comment s’abonner à un topic MQTT et afficher un message sur le Wio Terminal.
openHAB 3.2 Release : cette version apporte notamment des améliorations au niveau du moteur de règle avec un version Javascript, le support de Blockly ou encore d’un modèle de règle (rule template).
stm32duino wiki : si vous envisagez de faire un projet arduino avec des cartes ST Micro Electronics STM32…
MQTT 101 Tutorial: Introduction and Hands-on using Eclipse Mosquitto : Introduction et éventuel atelier pratique pour découvrir MQTT avec le broker Mosquitto.
MQTT Essentials : si vous avez besoin de vous (re)mettre à niveau sur MQTT, une série de billets couvrant les différents aspects du protocole et son fonctionnement.
MQTT5 Essentials : la suite avec un focus sur les apports de MQTT v5.

Monitoring & Observabilité

Introducing Grafana University: our virtual hands-on education platform that’s free and easy to use : Grafana Labs ouvre les portes de son université pour se former à ses produits.

Python

Socket Programming in Python (Guide) : Pour tout savoir sur les sockets en Python.

Réseau

Introducing ‘innernet’ : innernet est un gestionnaire de réseau basé sur WireGuard. Il permet de déclarer l’ensemble de votre réseau wireguard et de définir des politiques réseaux (VLAN, Associations, etc)

Time Series

lmmentel /awesome-time-series : un dépot github recensant des projets / librairies / ouvrages / documentation sur les séries temporelles.
InfluxDB FDW 1.1.1 released : InfluxDB FDW est un Foreign Data Wrapper pour Postgresql 10+ qui permet de se connecter à une source InfluxDB 1.x
Santa asset tracking and delivery service : une démo de suivi d’actif avec Warp 10 et Discovery en prenant l’exemple de la livraison des cadeaux de Noel.

Web

GoAccess 1.4, a detailed tutorial : en cherchant à déployer une instance AWStats pour avoir des statistiques de visites sur la base des logs du serveur web nginx, je suis tombé sur GoAccess qui semble offir les mêmes fonctionnalités et même plus tout en étant plus simple à déployer/configurer.

Web, Ops, Data et Time Series - Décembre 2021

15/12/2021 django test api robotframework parquet influxdb raspberrypi dredd tavern grafana

Code & Frameworks

Django 4.0 released : compatible python 3.8+, il appot son lot de nouveautés et notamment la capacité de personnaliser un peu plus le rendu des formulaires pour ce qui me concerne.

Conteneurs & Orchestration

Anti-Patterns When Building Container Images : Jérome Petazzoni donne une liste de mauvaises pratiques et des solutions pour y remédier.

IoT

“New” old functionality with Raspberry Pi OS (Legacy) : la fondation Raspbery Pi annonce l’arrivée d’un OS 64 bits (enfin) mais aussi la mise à disposition d’une version legacy de Raspberry Pi OS basée sur Debian 10/Buster pour ceux qui rencontrent des problèmes avec le passage à Debian 11/Bullseye.

Monitoring & Observabilité

Grafana 8.3 released: Recorded queries, panel suggestions, new panels, added security, and more & What’s new in Grafana v8.3 : Ajout d’une recommendation/suggestion de panel, le nouvel alerting est déployé par défaut, Candelstick en mode beta pour les données financières et amélioration du panel GeoMap pour la version OSS. title: “Web, Ops, Data et Time Series - NovemDécembre 2021”

Tests

RobotFramework : robot opensource d’automatisation tant pour des tests que des process d’automatisation robotique, il semble assez complet pour permettre de faire des tests assez complets tout en proposant une interface relativement simple. A voir ce que cela donne…
Dredd : pour tester vos API au format Blueprint ou OpenAPI
Keep calm and release your API in prod : Tavern permet de tester des API HTTP via une déclariaton des scénarios en YAML. Il s’appuie sur pytests, requests et dispose d’une intégration MQTT. Le billet montre un cas d’exemple.

Time Series

Demystifying the use of the Parquet file format for time series : retour sur le format Parquet et son usage pour des séries temporelles. Au delà de l’explication, il est intéressant de mettre cela en perspective vis à vis d’InfluxData qui a prévu que son moteur de stockage Iox soit notamment basé sur Parquet.

Web, Ops, Data et Time Series - Novembre 2021

24/11/2021 postgresql timeseries timecale warp10 warpstudio influxdb

Containers & Orchestration

Announcing General Availability of HashiCorp Nomad 1.2 : Arrivée des “system batchs jobs” prévu pour gérer des jobs à destination du cluster nomad en lui même (purge, backup, etc) et non des clients. Cette version apporte également des améliorations au niveau de l’interface, ainsi que les “nomad pack”, format de distribution de vos applications à destination de nomad.

IoT

Sortie de Raspberry Pi OS Bullseye et Raspberry Pi 4 à 1,8GHz : Première version de Raspberry Pi OS basée sur Debian 11 et possible overclocking du CPU des RPi4 à 1.8 Ghz (au lieu de 1.5 Ghz)

Monitoring & Observabilité

Vector v0.18.0 release notes : une version avec beaucoup de changements - je vous laisse aller voir les release notes.

Time Series

Annonces & Produits :

Timescale 2.5.0 : support de Postgresql 14, continuous aggregates for distributed hypertables (la fonction fonctionne donc maintenant en multi-nodes) et support des timezone pour la fonction time_bucket_ng
Warp Studio 2.0.6 : version mineure du studio pour la gesion de CORS-RFC1918 ; c’est pour utiliser le studio avec vos instances locales depuis Chrome 92 (et bientôt les autres navigateurs) du fait des restrictrions d’accès mises en place dans les navigateurs.
Release Announcement: InfluxDB OSS 2.1.0 | InfluxData : Arrivée des annotations et des notebooks, le client influx n’est plus distribué avec le serveur (sauf dans l’image Docker), améliorations de flux, amélioration de l’API et de la CLI et mise à jour de l’extension VSCode.
Announcing PyCaret’s New Time Series Module :la librairie “low code” de machine learning PyCaret se dote d’un module de gestion de séries temporelles comprenant 30+ modèles (ARIMA, SARIMA, FBProphet, etc) et fonctions.

Articles :

Intelligence Artificielle et Data Quality : comment corriger des données historiques impactées par la Covid 19 pour améliorer la qualité des prévisions ? : RETEX sur les appels à un call center : comment prendre en compte (ou pas) les variations liées au confinement sur les appels à un call center. L’article présente quatre stratégies et leurs résultats.
Data replication with Warp 10 : présentation du fonctionnement de datalog, le module de réplication des données dans Warp 10.
n8n & Warp 10 - Automate your time series manipulations : la version anglaise hébergée sur le blog de Senx de mon billet sur n8n & Warp 10

Web, Ops, Data et Time Series - Octobre 2021

27/10/2021 postgresql timeseries bi datatask dbt metabase singer timescale influxdb quasardb vector nomad clever-cloud yield pivot warp10 flows vscode kapacitor chronograf telegraf clickhouse

BI

Smart Data Analytics : Exploration des données comptables : pour changer des outils de séries temporelles, je me suis livré au même exercice d’ingestion et de traitement des FEC avec la Smart Data Analytics (SDA) de DataTask. Basée sur singer, dbt et metabase, la SDA permet via une Web UI de définir son flow d’ingestion et de transformation. Une fois ces transformations réalisées, il ne reste plus qu’à explorer les données avec Metabase et produire ses dashboards.

Code

vscode.dev : l’ère de l’IDE dans le navigateur continue après gitpod ou githuab codspaces, c’est au tour de vscode.dev qui permet d’avoir une IDE dans son navigateur. Affaire à suivre…

Observabilité et monitoring

Vector 0.17.0, Vector 0.17.1, Vector 0.17.2 & Vector 0.17.3 avec l’adaptive concurrency qui permet de gérer le “back pressure” pour les destinations accessibles via HTTP, et pour les sources une gestion simplifiée pour le décodage d’éléments et leur “framing”.
Vector Remap Language : extension Vector pour VSCode

Orchestration & conteneurs

damon, un dashboard pour nomad en ligne de commande.
Announcing HashiCorp Nomad 1.2 Beta : ajout des “System Batch” qui sont des (petits) jobs globaux au cluster, des améliorations de l’interface et l’ajout des Nomad Pack, une sorte de catalogue d’applications prêtes à être déployées dans votre cluster.

SQL

PostgreSQL 14 Released! ou en français PostgreSQL 14 ou un thread twitter pour découvrir les nouveautés de cette version : amélioration du support de JSONB, type multirange, fonctions autour des dates, etc.

Sécurité

Popular NPM library hijacked to install password-stealers, miners : analyse de la librairie ua-parser-js compromise dans ses version 0.7.29, 0.8.0 et 1.0.0 avec l’ajout un mining de crypto et un voleur de mot de passes. Le passage en version 0.7.30 / 0.8.1 et 1.0.1 est à faire dans les plus brefs délais. Pour les dépendances indirectes, il est possible d’ajouter dans son fichier package.json: "resolutions": { "ua-parser-js": "^0.7.30" } via Security issue: compromised npm packages of ua-parser-js (0.7.29, 0.8.0, 1.0.0) - Questions about deprecated npm package ua-parser-js

Time Series

Annonces & Produits :

InfluxDB OSS 2.0.9
InfluxDB OSS 1.8.10
InfluxDB Entreprise 1.9.5 - avec des fixes sur l’utilisation mémoire et les index TSI :sourire_narquois:
Telegraf 1.20.2 (avec un fix de memory leak sur le parser influx notamment)
Kapacitor 1.6.2
QuasarDB 3.10.0 Stable Released : Nouvelle version de la base QuasarDB avec son lot d’améliorations et de corrections ; pour une présentation de QuasarDB, voir Time Series France - Edition 2 - QuasarDB, les séries temporelles appliquées à la finance & aux transports.
Announcing the new Timescale Cloud, and a new vision for the future of database services in the cloud et le thread twitter associé : Timescale partage sa vision de ce que doit être une base managée et de la developer experience qu’elle doit offrir. Timescale indique également avoir 3 millions de bases actives par mois (très loin devant les derniers chiffres d’InfluxData ; environ 6 fois mais faut-il encore s’accorder ce qu’est une base: une instance ? un schema ?). Timescale annonce les principes de Timescale Cloud (ex Timescale Forge) qui veut être simple, scalable, connu et flexible. Les deux premiers sont inspirés du monde serverless (découplage compute/storage, auto scalabilité, etc) et les deux derniers du monde de la base de données managiées (du SQL plutôt qu’une API et le fait de bénéficier de tout l’écosystème associé). 10 annonces sont prévues durant le mois d’octobre, quelques-une sont déjà en fin de billet.
Announcing Time Series on Clever Cloud, with TARDIS, Clever Cloud lance son offre Time Series as a Service, basée sur Warp 10 et avec une compatiblité InfluxQL, PromQL, etc.
FLoWS ♡ VS Code WarpScript extension 2.0.0 - SenX : nouvelle version de l’extension Warp 10 pour VSCode avec le support de FLoWS et Discovery.
October 2021: Warp 10 release 2.9.0 : nouvelles capacités (CAPABILITY) autour de fetch & exec, GUARD doit éviter les fuites de données sensibles, ajout support de KML/GML en plus des habituels ajouts de fonctions, améliorations de fonctions et divers corrections de bugs

Articles & Vidéos :

How NOT to Analyze Time Series : article sympathique sur les erreurs de jeunesse d’analyse de séries temporelles.
Penser le monde en time series, la nouvelle solution à vos problèmes d’analyse (M.Herberts/Q.Adam) : conférence à DevoxxFR de Quentin et Mathias pour une introduction aux séries temporelles. Intéressant même si un peu au lance pierre sur la fin.
Les TSDB ne sont pas toujours la bonne solution : approche db ou plateforme ? approche table ou séries ? faible ou forte profondeur d’analyse ? Revue de quelques critères pouvant impacter la façon dont vous manipulez vos séries temporelles.
TL;DR InfluxDB Tech Tips: Multiple Aggregations with yield() in Flux : yield() peut être très pratique pour débugguer son code flux mais permet aussi de récupérer le résultat de plusieurs requêtes pour faire des aggrégations
How to Pivot Your Data in Flux: Working with Columnar Data : InfluxDB, contrairement à une RDBMS, stocke ses valeurs via une approche colonne, qui peut dérouter dans un premier temps. Le billet montre comment utiliser pivot() pour revenir à des manipulations en ligne.
Function pipelines: Building functional programming into PostgreSQL using custom operators : quand un Query Langage (ici SQL) ne suffit plus pour manipuler les séries temporelles, arrivent les fonctions et les opérateurs.
What is ClickHouse, how does it compare to PostgreSQL and TimescaleDB, and how does it perform for time-series data? : un benchmark très complet pour se faire une opinion et même si ClickHouse n’est pas une TSDB.

Pour le retour sur les InfluxDays North America qui ont lieu cette semaine, ce sera pour un prochain billet ou édition du Time Series France Meetup

1 2 3 4 5