CérénIT

Le blog tech de Nicolas Steinmetz (Time Series, IoT, Web, Ops, Data)

Web, Ops, IoT et Time Series - Février 2025

26/02/2025 ia dpf rgpd dsa dma europe ai act

Compliqué pour ce mois de février de ne pas parler d’IA suite au sommet qui s’est tenu en France. Certains l’ont très bien couvert, je n’en parlerais donc pas (directement).

Géopolituque

Nous allons devoir apprendre à travailler ensemble. : les annonces américaines pleuvent depuis la nomination de Trump et le monde du numérique va être impacté même si ce ne sera pas le seul. Trump est bien décidé à protéger et assurer l’essor des Big Tech notamment ; il convient dès lors de réévaluer ses dépendances aux solutions américaines et définir une stratégie de résilience. C’est le propos du billet de Tariq Krim.
L’invalidation attendue du Data Privacy Framework UE-États-Unis : le DPF était déjà contesté par certaines associations européennes au même titre que ses prédécesseurs. Il est encore plus remis en question suite aux premières décisions de Trump. Le RGPD, le DSA, le DMA et l’AI Act vont-ils tenir bon ? Comment le’Europe va-t-elle réagir ? Etes-vous prêts à rappatrier les données sensibles hébergées chez les CSP américains en cas d’invalidation du DPF ?

IA

A new study from Microsoft and Carnegie Mellon University found that increased reliance on GenAI in the workplace leads to decreased critical thinking. : L’IA Générative va-t-elle nous faire perdre notre sens critique ? Il semblerait bien et va-t-elle aller jusqu’à nous rendre bête ? Si l’on se contente du travail de synthèse et pré-maché que nous fournit l’IA Générative, cela est fort probable et ce, de la même façon que les réponses de Stack Overflow copiées/collées sans la moindre analyse. On gagne certes du temps mais on n’apprend moins que si on lit des choses soit même et adieu également à la sérendipité.
Vers un web « back-end » pour l’IA ? & L’avenir des sites web face à l’IA : quelle place pour les producteurs de contenu ? : Si l’IA est l’intermédiaire entre nous et la connaissance, et si nos publications sont synthétisées par une IA, on risque de ne plus avoir aucun intérêt à publier du contenu… Cette intermédiation pose la question de l’accès à l’expertise, de la reconnaissance des experts et des sources associées à la réponse d’une IA. Cela pose aussi la question pour les entreprises de maitriser le récit qui est fait sur elles. Dans un Web 1.0 et 2.0, les codes ont été trouvés ; reste à trouver comment faire à l’heure de l’IA Générative. Cela pourrait mettre à mal tout ce qui tourne aussi autour de la “Creator Economy”. L’IA Générative ne connait que ce qui est public et peut utiliser son contenu en une fraction de seconde, on peut alors être intéressé à ne pas rendre cette information publique pour en tirer parti pour soi (valeur de l’expert) ou pour que les autres ne puissent pas en tirer partie.
Elon Musk’s terrifying vision for AI : La technologie est-elle neutre et ce n’est son usage qui est politique ? Si la technologie des LLM est neutre en tant que telle, les modèles et les produits dérivés des modèles comme ChatGPT, Le Chat ou dernièrement Grok ne le sont pas du fait des choix réalisés lors de l’entrainement.

Nous ne sommes qu’au mois de février et avec toute cette actualité, j’ai l’impression qu’il s’est passé bien plus que deux mois depuis le début de l’année… et c’est loin d’être fini visiblement…

Web, Ops, IoT et Time Series - Janvier 2025

29/01/2025 database redis elastcisearch snowflake databricks python poetry ia agent influxdb deepseek zml nvidia stargate openai microsoft llm tailwind french tech

Database

Databases in 2024: A Year in Review : rétrospective des faits marquants dans le monde des bases de données en 2024 agrémentée du point de vue d’Andy Pavlo, un commentateur régulier de l’actualité du monde des bases de données. On retrouve forcément Redis et Elasticsearch sur le sujet des licences, le phénomène DuckDB et la guerre Databricks/Snowflake (mais peut-on encore parler de base de données à leur échelle ?)

Economie & Géopolitique

Carlos Diaz et Alain Garnier - La tech européenne : copier, inventer, ou s’effacer ? : deux visions de la tech en France et Europe qui s’opposent, se rejoignent, se complètent ou se nuancent. Cela part un peu dans tous les sens mais très intéressant.
2025 : Le grand basculement et 2025 : La fin du monde Tech tel qu’on le connaît ! : Les prédictions 2025 de Carlos Diaz, la première version a l’avantage de permettre de préciser un peu chaque point. On y adhère ou pas mais au moins, les arguments sont exposés et font réfléchir.
French Tech : Faut-il fuir la France pour réussir sa startup ? : si le bilan est sévère, on peut se poser la question du mode d’évaluation. Faut-il regarder le bilan selon un prisme américain et où les startups sont financées par les VC ou bien faut-il valoriser un autre modèle plus adapté au marché européen comme le bootstrap (autofinancement ou avec peu de capital externe) ? Après tout, Dassault Systèmes est bien une décacorne… Reste aussi à apprécier la taille des marchés : les finlandais ou l’estonie ont tout de suite admis que leur marché était trop petit - la France serait-elle à une taille intermédiaire mais insuffisante ?

IA

We’re launching a FREE and CERTIFIED course on Agents! : HuggingFace va lancer un cours sur les agents
Introducing smolagents, a simple library to build agents : HuggingFace lance une librairie d’agents pour créer ses premiers agents.
Comptoir IA - “En 2025, si vous n’utilisez pas l’IA, votre entreprise va mourir” - Rafik Smati et “Comptoir IA - “L’IA va-t-elle voler votre job ? Un économiste révèle tout !” : au-delà des titres un peu “putaclick”, des réflexions intéressantes et plutôt pragmatiques sur l’adoption et les impacts de l’IA
Comptoir IA - Comment révolutionner le compute en IA | La vision de ZML par Steeve Morin : Intéressant pour avoir une meilleure perception sur la partie matérielle de l’IA et les évolutions avec la remise en cause probable du monopole de nvidia et le switch d’une infrastructure très orientée entrainement vers une infrastructure orientée inférence.
CafeTech - Netflix n’en finit plus d’augmenter ses prix : le 2nd et le 3ème point abordés dans cette édition de la newsletter permet de faire le point sur le projet Stargate annoncé par OpenAI/Oracle/Softbank et Trump mais aussi nous apprend la fin de l’exclusivité entre OpenAI et Microsoft sur la partie entrainement. Microsoft reste distributeur exclusif et peut utiliser les produits OpenAI dans ses propres produits jusqu’à 2030 au moins.
DeepSeek V3, DeepSeek R1 sur un Raspberry Pi et DeepSeek R1 & WebGPU : DeepSeek est un peu le modèle du moment, tant par son cout d’entrainement et d’inférence que par les capacités qu’il débloque. Si son origine chinoise peut poser des questions sur ses biais, cela n’en demeure pas moins un projet intéressant.
kmavrodis/noRAG-multiagent-doc-qna: le RAG, c’est so 2023/24 - 2025, ce sont les agents. POC intéressant.
Satellites, désinformation et darkweb (et bonne année hein :scintillements :) : où l’on apprend que l’on peut influencer les résultats d’un LLM avec un empoisonnement de moins de 1% de ces données pour 10% des résultats impactés, voir même 0,1% pour avoir encore 7% de résultats impactés.
DeepSeek FAQ : tout ce que vous avez toujours voulu savoir sur DeepSeek.
DeepSeek: The View from China : A lire à partir de “A High Level Closed door…” : résumé d’une conversation d’investisseurs, d’experts en IA et d’industriels sur DeepSeek avec un prisme asiatique.

Python

Announcing Poetry 2.0.0 : le gestionnaire de package python passe en 2.0 et améliore notamment sa conformité avec les spécifications du fichier pyproject.toml.
FastAPI Best Practices : un recueil de bonnes pratiques pour vos projets FastAPI.

Ops

Quickwit joins Datadog : Quickwit, un outil de recherche d’indexation et de stockage de données en temps réel, est maintenant intégré à Datadog. Si cela semble un bon choix et une bonne nouvelle pour l’équipe Quickwit, je suis plus réservé sur la capacité de Datadog de maintenir un projet OSS dans le temps.

Time Series

InfluxDB 3 Open Source Now in Public Alpha Under MIT/Apache 2 License : InfluxData revoit les plans annoncés en 2023 à l’occasion de la sortie de la version d’InfluxDB3 Core en version alpha. InfluxDB Edge est renommé InfluxDB Core mais ne peut requêter que les dernières 72h de données. La version “Community Edition” (version non OSS mais avec le code source disponible) qui devait avoir le même périmètre fonctionnel que InfluxDB 1.x / 2.x OSS n’existe plus et serait remplacée par InfluxDB v3 Entreperise en mode Free Tier. Les choses peuvent encore bouger et l’on peut comprendre la pression des investisseurs ou la nécessité de mieux monétiser leurs produits mais la communauté et les utilisateurs de la version OSS risquent de ne pas apprécier cette évolution. D’ailleurs, entre les plans de 2023 et les dernières annonces, on voit que le périmètre de la version “OSS” ne fait que se réduire. Pour les plus vieux, cela rappelle un peu le principe du shareware des années 90s/2000s avec des versions gratuites mais limitées des logiciels…
Announcing InfluxDB 3 Enterprise free for at-home use and an update on InfluxDB 3 Core’s 72-hour limitation : Finalement InfluxData lève certaines restrictions de la version Core (la vie n’est qu’une suite de boucles de 72h). Pour ceux qui veulent un équivalent de la version OSS 1.x/2.x pour leurs projets personnels, il y aura un “Free Tier” à cet usage dans InfluxDB3 Entreprise. A voir si cela satisfait tout le monde…

Web

Tailwind CSS v4.0 : nouvelle version de ce framework css avec une tonne de nouveautés dont je vous laisse prendre connaissance. Un guide de migration pour vos projets existants est disponible.

Web, Ops, IoT et Time Series - Décembre 2024

18/12/2024 ia rpi pico raspberry warp10 anthropic mcp pydantic navigateur

Bienvenue dans cette dernière édition pour 2024 où l’IA prend une grande place et la question permanente de ses potentiels et ses risques pour un usage éclairé.

La tech est tout sauf uniquement technique, elle est éminemment politique et sociétale. Cette fin d’année avec les élections américaines l’a bien montré et les déclarations récentes du patron de Palantir indiquant que la révolution IA est américaine ne fait qu’enfoncer le clou et nous oblige à nous poser des questions sur le futur que l’on construit pour éviter l’accélérationnisme / le solutionnisme technologique naïf ou la décroissance et assimilés.

Dans les derniers épisodes du podcast Silicon Carne, Carlos Diaz note l’évolution d’un débat classique “gauche vs droite” vers “croissance vs décroissance” et questionne la notion de progrès. Dans ces podcasts, les épisodes sur le Silicon Valley partagés précédemment ainsi que le voyage de Mathieu Stefani aux USA, il apparait aussi le trait culturel de regarder vers le futur (aux USA) versus vers le passé (en Europe).

Si tout n’est pas rose outre-atlantique, sachons nous en inspirer pour dépasser nos contraintes/limites et faire évoluer nos postures pour construire un futur désirable.

IA

Intelligence artificielle : le match perdu de l’université face au privé & IA, le cri d’alerte de Standford: Depuis 2023, la recherche universitaire n’a plus les moyens financiers et humains pour faire leurs recherches face aux entreprises privées. Stanford propose une loi “Create AI” pour permettre au monde académique de rester dans la course.
PydanticAI : Pydantic se décline en version IA avec un framework pour créer des agents IA.
L’horreur existentielle de l’usine à trombones : quand IA et usines de trombones ne font pas bon ménage - enfin en fonction de où on se place…
Model Context Protocol : Anthropic publie le protocole client/serveur qui fait le pont entre les sources de données et les LLM et ce sous licence opensource. Des connecteurs sont mis à disposition : GDrive, Postgres, etc. Un pas de plus pour la simplification de création d’agents.
compar:IA : beta.gouv.fr lance son comparateur d’IA afin de vous sensibiliser aux performances des différents modèles et les évaluer.
Algorithmique : Un podcast produit par Next en 6 épisodes sur ce qu’est l’intelligence artificielle depuis ses origines à ses opportunités en passant par les débats et les interrogations qu’elle suscite. Des articles reprenant certaines interviews en format long sont également publiés en complément à l’écoute (il faut chercher un peu dans l’historique des articles de l’auteur).
Will AI eat the brower ? : Depuis 20+ ans, nous accédions à la connaissance à travers un navigateur - l’IA va-t-elle le ringardiser et changer notre mode de consommation des données ?

Raspberry

[Tuto] Raspberry Pi Pico 2 W : mise en route, Wi-Fi et première application : Prise en main et premières interactions avec le Raspberry Pico 2W.
Raspberry Pi Compute Module 5 : jusqu’à 16 Go de LPDDR4X et 64 Go de MLC, dès 45 dollars : la déclinaison compacte et sans ports du RPi5 pour des usages industriels est disponible. Reste à trouver le modèle qui vous convient parmi les 32 variantes et voici comment installer Raspberry Pi OS sur l’eMMC.

Time Series

Warp 10 3.4.x : Les améliorations de FILL lui permettant de gérer plusieurs séries d’un coup et les apports de LOWERHULL et UPERHULL pour apprécier les seuils minimum et maximum de séries devraient permettre certaines analyses complémentaires.

🎄 Bonnes fêtes de fin d’année à tous et à l’année prochaine. 🎄

Rendez-vous à la fin du mois prochain pour une nouvelle édition.

Web, Ops, IoT et Time Series - Novembre 2024

27/11/2024 raspberry rpi zephyr ia llm startup silicon valley postgres search agent agi revenus saas

Data

It’s Time to Merge Analytics and Data Engineering (Again) : à moins d’être une très grosse structure, cette séparation des jobs n’existe pas ou très peu. Dans le quotidien ou dans des entreprises plus petites, ces deux rôles se retrouvent souvent dans la même personne.
Combining Semantic Search and Full-Text Search in PostgreSQL (With Cohere, Pgvector, and Pgai) : sujet intéressant même si les résultats de leur démo me laissent un peu sceptique sur la pertinence. Indiana Jones ou mission impossible ne sont pas des films d’aventure dans l’espace avec des technologies aliens…

IA

Silicon Carne - Intelligence Artificielle, le Grand Basculement ! : L’IA est-elle à un niveau suffisant pour remplacer les humains sans forcément attendre l’AGI ? L’AGI est-elle (très ?) proche ou pas ? L’Europe a-t-elle raison de réguler et la France d’avoir un principe de précaution ? Les juniors, premières victimes de l’IA ? Ces sujets sont abordés dans cet épisode et méritent réflexion, que l’on partage ou pas les avis énoncés.
Llama 3.2 Vision : Ollama permet de faire tourner le modèle Llama 3.2 vision
#15 IA pas que la Data - Innovation, open source et impact social : Le parcours de Gaël Varoquaux : Gaël Varoquaux est à l’origine de scikit Learn et a récemment rejoint Probabl, l’entité commerciale qui doit soutenir le développement de scikit-learn. Numéro intéressant sur la démarche et le parcours de Gaël et le cadre de ses recherches mais aussi le monde du machine learning et de l’IA et de son futur.
De San Francisco à Paris : Regard croisé sur l’IA - Entre excellence française et nécessaire lucidité : La France et l’Europe à la croisée des chemins - si l’ouverture des bureaus d’OpenAI peut sembler être une reconnaissance de notre excellence, il s’agit tout autant d’un défi à relever dans un contexte géopolitique chamboulé.
It’s Not About Scale, It’s About Abstraction : Sur les limitations des LLM et ce que les LLM ne peuvent pas faire et les nouvelles approches pour aller plus loin et notamment vers l’AGI.
50% Artificiel : Prenez un podcast en anglais, confiez le à une IA pour la traduction en français et la reprise des voix et voilà !
Introducing H - A Reasearch Update & Introducing computer use, a new Claude 3.5 Sonnet, and Claude 3.5 Haiku - OpenAI lance son ChatGPT à l’assaut des autres applications sur ordinateur - Next : Avec Computer Use ou H, on va vers des LLM capables d’interagir avec les applications de nos ordinateurs. Si la démonstration de Computer Use peut être un peu frustrante, c’est un nouvel horizon qui se crée. Les développeurs d’applications vont-ils devoir améliorer l’accessibilité de leur applications pour que les LLM puissent s’en servir et que cela puisse bénéficier aux premiers intéressés de l’accessibilité ? Gérer des positions de champs avec des coordonnées, cela me rappelle les années 2000s où tout le monde avait le même ordinateur et écran. Ce qui était valable sur un écran l’était sur tous. De nos jours, je suis pas sur que les démos de Computer Use soient transposables d’un ordinateur à un autre… D’où la réflexion sur l’accessibilité…

IoT

Zephyr OS – 1 – Découverte sur Raspberry Pi Pico : Zephyr OS est un OS Temps Réel utilisé sur les microcontrôleurs. C’est un projet sous l’égide de la Linux Foundation et qui vise à être une solution assez complète d’une part mais aussi générique avec le support d’un nombre important de matériels et capteurs. Le billet permet de découvrir l’initialisation d’un projet Zephyr OS sur un Raspberry Pico (v1) et de faire un premier programme.

Management

Re-imagining Technical Interviews: Valuing Experience Over Exam Skills : Si vous n’étiez pas déjà convaincu que la séance de live coding dans le process de recrutement n’était pas forcément la meilleure idée du moment, allez lire cet article pour améliorer votre process de recrutement et évaluer les bonnes compétences.

Raspberry Pi

Raspberry Pi lance son Touch Display 2 (7″, 720p) pour 60 dollars : La fondation Raspberry met à jour son écran tactile officiel.
Raspberry Pi OS se dote d’un Menu de démarrage : Boot Menu : limité au PI5 mais pouvant être néanmoins utile, une pression sur la barre d’espace au démarrage permet de choisir sur quel périphérique la RPi doit démarrer.
Raspberry Pi OS passe à Wayland pour l’ensemble des Raspberry Pi : La RPi migre complètement sous Wayland et abandonne X11. Si les Pi4 et Pi5 utilisaient déjà Wayland, ce sont les autres modèles qui vont en profiter. On peut donc espérer un support prolongé de ces anciens modèles sur la partie OS.

Startups

Le Championnat Européen du VC game : Les exits par pays 🇪🇺 & Les espoirs douchés des start-up européennes : : Si la France met en avant ses startups et ses levées de fond, ce n’est que le début du process - si on va jusqu’au bout et qu’on regarde du coté des exits, le bilan est plus nuancé.
Arte.tv - Silicon Fucking Valley Visite guidée de la vallée de la tech avec Luc Julia : Si vous voulez faire un tour de la Silicon Valley de ses origines à aujourd’hui et au travers de diverses problématiques - super intéressant même si on ne fait que survoler les sujets.
The End Of ARR : le modèle “au siège” serait remplacé par des modèles plus à la transaction, notamment parce que des LLMs pourraient remplacer des humains, mais aussi et surtout du fait d’une évolution des usages.

Rendez-vous à la fin du mois prochain pour une nouvelle édition.

Web, Ops, IoT et Time Series - Octobre 2024

30/10/2024 nist password produit service client ux postgres ia data traefik best practice

Data

Field Notes, Early Fall 2024 Edition : billet résumant l’état de la data et de l’IA par Joe Reis autour de la hype IA Générative, le futur et les turpitudes d’OpenAI, la hype du moment et le décalage entre le marketing de la hype et la réalité de la pratique et des déploiements.

Database

PostgreSQL 17 : comme chaque année vers fin septembre, la sortie de la nouvelle version majeure de PostgreSQL. Pour être dans une version supportée, il vous faut donc utiliser une version 13+ de PostgreSQL. On notera des améliorations notamment sur la partie SQL/JSON, la réplication, les process de VACUUM.

Produit

Why You Need Product Engineers : Un “Product Engineer”, c’est un “Software Engineer” qui prend en compte l’UX client lorsqu’il code. Il ne se limite pas à l’implémentation technique.
La révolution industrielle du service client : leçons de la tech : Pour une entreprise industrielle, la vente s’arrête souvent à l’acte de vente du produit fabriqué alors que les sociétés tech (notamment avec le SaaS), ont compris que l’acte de vente n’était pas la fin mais le commencement de la relation et qu’il était important d’accompagner le client. Evolution nécessaire de faire émerger un département de l’expérience client (ou customer success management) qui couvre tout le cycle de la vente (avant-vente, vente, après-vente + marketing + communication) ; on pourrait même aller jusqu’à mettre le département qualité sous la houlette de cette nouvelle direction…

Ops

Traefik Proxy v3.2 - A Munster Release : Sortie de la version 3.2 du reverse proxy Traefik avec des améliorations coté gestion des certificats (Configuration Let’s Encrypt, CA personnalisés, etc), des améliorations de performance avec Fast Proxy pour les connections HTTP/1, le support de la Kubernetes Gateway API v1.2, le support IPv6 des midlewares, le support d’OpenTelemetry, etc.

Python

Hypermodern Python : Même si ruff a remplacé les flake8/black/isort/..., cela reste un bon recueil de bonnes pratiques pour adopter une architecture moderne d’un projet python.
Stop making your python projects like it was 15 years ago… : dans la même veine que le point précédent pour améliorer l’UX de vos projets python.

Sécurité

NIST proposes barring some of the most nonsensical password rules : les recommendations de mot de passe du NIST ont été mises à jour pour être plus modernes et pragmatiques avec un assouplissement sur les règles de complexité de mot de passe (et qui terminent sur un post-it sur l’écran quand on n’a pas de gestionnaire de mot de passe) et sur la fréquence de renouvellement des mots de passe (on peut ne pas renouveller sauf suspicion de compromission du mot de passe)

Web

Is the .io top level domain headed for extinction? et Noms de domaine : le .io pourrait-il vraiment disparaître ? - Next : L’extension .io pourrait disparaitre en tant qu’extension de pays (“Country Code Top Level Domain”) du fait de décisions géopolitiques récentes. Néanmoins ce process pourrait prendre quelques années et il se pourrait aussi que le .io soit repris par l’ICANN comme une extension générique. Intéressant de connaitres les tenants et aboutissants d’une extension de domaine.

Rendez-vous à la fin du mois prochain pour une nouvelle édition.

1 2 3 4 5