Qu’est-ce que DuckDB ?

DuckDB est une base de données relationnelle en colonnes, orientée OLAP (analytique) et embarquée (embedded et single process). Elle est conçue pour être intégrée dans des applications, des outils d’analyse de données, ou des environnements de science des données. DuckDB est optimisée pour les requêtes analytiques complexes sur de grands ensembles de données, offrant des performances élevées grâce à son architecture en colonnes et à son moteur de traitement efficace.

Quoi de neuf dans la version 1.4 ?

Je vous laisse découvrir les nouveautés dans l’article de blog, mais deux fonctionnalités me semblent particulièrement intéressantes :

  • L’écriture vers des tables Iceberg ! DuckDB intègre le (de moins en moins) petit groupe de logiciels permettant d’écrire vers des tables Iceberg, avec notamment Dremio, Olake, Trino…​ Avec sa capacité de lire des données depuis plusieurs sources différentes, sa faible consommation de ressources, …​, et maintenant la possibilité d’écrire vers Iceberg, DuckDB devient un outil encore plus incontournable dans l’écosystème de la data moderne, pouvant remplacer des solutions comme Spark ou Trino lorsque les contraintes techniques n’obligent pas à du calcul distribué.

  • Le support des instructions MERGE est ajouté. C’est une fonctionnalité très attendue, qui permet de faire des opérations de type "upsert" (update + insert) de manière efficace et atomique. C’est particulièrement utile pour les scénarios de gestion des données où l’on doit synchroniser des tables ou appliquer des modifications conditionnelles.