100% Open Source • Apache V2 License

Open Kubernetes Data Platform

Une plateforme de données cloud-native, libre et 100% open source. Modulaire, souveraine et propulsée par la communauté.

7+
Contributeurs
~20
Téléchargements /sem.
2024
Lancement du projet

Qu'est-ce que OKDP ?

OKDP (Open Kubernetes Data Platform) est une plateforme complète de services de gestion de données, composée de logiciels et produits open source conteneurisés, s'exécutant sur une infrastructure Kubernetes.

OKDP couvre l'intégralité du cycle de vie de la donnée : collecte, stockage, traitement, analyse et exposition. Sa conception modulaire permet de déployer l'ensemble des composants ou de ne sélectionner que ceux nécessaires à vos besoins.

Pourquoi OKDP ?

📊

Data Centric

Une plateforme complète couvrant tout le cycle de vie de la donnée avec une gouvernance intégrée, facilitant le partage et minimisant la duplication.

☁️

Cloud Native

Conçue nativement pour Kubernetes et les environnements cloud modernes, garantissant haute disponibilité, scalabilité et support multi-cloud.

🔓

Véritablement Open Source

100% open source sous licence Apache V2. Maîtrise totale du cycle de vie technologique, de la construction au déploiement, sans verrouillage éditeur.

🏛️

Souveraineté & Coûts

Gardez une autonomie totale sur votre infrastructure de données tout en éliminant les coûts de licence. Libre d'utilisation, de modification et de déploiement à toute échelle.

🎛️

Modulaire & Durable

Une architecture flexible qui s'adapte à vos besoins. Basée sur Kubernetes pour prévenir la dette technique et assurer une modernisation continue.

🌍

Communautaire

Construit par la communauté, pour la communauté. Une collaboration ouverte entre organisations publiques et privées au sein d'un écosystème grandissant.

Architecture Modulaire

OKDP offre une architecture modulaire vous permettant de sélectionner et déployer uniquement les composants nécessaires à votre cas d'usage.

Moteur de Requêtes

Moteurs SQL haute performance pour données distribuées.

IA & Machine Learning

Plateforme MLOps complète pour les workflows de data science.

Traitement & Orchestration

Moteurs de traitement de données et orchestration de workflows.

Stockage & Catalogue

Lakehouse moderne avec tables transactionnelles et gestion des métadonnées.

Visualisation & Base de données

Fondation Kubernetes

Compatible avec toutes les distributions Kubernetes (RKE, EKS, AKS, GKE) avec gestion intégrée de la sécurité, de l'observabilité et des ressources.

Sécurité & RBAC TLS/Certificats SSO & LDAP Monitoring Backup & DRP Load Balancing Contrôle Ingress Ordonnancement

Chaque composant peut être déployé indépendamment, vous permettant de construire une plateforme de données sur mesure.

Roadmap

2026 : Évolution & Échelle

🔨

Construction Technologique

Continu

Construction continue du code source et des images Docker pour l'ensemble des technologies de la plateforme.

🧊

Apache Polaris & Iceberg

T1-T2

Intégration d'Apache Iceberg et du catalogue Polaris avec support STS S3 et RBAC.

💻

Nouvelle Interface & Serveur

T2-T3

Refonte de l'interface utilisateur et du serveur pour une expérience unifiée et performante.

🔄

Apache Airflow

T3-T4

Implémentation d'Apache Airflow pour l'automatisation et l'orchestration des workflows.

Thèmes Traverses

🔒
Sécurité

Authentification OIDC de bout en bout

⚖️
Ressources

Système de gestion de files d'attente

🤖
MLOps

Kubeflow & MLflow

📊
Observabilité

Logs, monitoring, audit

2024-25 : Fondation
Voir les jalons précédents

Technologies Data Initiales

Intégration réussie des technologies cœur : JupyterHub, Apache Spark, Trino, Hive Metastore et Superset.

Images Spark & Jupyter

Fourniture et support des images de base officielles pour Apache Spark et JupyterLab.

OKDP Serveur/UI

Publication de la première version d'OKDP Serveur et de l'interface utilisateur de gestion.

Sandbox & Documentation

Lancement d'un environnement sandbox complet avec guide utilisateur et application de test de bout en bout.

Rejoignez la communauté

OKDP est construit par la communauté, pour la communauté. Participez à l'avenir des plateformes de données open source.

Réunion Technique Hebdomadaire

Tous les mercredis à 10h00 (CET) - Contactez-nous pour recevoir les détails.

Nous contacter pour participer

Appel à contribution

Aidez-nous à construire la plateforme. Que vous soyez expert en infrastructure, data engineering ou documentation, vous avez votre place.

Contribuer sur GitHub

À propos de TOSIT

TOSIT est une association qui promeut les initiatives communautaires pour créer des technologies et plateformes véritablement open source. Elle héberge le projet TDP, initié par la DGFiP et EDF.

Depuis janvier 2024, la DGFiP a lancé l'aventure OKDP, rejointe par la suite par Orange. L'association rassemble de nombreuses entreprises et administrations, dont BPCE (Banque Populaire, Caisse d'Epargne et Natixis), Société Générale, entre autres.

La participation aux projets TOSIT est ouverte à tous, avec pour objectif de garantir une stack technologique accessible, performante et puissante pour tous.