Peut-on battre les modèles de Google ou Meta avec seulement 4 GPU et une disquette Zip ? C’est le pari fou de notre invité.e qui nous explique comment le "Data Design" est en train de ringardiser le scraping massif du web. 🥖 L'IA qui tient sur une disquette : La fin du gigantisme ? Dans cet épisode, on plonge dans le coeur de l'IA souveraine : pourquoi la qualité des données (tokens) prime sur la quantité, et comment les Small Language Models (SLM) vont permettre de décentraliser l'intelligence. 🚀 Ce que vous allez apprendre :
- Baguettotron : Le modèle de 320M de paramètres qui raisonne mieux que des géants.
- Data Design vs Scraping : Pourquoi "nettoyer" la donnée ne suffit plus, il faut la concevoir.
- Le secret des données synthétiques : Comment éviter le "Model Collapse" (l'appauvrissement de l'IA).
- Souveraineté : L'enjeu des bibliothèques nationales et de l'Open Data face au pillage des "Shadow Libraries".
⏳ Timestamps pour naviguer : 00:00 — Jeu d'indices : qui est la pionnière de la tech française ? 04:38 — L'arnaque du "poids ouvert" : qu'est-ce qu'une IA vraiment Open Source ? 14:41 — Data Design : pourquoi Pleias mise sur la provenance plutôt que le scraping 24:11 — Baguettotron : l'IA performante qui tient sur une disquette Zip 36:01 — Small Language Models (SLM) : battre les géants avec seulement 4 GPU 52:00 — L'avenir décentralisé : IA locale, souveraineté et modèles de raisonnement SPOILER ALERT : pour en savoir plus sur notre invitée Anastasia Stasenko , CEO Pleias : https://www.linkedin.c... 🔗 Liens et ressources : Pleias : https://pleias.fr/ Modèles & Datasets : Retrouvez "Common Corpus" sur Hugging Face.
Open Buro
The open European standard for workplace orchestration.
Open Buro is the missing layer that turns isolated open source workplace apps into a unified digital platform — capable of rivaling Microsoft 365 and Google Workspace, without vendor lock-in.
The Problem
Europe has mature open source alternatives for every workplace function: email, documents, project management, video conferencing, chat, calendar. But these tools remain isolated silos. Even with SSO, users get an app catalog — not a platform.
Meanwhile, dominant suites win not because they're better app-by-app, but because they deliver a platform effect: an interlocked ecosystem where everything flows together effortlessly. Leaving becomes perceived as risk, not a project. The dependency is strategic and political, not just budgetary.
The Standard
Open Buro defines how independent open source services assemble and communicate through a common orchestration layer. The standard covers 7 domains:
- Application Integration — Unified SSO, standard app packaging, centralized registry, common settings API
- Cross-service Navigation — Shared home screen, unified nav, global app grid, cross-app command palette
- Data Intelligence — Business object definitions, cross-app event streaming, knowledge graph, unified search
- Platform Collaboration — Cross-service workspaces, threaded comments, unified notifications, shared presence
- Inter-apps & AI — Capability/intent casting, shared file picker, AI agents orchestrating across tools
- Security & Encryption — Platform-level E2E encryption, granular permissions, audit logging
- Mobile & Desktop — Native mobile apps, desktop client, browser extension
The Alliance
The Open Buro Alliance is the collective movement — publishers, institutions, governments — that governs and promotes the standard. Structured as a neutral foundation (modeled on Linux Foundation / CNCF), no single vendor controls the standard.
Founding members:
- Twake (LINAGORA's collaborative platform)
- La Suite numérique (DINUM, French government digital workplace)
We are at the very beginning, join us !
Développer un logiciel libre, c’est cool. Avoir des utilisateur·rices, c’est encore plus cool. Pouvoir en vivre, c’est encore plus plus cool !
WeasyPrint est une bibliothèque Python opensource dont le premier commit remonte au 20 avril 2011, mais ce n’est que depuis 2020 que nous gagnons notre vie avec 💸.
Durant cette présentation, nous verrons l’évolution de nos logiciels libres et comment nous sommes passés d’un projet développé et utilisé dans une entreprise à un produit avec des clients.
Nous parlerons des différentes solutions pour gagner de l’argent avec un logiciel libre, pourquoi nous en avons choisi certaines (et pas d’autres) et comment les mettre en place.
Lucie Anglade
Guillaume Ayoub