
Pourquoi Baidu s’ouvre enfin ?
Baidu a longtemps défendu un modèle semi-fermé : API public, mais poids privés. L’irruption de DeepSeek-MoE, Yi-1.5 et d’innombrables forks Llama-based a changé la donne.
À mesure que les développeurs chinois migrent vers des dépôts totalement ouverts, ERNIE risquait de sortir des toolchains.
Libérer le code 4.5 sous Apache est donc un pari d’attraction :
Renouer avec la communauté, récupérer des pull-requests et pousser PaddlePaddle comme colonne vertébrale du ML chinois.
Ce que contiendra le dépôt GitHub
- Modèle ERNIE 4.5 complet : configs, scripts de quantisation 8 / 4 bits.
- Checkpoints ERNIE X1 — le raisonneur intermédiaire pour chaînes de pensée.
- Recettes MoE pour convertir 4.5 en version mixture-of-experts légère.
- Convertisseurs ONNX/TensorRT validés sur Ascend 910B et NVIDIA H200.
Objectif : permettre aux équipes de self-host sans disséquer les internals Baidu.
API low-cost & kit de fine-tuning
L’API reste gratuite (200 k tokens/mois) et passe à 0,00056 $ / 1 000 tokens pour les pros — moitié du tarif GPT-3.5.
Le même jour, Qianfan Cloud lancera un studio low-code :
Glisser-déposer dataset, régler epochs, surveiller coût GPU en temps réel.
Un argument pour retenir les start-ups avant qu’elles n’auto-hébergent leur fork.
ERNIE 5 déjà en ligne de mire
Prévu pour S2 2025, ERNIE 5 promet :
- Fenêtre > 128 k tokens ;
- Mode fast/slow thinking façon DeepSeek-R ;
- Multimodal élargi (vision, audio, code).
Baidu espère ainsi reprendre l’avantage sur Doubao (ByteDance) et Kimi grâce à une profondeur contextuelle record et un raisonnement adaptatif.
Effets attendus sur l’écosystème
- Concurrence stimulée : Doubao, MiniMax & Co pousseront leur roadmap open-weight.
- Normalisation PaddlePaddle : influx de contributions vers une API « TensorFlow chinois ».
- Recherche académique : accès libre aux checkpoints X1 va ranimer les travaux sur la décomposition de tâches complexes.
- Réglementaire : Pékin privilégie des fondations nationales transparentes, alignées avec les exigences de sécurité algorithmique.
Comment se préparer ?
- Cartographier vos datasets à fine-tuner, notamment en langues minoritaires.
- Tester PaddlePaddle 3.2 : compatibilité ONNX/LoRA simplifie la migration PyTorch.
- Planifier un POC dès le 30 juin : mesurer mémoire, latence, TCO entre self-host et Qianfan Cloud.
- Surveiller ERNIE 5 : son mode « slow thinking » pourrait baisser drastiquement le coût d’inférence sur tâches simples.
En résumé
En ouvrant ERNIE 4.5 et en cassant les prix, Baidu mise sur l’effet réseau pour rester incontournable face aux modèles open-weight déjà bien ancrés.
Le 30 juin 2025 s’annonce comme une date décisive pour quiconque bâtit des applications en mandarin — et prépare le terrain pour l’arrivée d’ERNIE 5.