Actualités IA - Apcl Formation et coaching à Paris 15 ou à distance

Actualités
sur l’IA

ERNIE 4.5 devient open : cap 5 !

ERNIE 4.5 devient open cap 5 - Podcasts et Actualités proposés par Apcl
ERNIE 4.5 devient open cap 5 - Podcasts et Actualités proposés par Apcl
Actus IA avec Apcl
ERNIE 4.5 devient open : cap 5 !
Loading
/
Consultez toutes les autres

Baidu a longtemps défendu un modèle semi-fermé : API public, mais poids privés. L’irruption de DeepSeek-MoE, Yi-1.5 et d’innombrables forks Llama-based a changé la donne.

À mesure que les développeurs chinois migrent vers des dépôts totalement ouverts, ERNIE risquait de sortir des toolchains.

Libérer le code 4.5 sous Apache est donc un pari d’attraction :

Renouer avec la communauté, récupérer des pull-requests et pousser PaddlePaddle comme colonne vertébrale du ML chinois.

  • Modèle ERNIE 4.5 complet : configs, scripts de quantisation 8 / 4 bits.
  • Checkpoints ERNIE X1 — le raisonneur intermédiaire pour chaînes de pensée.
  • Recettes MoE pour convertir 4.5 en version mixture-of-experts légère.
  • Convertisseurs ONNX/TensorRT validés sur Ascend 910B et NVIDIA H200.
    Objectif : permettre aux équipes de self-host sans disséquer les internals Baidu.

L’API reste gratuite (200 k tokens/mois) et passe à 0,00056 $ / 1 000 tokens pour les pros — moitié du tarif GPT-3.5.

Le même jour, Qianfan Cloud lancera un studio low-code :

Glisser-déposer dataset, régler epochs, surveiller coût GPU en temps réel.

Un argument pour retenir les start-ups avant qu’elles n’auto-hébergent leur fork.

  • Fenêtre > 128 k tokens ;
  • Mode fast/slow thinking façon DeepSeek-R ;
  • Multimodal élargi (vision, audio, code).
    Baidu espère ainsi reprendre l’avantage sur Doubao (ByteDance) et Kimi grâce à une profondeur contextuelle record et un raisonnement adaptatif.
  • Concurrence stimulée : Doubao, MiniMax & Co pousseront leur roadmap open-weight.
  • Normalisation PaddlePaddle : influx de contributions vers une API « TensorFlow chinois ».
  • Recherche académique : accès libre aux checkpoints X1 va ranimer les travaux sur la décomposition de tâches complexes.
  • Réglementaire : Pékin privilégie des fondations nationales transparentes, alignées avec les exigences de sécurité algorithmique.
  1. Cartographier vos datasets à fine-tuner, notamment en langues minoritaires.
  2. Tester PaddlePaddle 3.2 : compatibilité ONNX/LoRA simplifie la migration PyTorch.
  3. Planifier un POC dès le 30 juin : mesurer mémoire, latence, TCO entre self-host et Qianfan Cloud.
  4. Surveiller ERNIE 5 : son mode « slow thinking » pourrait baisser drastiquement le coût d’inférence sur tâches simples.

En ouvrant ERNIE 4.5 et en cassant les prix, Baidu mise sur l’effet réseau pour rester incontournable face aux modèles open-weight déjà bien ancrés.

Le 30 juin 2025 s’annonce comme une date décisive pour quiconque bâtit des applications en mandarin — et prépare le terrain pour l’arrivée d’ERNIE 5.