Actualités IA - Apcl Formation et coaching à Paris 15 ou à distance

Actualités
sur l’IA

Ernie 4.5 / Wenxin Yiyan 4.5 de Baidu

Ernie 4.5 et Ernie X de Baidu Actualites - Apcl podcast
Ernie 4.5 et Ernie X de Baidu Actualites - Apcl podcast
Actus IA avec Apcl
Ernie 4.5 / Wenxin Yiyan 4.5 de Baidu
Loading
/
Consultez toutes les autres

Robin Li, patron de Baidu, le géant chinois de la recherche en ligne, a été le premier en Chine à lancer un équivalent de ChatGPT avec son chatbot ERNIE Bot (Wenxin Yiyan) dès mars 2023.

Ce service s’appuie sur la famille de modèles de langage ERNIE (Enhanced Representation through Knowledge Integration).

Il est développée par Baidu depuis 2019. Après ERNIE 3.0 puis 3.5 (juin 2023).

Baidu a présenté en octobre 2023 ERNIE 4.0, qu’il a qualifié d’équivalent à GPT-4 en termes de capacités. Source : reuters.com.

Quelques mois plus tard, en mars 2025, Baidu a annoncé la version ERNIE 4.5 ainsi qu’un modèle spécialisé de raisonnement baptisé ERNIE X1.

Baidu les a rendus disponibles gratuitement pour le grand public via Ernie Bot.

Sources : kr-asia.com, en.wikipedia.org.

Cette décision agressive (offrir gratuitement l’accès à ses tout derniers modèles) vise clairement à maximiser l’adoption en Chine et à devancer l’influence des services OpenAI non disponibles officiellement dans le pays.

Techniquement, ERNIE 4.5 est un modèle de fondation multimodal de très grande taille, bien plus avancé que les versions 3.x précédentes (qui tournaient autour de 10 milliards de paramètres seulement). Source : en.wikipedia.org.

Baidu ne communique pas la taille exacte de 4.0/4.5. Cependant, on peut supposer un ordre de grandeur de plusieurs centaines de milliards de paramètres, étant donné les prétentions de performance.

  • Du texte,
  • Des images,
  • De l’audio
  • Et de la vidéo de manière native.

Source : kr-asia.com.

Baidu s’aligne ainsi sur les modèles multimodaux concurrents (Gemini, GPT-4 vision, etc.).

Par exemple, une requête utilisateur peut inclure une image ou un clip vidéo, qu’Ernie analysera avant de formuler sa réponse textuelle.

La fenêtre de contexte exacte n’est pas divulguée, mais Baidu mentionne des améliorations de la mémoire du modèle et de sa cohérence logique sur de longs dialogues. Source : kr-asia.com.

Par conséquent, cela suggère un contexte étendu (possiblement 100k tokens ou plus, pour rester compétitif).

Surtout, Baidu indique avoir introduit de nouvelles techniques pour améliorer les performances de 4.5. Notamment :

  • Un mécanisme FlashMask de masquage dynamique de l’attention,
  • Une architecture de mixture-of-experts multimodale hétérogène,
  • De la compression spatio-temporelle des représentations,
  • Une construction de corpus centrée sur la connaissance,
  • Un affinement par auto-feedback en post-entraînement.

Source : en.wikipedia.org.

Ce cocktail d’innovations vise à accroître la capacité de raisonnement logique d’ERNIE 4.5, à réduire les hallucinations et à le rendre plus efficient.

En parallèle, le modèle annexe Ernie X1 se focalise sur le raisonnement approfondi et l’utilisation d’outils :

C’est un LLM spécialisé dans les tâches complexes (il peut par exemple effectuer des recherches externes, du question-réponse sur documents, de l’interprétation de code, ou générer des images via diffusion). Source : kr-asia.com.

En somme, Baidu a opté pour une architecture duale :

Ernie 4.5 comme généraliste multimodal, et X1 comme « cerveau » analytique pouvant être appelé pour les cas difficiles, un peu à l’image de l’approche system 1 / system 2.

Baidu revendique que Ernie 4.5 surpasse GPT-4.5 de chez OpenAI sur de multiples benchmarks internes. Sources : en.wikipedia.org, kr-asia.com.

Il faut noter que GPT-4.5 était une version intermédiaire non publique de GPT-4, mais la comparaison donne une idée de l’ambition :

Baidu estime avoir atteint (voire dépassé) le niveau de ChatGPT sur les tâches mesurables.

De son côté, Ernie X1 est annoncé au même niveau de performance que DeepSeek R1, un modèle chinois concurrent spécialisé dans le raisonnement. Source : en.wikipedia.org.

Surtout, Baidu met l’accent sur les coûts ultra-réduits de son service :

En effet, Ernie 4.5 coûterait seulement 1% du prix d’utilisation de GPT-4.5 pour des performances équivalentes. Source : kr-asia.com.

Concrètement, Baidu facture via son cloud seulement 0,004 RMB (0,00056 USD) pour 1 000 tokens en entrée et 0,016 RMB (0,0022 USD) par 1 000 tokens générés en sortie, soit bien en-deçà des tarifs OpenAI. Source : kr-asia.com.

Ernie X1 est encore deux fois moins cher.

Cette politique tarifaire agressive, couplée à la mise à disposition gratuite pour les utilisateurs finaux, montre l’objectif :

Capter un maximum d’utilisateurs et de développeurs en Chine, en supprimant la barrière du coût.

Baidu voit en Ernie 4.5 un instrument pour conforter sa position de leader domestique de l’IA et contrer l’attractivité des modèles étrangers.

Depuis qu’OpenAI a interdit l’accès à ses API en Chine en juillet 2023, de nombreuses entreprises chinoises se sont retrouvées sans solution GPT.

Baidu (ainsi qu’Alibaba et d’autres) a donc profité de l’occasion pour offrir des services de remplacement et faciliter la migration. Source : reuters.com.

En rendant Ernie Bot gratuit pour le public dès 2023, puis en ouvrant Ernie 4.0 Turbo à tous en 2024, Baidu a accumulé un large bassin d’utilisateurs (300 millions d’utilisateurs annoncés en juin 2024). Source : reuters.com.

Cette base lui fournit des données d’usage précieuses pour améliorer ses modèles via l’apprentissage itératif.

  • Gratuité pour les particuliers (via l’app mobile et le site Ernie Bot),
  • Monétisation indirecte via les entreprises (accès via l’API PaddlePaddle/Qianfan de Baidu).

Source : reuters.com.

L’intégration de ERNIE 4.5 dans l’écosystème Baidu est par ailleurs complète :

Le moteur de recherche Baidu intègre Ernie Bot en mode assistant.

D’ailleurs, en septembre 2024, Baidu a rebaptisé en chinois le bot en “Wenxiaoyan” et l’a positionné comme assistant de recherche intelligent dans son moteur).

Source : en.wikipedia.org.

Baidu propose aussi Ernie 4.5 sur son cloud pour les développeurs tiers, tout en promouvant son framework open source PaddlePaddle pour le fine-tuning de modèles.

L’objectif est de construire une plateforme IA souveraine en Chine, couvrant du framework (PaddlePaddle) au modèle (Ernie) jusqu’aux applications (Ernie Bot, moteurs dédiés).

En outre, Baidu met en avant des services à valeur ajoutée autour d’Ernie 4.5.

Par exemple un écosystème d’applications pilotes (code assistant, génération d’images, etc.) tirant parti de X1.

On peut interpréter la dualité 4.5/X1 comme une volonté de s’aligner sur la tendance des “IA agent” :

La combinaison d’un LLM général et d’un LLM raisonneur permet de construire des agents capables de planifier des actions complexes (recherche web, exécution de code, etc.), sujet sur lequel OpenAI et autres travaillent.

Baidu tente ainsi de ne pas se laisser distancer sur cette prochaine étape.

Enfin, en termes de communication, Baidu insiste sur le fait que toutes ces avancées sont réalisées à moindre coût et sur du matériel chinois.

Effectivement, leurs derniers modèles sont entraînés sur des GPU maison ou des alternatives aux A100/H100 dont l’export vers la Chine est restreint.

Cela alimente le discours de souveraineté :

Ernie 4.5 prouve que la Chine peut innover et atteindre un niveau de classe mondiale en IA générative sans dépendre des technologies américaines.

Ceci, tout en le faisant à un coût inférieur.

Finalement, c’est un argument fort pour convaincre les entreprises chinoises de basculer sur ces solutions nationales. Source : kr-asia.com.