
Mise à niveau : un cerveau bivalent
Le 21 avril 2025, iFLYTEK a injecté un reinforcement learning multi-étapes qui alterne réflexion « fast » (réponses instantanées) et « slow » (chaîne de raisonnement profonde jusqu’à convergence).
Résultat :
- +15 % sur les benchmarks mathématiques internes ;
- +24 % sur les tâches de génération et correction de code ;
- meilleure généralisation cross-domaine, surtout en droit et en médecine.
Cette double cadence permet à Spark X1 de rester vif dans une conversation tout en mobilisant une logique plus lourde quand la complexité l’exige.
Xingchen MaaS : fine-tuner sans friction
La plateforme Xingchen Model-as-a-Service ouvre dès aujourd’hui :
- Téléversez vos données via l’interface web ou l’API S3-compatible.
- Choisissez SFT ou RLHF ; un tableau pré-remplit budget GPU, nombre d’époques et seuil d’arrêt.
- Lancez ; un tableau de bord Grafana suit coût, perplexité et émissions carbone.
Les modèles peuvent ensuite être tirés vers un cluster on-prem en un clic grâce à l’outil Spark Deploy (images OCI prêtes à l’emploi, sans dépendance GPU américaine).
Première implantation automobile
Le 16 mai 2025, Dongfeng Nissan a dévoilé le SUV N7 : Spark X1 gère l’IVI, la reconnaissance vocale en cabine et le mixage audio spatial 3D.
Le modèle tourne sur un SoC chinois Kunpeng – IA, validant la promesse « 100 % compute domestique ». Les gains pour l’utilisateur :
- Dialogues mains libres naturels ;
- Navigation expliquée (« tourne après la pharmacie » plutôt qu’un simple kilométrage) ;
- Playlists générées à la volée en fonction de la météo et de l’humeur détectée.
De l’école au B2B : cas d’usage élargis
Secteur | Exemple | Bénéfice |
---|---|---|
Éducation | Tutorat interactif, correction d’examens | Personnalisation à bas coût |
Santé | Pré-tri des patients, dictée clinique | Confidentialité sur serveurs locaux |
Justice | Analyse de jurisprudence, rédaction d’actes | Chaîne de raisonnement vérifiable |
Mobilité | IVI, maintenance prédictive | Expérience embarquée différenciante |
Le mode unifié fast/slow assure des réponses rapides pour les FAQ tandis qu’il réserve la réflexion longue aux diagnostics ou à la rédaction juridique.
Souveraineté technologique confirmée
iFLYTEK communique largement sur l’absence de GPU américains :
- entraînement sur supercalculateurs Cambricon M2 ;
- stockage chiffré en datacentres chinois certifiés MLPS 3+ ;
- modèle exportable uniquement après « balisage » des poids contre les usages militaires.
Cette posture rassure les ministères et grandes banques qui redoutent les sanctions d’exportation.
Roadmap publique
Étape | Date | Détail |
---|---|---|
Spark X1 v1.2 | Juillet 2025 | Fenêtre 256 k tokens |
Spark Edge | Septembre 2025 | Distillation 3 B params pour IoT |
SDK Multilingue | T4 2025 | Support coréen, russe, arabe |
Spark-Auto++ | 2026 | Conduite assistée niveau 3 générative |
Comment expérimenter dès maintenant Spark X1 ?
- Créer un compte Xingchen MaaS (KYC automatique).
- Importer un jeu de dialogues internes (CSV ou JSON L).
- Lancer un fine-tuning SFT avec 3 époques, budget plafond 50 USD.
- Exporter l’image Docker et la déployer sur votre cluster ARM ou x86 via Helm.
- Monitorer Hallucination Rate et Latency P95 ; ajuster le mode slow/fast si besoin.
Conclusion
En quelques semaines, Spark X1 est passé d’un assistant scolaire ambitieux à une plateforme temps réel multi-secteurs, prête pour l’edge automobile comme pour le datacentre souverain.
Entre gain de performance, facilité de fine-tuning et déploiement sans GPU américains, iFLYTEK propose une alternative crédible aux géants US — et prouve que la Chine mise désormais sur l’IA en mouvement autant que sur l’IA en cloud.