Actualités
sur l’IA
Actualités en Podcasts ou à lire
-
Bloom, de Hugging Face (France)
Hugging Face met les watts sur l’open-source : début 2025, le « GitHub de l’IA » propulse Mistral-7B, StableLM 2 et Falcon-180B en tête de son Open LLM Leaderboard et débloque des Inference Endpoints prêts à l’emploi sur AWS, Azure et SageMaker. Résultat : lancer un modèle calibre GPT-3.5 ne prend plus que trois clics,…
-
Luminous, d’Aleph Alpha (Allemagne)
Aleph Alpha en mode V12 : fraîchement installé dans le data-center IA le plus rapide d’Europe, le champion d’Heidelberg met sur les rails Luminous-World, méga-modèle de 300 Md de paramètres taillé pour bousculer GPT-4 — avec transparence « AtMan » et multimodalité native à la clé. Objectif : une IA souveraine, explicable et multilingue pour…
-
Mistral AI, France (2025)
Mistral AI souffle un mistral sur l’open-source : le 13 janvier 2025, la jeune licorne parisienne lâche Codestral v2, LLM 100 % code qui avale 256 k tokens et traque les bugs avant même que vous n’ouvriez le débogueur. Dans sa tornade : Pixtral Large, modèle vision-texte N°1 des classements, et Mistral Large v2, poids…
-
Gemini 2.5 – Google (Google DeepMind) (2025)
Wallo ! Google rallume le turbo IA : après la mise en avant de Gemini 2.5 Pro le 25 mars 2025, Sundar Pichai annonce que le monstre à 2 000 Md de paramètres (fenêtre 1 M tokens) va bientôt propulser Siri sur iPhone, booster toute la suite Workspace et se décliner en version Flash ultra-rapide…
-
Phi-4 de Microsoft (2025)
Microsoft frappe un grand coup : le 30 avril 2025, Redmond dégaine Phi-4-Reasoning, SLM de 5,6 Md de paramètres qui rivalise déjà avec des modèles dix fois plus gros… tout en tournant sur un seul GPU ! Décliné en versions Reasoning+ et mini (3,8 Md), le nouveau cru avale texte, image et audio jusqu’à 128…
-
Nova d’Amazon (2025)
Amazon déclenche le mode hyperdrive : le 30 avril 2025, AWS libère Nova Premier, son modèle le plus costaud — et prof XXL. Cette bête distille Pro/Lite/Micro pour doper la précision de 20 % tout en coupant coûts et latence Amazon Web Services, Inc.. Armée d’une fenêtre de 300 k tokens et d’un RAG natif,…
-
Grok 3 – xAI mai (2025)
Musk secoue l’IA : après avoir largué Grok 3 le 17 février, xAI vient, ce 2 mai, de pactiser avec Microsoft pour que Azure héberge son monstre multimodal — histoire de faire trembler ChatGPT et DeepSeek. 200 000 GPU, mode Big Brain, vérité cash : la bête « maximally truth-seeking » s’apprête à débarquer dans…
-
LLaMA 4 – Meta avril (2025)
Meta lâche la bombe open source : à LlamaCon, le 29 avril 2025, Mark Zuckerberg dévoile LLaMA 4, sa meute MoE (jusqu’à 2 000 Md de paramètres) et l’appli autonome Meta AI. Scout avale 10 M tokens sur un seul GPU, Maverick devient l’assistant multimodal, tandis qu’un Behemoth secret joue le prof géant. Cerise sur…
-
GPT-4.1 – OpenAI (2025)
OpenAI frappe encore : le 14 avril 2025, la firme dégaine GPT-4.1, monstre multimodal qui avale 1 million de tokens, code plus vite que les devs et envoie GPT-4.5 aux oubliettes — tout ça 26 % moins cher. Sous le capot : attention longue portée, savoir rafraîchi et API-only pour propulser vos apps avant l’été.…