Actualités IA - Apcl Formation et coaching à Paris 15 ou à distance

Actualités
sur l’IA

Nova d’Amazon (2025)

Nova d'Amazon mai 2025 - Apcl podcast
Nova Amazon mai 2025 - Apcl podcast
Actus IA avec Apcl
Nova d’Amazon (2025)
Loading
/
Consultez toutes les autres

jeff bezos Amazon Web Services (AWS) a également accéléré ses efforts en IA générative, culminant avec l’annonce fin 2024 d’une nouvelle gamme de modèles baptisée Amazon Nova.

Révélée lors de la conférence AWS re:Invent à Las Vegas en décembre 2024 techtarget.com, la famille Nova constitue les modèles de fondation de dernière génération d’Amazon, disponibles exclusivement via sa plateforme Bedrock techtarget.com.

Il s’agit d’une réponse d’AWS à l’omniprésence de modèles comme GPT-4 : Amazon souhaitait doter son cloud de modèles maison de haute performance, plutôt que de s’appuyer uniquement sur des partenaires. Nova n’est pas un modèle unique mais une suite de modèles spécialisés :

Un LLM texte relativement petit, optimisé pour la faible latence et le faible coût, avec un contexte étendu (128k tokens). Utile pour des tâches rapides de résumé, traduction, brainstorming ou calculs simples.

Un modèle multimodal capable de traiter à la fois du texte, des images et de la vidéo. Il peut accepter plusieurs images en entrée et jusqu’à 30 minutes de vidéo, pour produire des analyses ou du texte en sortie.

Sa fenêtre contextuelle maximale atteint 300k tokens, ce qui permet de gérer de très longues entrées multimédia.

un modèle multimodal orienté données structurées métier, conçu notamment pour l’analyse de documents financiers volumineux ou de gros paquets de code. Il dispose lui aussi d’un contexte allant jusqu’à 300k tokens et peut ingérer par exemple 15 000 lignes de code d’un coup.

Le modèle le plus ambitieux, axé sur le raisonnement complexe.

Toujours en cours d’entraînement fin 2024, il devait être disponible courant 2025.

Ce modèle phare vise les cas d’usage les plus exigeants en termes de compréhension et d’inférence, et devrait être le pendant d’un GPT-4 haut de gamme dans l’écosystème AWS.

En complément, la gamme comprend aussi Nova Canvas (modèle de génération d’images) et Nova Reel (modèle de génération de vidéos), étoffant ainsi les capacités créatives offertes sur Bedrock.

Avec Nova, Amazon dispose enfin de ses propres modèles génératifs de haut niveau, après avoir longtemps proposé surtout des modèles tiers (comme Jurassic d’AI21, Claude d’Anthropic, Stable Diffusion, etc.).

Cette présentation modulaire de Nova permet à AWS de couvrir un large éventail de besoins – du chatbot textuel bon marché aux analyses multimodales sophistiquées – sous une même bannière technologique. Source techtarget.com.

Les modèles Nova s’appuient sur des architectures transformeurs modernes, enrichies pour maximiser la fenêtre de contexte et la multimodalité, tout en offrant des mécanismes de contrôle pour un usage en production.

Amazon a optimisé ses temps d’inférence de sorte à obtenir des réponses à faible latence et à coût réduit, ce qui est crucial pour des déploiements à grande échelle sur AWS.

Malgré cela, il prend en charge jusqu’à 128 000 tokens de contexte, chiffre très élevé qui suggère l’utilisation de techniques d’attention efficaces (par ex. sparse attention ou ALiBi).

Avec 300 000 tokens de contexte. Source techtarget.com.

Gérer un tel contexte dans un modèle nécessite probablement des approches innovantes :

Amazon pourrait combiner fenêtre glissante, indexation sémantique ou récupération de contexte pertinent (retrieval) pour que le modèle n’ait pas à « lire » en entier les 300k tokens à chaque requête.

Néanmoins, l’utilisateur a la liberté de fournir d’énormes entrées (un corpus de documents, un long métrage vidéo transcrit, etc.) et le modèle s’organise pour en tirer les informations utiles.

Traiter des vidéos de 30 minutes implique de pouvoir encoder des séquences audio-visuelles considérables, en plus du texte.

Il est possible qu’Amazon ait segmenté le traitement (extraction de features image par une CNN ou ViT, embeddings audio via un module type Whisper) puis intégré ces vecteurs dans le transformeur principal, mais les détails ne sont pas publics.

Concernant Nova Premier, bien que peu d’éléments aient filtré, on peut supposer qu’il s’agira d’un modèle de très grande taille (des centaines de milliards de paramètres) combinant les avancées de Lite et Pro, pour exceller en raisonnement général – Amazon prenant le temps de le peaufiner pour rivaliser avec les meilleurs en 2025.

Un trait distinctif de la sortie de Nova a été l’accent mis sur la fiabilité et la personnalisation.

AWS a dévoilé de nouvelles fonctionnalités parallèlement aux modèles pour s’attaquer aux problèmes connus des LLM, notamment les hallucinations.

L’une d’elles est le système d’Automated Reasoning Checks (vérifications automatiques par raisonnement formel), proposé en préversion. Source techtarget.com.

Il s’agit d’outils de validation automatique qui analysent les réponses générées par le modèle et détectent les incohérences ou les assertions douteuses, afin de signaler qu’une vérification humaine ou une intervention est nécessaire avant d’agir sur ces réponses.

Cela introduit un niveau de supervision supplémentaire pour les applications critiques, et répond au besoin des entreprises de garder le contrôle sur les productions de l’IA.

Une autre innovation est l’outil de Model Distillation (distillation de modèle) intégré à Bedrock.

Celui-ci permet aux clients AWS de générer un modèle plus petit à partir d’un grand modèle Nova, en utilisant le grand modèle pour produire un corpus d’entraînement synthétique (data synthesis) afin d’enseigner au modèle réduit à imiter ses performances. Source techtarget.com.

Par exemple, une entreprise peut partir de Nova Pro et distiller un modèle intermédiaire qui sera très performant sur son domaine (via des données et requêtes pertinentes) mais bien moins coûteux à déployer, ce qui est intéressant pour un usage privé.

Techniquement, c’est un procédé de teacher-student automatisé mis à disposition des clients, montrant la volonté d’Amazon de rendre ses modèles adaptables et économiques.

En ce qui concerne l’infrastructure, les modèles Nova tirent évidemment parti du solide écosystème AWS :

Ils ont probablement été entraînés sur des clusters GPU ou sur les accélérateurs maison d’Amazon (Trainium pour l’entraînement, Inferentia pour l’inférence).

Durant re:Invent 2024, AWS a d’ailleurs annoncé la deuxième génération de sa puce Trainium et mis en avant son optimisation pour les grands modèles. Source techtarget.com.

Nova est donc un projet qui associe intimement software et hardware made in Amazon.

En résumé, le volet technique de Nova combine l’échelle (énormes contextes, multimodalité incluant la vidéo), l’optimisation (différentes tailles de modèles pour latence/coût variable) et des garde-fous (vérif. d’hallucinations, distillation, contenus sûrs) afin de répondre aux exigences des utilisateurs professionnels d’AWS.

L’arrivée de Nova enrichit considérablement les capacités d’Amazon en IA.

Même si Amazon n’a pas (pour l’instant) publié de scores précis sur des benchmarks publics pour comparer Nova à GPT-4 ou PaLM, on peut évaluer ses possibilités d’après ses spécifications.

Nova micro ffre déjà des capacités très utiles : avec 128k tokens de contexte, il peut digérer intégralement de très longs textes.

Par exemple, un utilisateur pourrait fournir à Nova Micro un rapport annuel de 200 pages ou l’intégralité d’un roman, et demander un résumé ou une analyse thématique en une seule requête – là où les modèles précédents (tels qu’Amazon Titan ou même GPT-4 standard) auraient dû fractionner le texte.

La qualité des réponses de Nova Micro sur des tâches générales (chatbot, Q&R, reformulation…) est probablement inférieure à GPT-4 Premier, mais son efficacité en fait un excellent choix pour des usages à grande échelle où chaque milliseconde compte.

Nova Lite, avec sa compréhension multi-images et vidéo, introduit des capacités inédites sur AWS.

Un cas d’utilisation possible est, par exemple, de fournir à Nova Lite une série d’images médicales (radios, IRM) accompagnées de notes de texte, pour obtenir un compte-rendu analysant chaque image à la lumière des informations textuelles – ce type de fusion de modalités était jusqu’ici l’apanage de projets de recherche.

De même, analyser un clip vidéo de 30 minutes signifie que Nova Lite peut parcourir le contenu audiovisuel (scènes, paroles prononcées) et en extraire des insights ou des descriptions détaillées.

Cela ouvre la porte à des applications comme la surveillance vidéo intelligente, le résumé automatisé de réunions enregistrées, ou l’assistance à l’édition vidéo (ex : “repère-moi les segments où l’on mentionne tel produit dans cette pub vidéo”).

Nova Pro, de son côté, cible clairement les utilisateurs professionnels des secteurs finance et développement logiciel.

Sa capacité à avaler 15 000 lignes de code signifie qu’un seul prompt peut englober un projet entier de taille moyenne – par exemple, il pourrait expliquer un dépôt GitHub entier, retrouver l’origine d’un bug dans un vaste codebase, ou générer du code cohérent touchant à de multiples fichiers.

Couplé à des connaissances spécialisées en finance, Nova Pro pourra ingérer des prospectus financiers, bilans comptables, ou rapports d’analystes et en extraire des synthèses ou effectuer des calculs/questionnements complexes sur ces données.

Cela dépasse les limites des modèles Titan 1ère génération (qui étaient limités en contexte et moins adaptés à ces domaines spécifiques).

Quant à Nova Premier, bien qu’il soit encore en gestation en 2024, on peut anticiper qu’il sera entraîné sur un corpus extrêmement large et varié pour atteindre un niveau de raisonnement et de compréhension générale équivalent aux meilleurs modèles du marché en 2025.

Son arrivée annoncée vise probablement à combler tout écart qui resterait entre Amazon et ses concurrents de pointe.

En plus de ces capacités brutes, Amazon insiste sur le fait que Nova est pensé pour un usage responsable en entreprise.

L’entreprise a renforcé les filtres de contenu de Bedrock pour offrir une « protection exhaustive contre les contenus préjudiciables »  – un point crucial pour l’adoption en milieu professionnel où les sorties d’IA doivent être maîtrisées. Source aboutamazon.com.

Nova bénéficie aussi de l’intégration de l’outil Cohere Rerank 3.5 sur Bedrock, qui permet d’améliorer la pertinence des résultats de recherche (via RAG) en réordonnant des passages textuels :

Combiné à Nova, cela peut servir dans des applications de QA sur base documentaire, en s’assurant que les extraits fournis au modèle sont les plus pertinents.

Enfin, AWS a introduit la notion d’AI Agents collaboratifs sur Bedrock – une fonctionnalité où plusieurs agents IA (potentiellement basés sur Nova ou d’autres modèles) peuvent résoudre ensemble une tâche complexe en se répartissant les étapes. Source techtarget.com.

Cela préfigure des usages sophistiqués où Nova pourrait être un composant d’un système plus large, orchestré par l’entreprise utilisatrice pour automatiser des processus entiers (par ex., un agent utilise Nova Pro pour lire des documents juridiques, puis Nova Canvas pour générer un rapport visuel).

En résumé, les capacités de Nova donnent à Amazon une présence forte sur tous les fronts de l’IA générative :

  • Du texte,
  • du code,
  • des images,
  • de la vidéo,
  • du dialogue,
  • sur des contextes courts et très longs,
  • avec la fiabilité et la personnalisation qu’attendent les entreprises.

Cela place AWS en position de fournir des solutions comparables à celles de Microsoft (Azure OpenAI + petits modèles maison) et Google (PaLM, Gemini) tout en capitalisant sur ses atouts propres (infrastructure et clientèle cloud existantes).

Le lancement de Nova s’aligne avec la stratégie globale d’AWS :

Retenir et attirer les clients cloud en offrant une plateforme IA complète et de confiance.

Amazon a vu la demande en IA générative exploser en 2023 et a répondu initialement en intégrant des modèles partenaires dans Amazon Bedrock (Anthropic, AI21, Stability AI, Cohere…).

Cependant, pour rester compétitif face à Microsoft (qui propose GPT-4 via Azure) et Google Cloud (PaLM 2, Vertex AI), Amazon se devait de développer ses propres modèles de pointe.

Ces modèles ne sont disponibles que sur AWS, ce qui signifie que toute entreprise voulant tirer parti de Nova devra utiliser les services AWS. Source techtarget.com.

Cela contribue à la rétention des clients AWS (en évitant qu’ils aillent voir ailleurs pour avoir un modèle de dernière génération) et peut en attirer de nouveaux, curieux de tester la « génération made in Amazon ».

En parallèle, Amazon continue d’offrir une approche écosystémique : l’investissement de 4 milliards $ dans Anthropic en 2023 garantissait l’accès privilégié à Claude sur AWS, et Bedrock n’a cessé d’ajouter des modèles externes pour couvrir tous les besoins.

Cette stratégie double (propres modèles + partenaires) vise à faire de Bedrock une solution exhaustive où les clients peuvent trouver le modèle qui leur convient le mieux.

D’un point de vue business model, Amazon ne propose pas Nova en accès public direct (contrairement à OpenAI avec ChatGPT grand public).

Nova est un service B2B monétisé via l’infrastructure cloud : les clients paient à l’usage (intégration dans leurs applications, facturation à la requête/tokens via l’API Bedrock).

Cela correspond au modèle économique traditionnel d’AWS, où l’IA devient une brique supplémentaire de la plateforme cloud (comme le stockage S3 ou les bases de données) – potentiellement très lucrative étant donné l’appétit actuel pour ces technologies.

Amazon cherche ainsi à augmenter les revenus AWS en incitant les entreprises à déployer des solutions d’IA sur Bedrock/Nova plutôt qu’on-premise ou chez un concurrent.

Sur le plan du positionnement concurrentiel, Amazon met en avant certains avantages de sa solution.

D’abord la sécurité et conformité : AWS est depuis longtemps réputé pour ses outils enterprise-ready, et avec Nova il ajoute par exemple les Automated Reasoning Checks pour minimiser les dérapages de l’IA. Source techtarget.com.

Cette proactivité sur la gestion des hallucinations et des contenus indésirables vise à rassurer les grands comptes (qui craignaient d’utiliser ChatGPT en production à cause de ces risques).

Ensuite, Amazon insiste sur la customisation : la fonction Bring Your Own Model (BYOM) de Bedrock annoncée en avril 2024 permet aux entreprises d’amener leurs modèles maison sur la plateforme, et la distillation de modèles Nova en modèles plus petits pour un usage dédié offre un degré d’adaptation poussé. Source techtarget.com.

En somme, Amazon se positionne en partenaire flexible plutôt qu’en fournisseur imposant une seule solution fermée.

Cette stratégie est importante pour conquérir les entreprises qui veulent garder un certain contrôle sur leur IA.

Par ailleurs, Amazon tire parti de sa vaste gamme de services pour intégrer Nova partout où cela fait sens.

Par exemple, on peut s’attendre à ce que Alexa, l’assistant vocal d’Amazon, exploite Nova pour gagner en fluidité et en compréhension (Amazon avait déjà annoncé en 2023 travailler sur une LLM pour améliorer Alexa).

De même, des services comme Amazon Connect (centre d’appel automatisé), Amazon Lex (chatbot) ou AWS QuickSight (BI) peuvent être boostés via Nova afin d’offrir des fonctionnalités conversationnelles ou génératives avancées.

Ainsi, il s’insère comme un moteur transversal d’IA alimentant de multiples produits AWS, renforçant l’offre globale.

Enfin, stratégiquement, Amazon cherche à préserver sa position de leader du cloud face à Microsoft : en 2025, la compétition se joue aussi sur l’IA.

En investissant lourdement en interne (Nova) et en externe (Anthropic, collaborations avec Cohere, etc.), Amazon s’assure de rester dans la course technologique.

Il est révélateur que dès fin 2024 Amazon communique sur des thèmes comme la réduction des hallucinations, la collaboration de multiples agents IA, ou la modération de contenu :

Ce sont des aspects clés pour l’adoption de l’IA en entreprise. Sources techtarget.com et aboutamazon.com.

En les adressant, Amazon veut se poser en fournisseur d’IA mature et prêt pour l’entreprise, par opposition à une image plus “expérimentale” que certains attribuent à des services comme ChatGPT initialement.

En conclusion, la stratégie d’Amazon avec Nova est de consolider l’écosystème AWS en y intégrant une IA de premier plan, tout en offrant aux clients le contrôle et la confiance nécessaires pour adopter massivement ces outils.

Cela s’inscrit dans la continuité de sa mission cloud : fournir l’infrastructure (matérielle et logicielle) la plus complète pour que d’autres bâtissent leurs solutions – Nova étant désormais un pilier central de cette infrastructure AI-as-a-Service.