MiniMax lance son nouveau modèle linguistique M3 à un coût nettement inférieur
La startup chinoise d'IA MiniMax a dévoilé son nouveau grand modèle linguistique, M3. Le modèle offre des capacités avancées de codage et d'agent avec une fenêtre de contexte d'un million de tokens, pour une fraction du coût des concurrents.

La startup chinoise d'IA MiniMax a publié dimanche son nouveau grand modèle linguistique, M3. L'entreprise affirme que le modèle offre des performances avancées en matière de codage et d'agents, avec une fenêtre de contexte d'un million de tokens. MiniMax déclare que M3 surpasse les modèles propriétaires leaders de Google et OpenAI sur certains benchmarks, tout en fonctionnant à un coût considérablement réduit.
L'entreprise a également annoncé son intention de publier le modèle sous une licence open source avec des "poids ouverts", permettant aux entreprises de le télécharger et de le personnaliser gratuitement. Cette publication est prévue dans les 10 prochains jours. Actuellement, M3 est disponible via l'API MiniMax à un prix de lancement spécial et réduit.
Au cœur de l'efficacité du modèle se trouve sa nouvelle technique MiniMax Sparse Attention (MSA), qui s'écarte des architectures Transformer traditionnelles. Les mécanismes d'attention standard évoluent de manière quadratique, rendant le traitement des entrées longues coûteux en calcul. La MSA accélère apparemment considérablement les opérations et réduit les coûts de calcul.
La tarification de MiniMax M3 commence à moins de 0,6 $ par million de tokens d'entrée et moins de 2,4 $ par million de tokens de sortie au prix plein. Cette positionnement offre aux entreprises une alternative considérablement plus abordable par rapport aux modèles propriétaires fermés actuels, dont les prix sont multipliés.