L’IA Fara1,5 de Microsoft surpasse OpenAI et Google en navigation web

Cette semaine, Microsoft Research a dévoilé Fara1.5, un modèle d’IA open-weight pour les tâches de navigation web, qui a surpassé Operator d’OpenAI et le module “Computer Use” de Gemini 2.5 sur des benchmarks sectoriels. Fara1.5-27B affiche 72% sur Online-Mind2Web, contre 58,3% pour Operator d’OpenAI et 57,3% pour “Computer Use” de Gemini 2.5. La sortie traduit un changement dans le paysage concurrentiel des agents d’utilisation d’ordinateur — des systèmes d’IA conçus pour lire l’écran du navigateur et exécuter des actions comme cliquer, faire défiler et taper, sans nécessiter de plugins spécifiques. Contrairement à Operator, propriétaire et basé sur le cloud d’OpenAI (lancé en janvier 2025 à 200 dollars par mois avant d’être arrêté en août) et à l’offre de Gemini de Google, Fara1.5 est open-source avec des poids publiés publiquement. Microsoft a atteint ces performances en repensant l’ensemble du processus de développement, de la génération de données et des objectifs d’entraînement à la conception du modèle et à l’orchestration.

Spécifications du modèle et disponibilité

Fara1.5 existe en trois tailles : 4 milliards, 9 milliards et 27 milliards de paramètres, toutes construites sur Qwen 3.5, un modèle de base d’Alibaba que Microsoft a affiné spécifiquement pour le travail sur navigateur. Fara1.5-9B, la variante intermédiaire, obtient 63,4% sur Online-Mind2Web — devant les offres d’OpenAI et de Google. Le modèle à 9 milliards de paramètres est disponible dès maintenant sur Azure AI Foundry, tandis que les variantes à 4 milliards et 27 milliards arrivent sous peu.

Performances aux benchmarks

Online-Mind2Web, le benchmark principal, teste la fréquence à laquelle un agent d’IA termine correctement 300 tâches réelles et variées sur 136 sites web populaires, y compris des comparatifs de produits, du remplissage de formulaires et des services de réservation. Le score reflète les tâches terminées correctement sur l’internet réel, en constante évolution.

Sur WebVoyager, un second benchmark mesurant la réussite de tâches sur le web en direct, Fara1.5-27B atteint 88,6%, devançant Operator d’OpenAI à 87,0% et dépassant Holo2 de H Company (30 milliards de paramètres) à 83,0%.

Les concurrents open-source obtiennent des scores plus bas : GUI-Owl-1.5 d’Alibaba (8 milliards de paramètres) atteint 48,6%, tandis que MolmoWeb d’AI2 monte à 35,3%. Le modèle précédent de Microsoft, Fara-7B, atteint 34,1% — ce qui signifie que Fara1.5-27B double presque les performances de son prédécesseur à taille comparable. Navigator n1 de Yutori, la meilleure alternative propriétaire, atteint 64,7%.

Méthodologie d’entraînement

Microsoft a utilisé FaraGen1.5 pour générer les données d’entraînement, en s’appuyant sur GPT-5.4 — le modèle d’OpenAI — comme “teacher agent” afin de montrer comment accomplir des tâches de navigateur. Ces démonstrations sont devenues les données d’entraînement de Fara1.5.

L’équipe a aussi créé six répliques entièrement fonctionnelles de sites web réels, incluant des clients email, des calendriers et des places de marché. Cet entraînement sur domaine synthétique permet au modèle de s’entraîner à des tâches nécessitant des connexions ou des actions irréversibles sans accéder à des comptes réels, améliorant les performances sur les tâches “gated”.

Sécurité et contrôle utilisateur

Chaque modèle est conçu pour s’arrêter et demander avant d’exécuter des actions irréversibles. Fara1.5 passe par MagenticLite, un environnement navigateur isolé (sandbox) qui journalise chaque action et permet aux utilisateurs d’arrêter l’agent à tout moment. D’après Yash Lara, Senior PM Lead chez Microsoft Research, « équilibrer des garde-fous robustes tels que les Critical Points avec des parcours utilisateur fluides est essentiel. Disposer d’une interface (UI), comme Magentic-UI de Microsoft Research, est vital pour offrir aux utilisateurs des occasions d’intervenir quand c’est nécessaire, tout en aidant à éviter la lassitude liée aux validations ».

Extension à venir

Microsoft a indiqué avoir l’intention d’étendre Fara1.5 au-delà du navigateur vers des applications bureautiques et des logiciels d’entreprise.

Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.
Commentaire
0/400
Aucun commentaire