Les meilleurs modèles d’IA accusent du retard sur les tâches d’entreprise courantes, selon Databricks : des modèles spécialisés plus petits surpassent

Message de Gate News, 20 avril — Les principaux modèles d’IA excellent à résoudre des problèmes complexes comme les mathématiques de type Olympiade, mais peinent avec le travail d’entreprise de routine, selon David Meyer de Databricks. Certains modèles peuvent corriger un numéro de facture incorrect au lieu de le signaler comme une erreur, tandis que des outils de programmation comme Claude peuvent aussi être en dessous des attentes sur des tâches de data engineering.

L’écart s’explique par des différences fondamentales entre les données d’entreprise et le texte du web public utilisé pour entraîner les grands modèles. Les données d’entreprise présentent souvent des libellés de colonnes vagues, de nombreux champs vides et des codes stockés sous forme de texte brut. Dans une étude universitaire, le score F1 d’un modèle d’IA, qui équilibre précision et rappel, est passé de 0.94 sur des données publiques à 0.07 sur des données d’entreprise pour une tâche de data engineering. En outre, les grands modèles ont tendance à revenir par défaut à des schémas familiers issus de l’entraînement ; certains ont conservé (Structured Query Language )SQL par défaut même après avoir reçu des instructions et une documentation pour le langage de requêtes propriétaire d’une entreprise.

Des modèles open source plus petits, ajustés avec l’apprentissage par renforcement, peuvent traiter des tâches spécifiques de manière plus efficace à des coûts d’entraînement nettement inférieurs à ceux des grands modèles généralistes. Databricks construit des agents d’IA plus petits pour des flux de travail spécifiques, comme KARL, qui utilise l’apprentissage par renforcement pour un raisonnement en plusieurs étapes à partir de documents de l’entreprise. L’industrie s’oriente du recours à des modèles géants vers des architectures hybrides où des modèles petits et efficaces gèrent le volume de routine, puis n’escaladent que les cas ambigus ou complexes vers des systèmes plus grands et plus coûteux.

Databricks a récemment acquis Quotient AI pour aider les grandes entreprises à exécuter des agents d’IA de manière plus fiable. La concurrence dans le secteur de l’IA se concentre désormais sur l’exécution de l’ensemble du cycle de vie de l’IA, y compris des systèmes de feedback pour le suivi des erreurs et l’amélioration continue des modèles au fil du temps, ce qui rend les outils d’évaluation et de réglage de plus en plus précieux après le déploiement.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

Les utilisateurs de ChatGPT peuvent désormais accéder aux abonnements sur la plateforme OpenClaw, annonce Sam Altman

D'après l'annonce de Sam Altman aujourd'hui, les utilisateurs de ChatGPT peuvent désormais se connecter à la plateforme d'agents OpenClaw en utilisant leurs comptes ChatGPT et accéder directement à leurs abonnements ChatGPT existants sur la plateforme.

GateNewsIl y a 37m

L’agent IA Manfred fonde une société et prévoit de commencer à trader des crypto d’ici la fin du mois de mai

L’agent IA Manfred a formé sa propre société et a obtenu un portefeuille crypto ainsi que des identifiants pour embaucher du personnel, effectuer des paiements et mener des activités commerciales, selon des informations. L’agent prévoit de commencer à trader des cryptos d’ici la fin de

GateNewsIl y a 1h

Des agents IA gèrent intégralement des entreprises ! Une machine de vente automatique d’intelligence artificielle à San Francisco révèle une nouvelle opportunité commerciale

Ce rapport indique que la machine de vente automatique de Valerie est alimentée par OpenClaw, permettant à des agents IA de gérer concrètement les opérations quotidiennes : fixation des prix, niveaux de stocks, réseaux sociaux, et même la gestion de comptes bancaires. Des tests montrent que l’IA peut imiter des décisions de dirigeants d’entreprise, mais des hallucinations de tarification surviennent, par exemple en augmentant le prix d’une barre protéinée à 15 dollars. Les obstacles juridiques, comme le KYC, l’ouverture de comptes bancaires et les autorisations liées aux aliments, n’ont pas encore été surmontés. Bien qu’il existe des mécanismes comme des fiducies permettant aux agents IA de détenir une entreprise, les défis pratiques restent nombreux.

ChainNewsAbmediaIl y a 4h

L’agent d’IA Manfred fonde l’entreprise, obtient un portefeuille crypto avant le lancement des échanges fin mai

L’agent d’IA Manfred a créé sa propre entreprise et obtenu un portefeuille crypto ainsi que des identifiants pour recruter du personnel, effectuer des paiements et mener des activités commerciales. L’agent n’est pas prévu pour commencer à trader des crypto avant la fin de

GateNewsIl y a 7h

MoonPay lance la carte MoonAgents pour les agents IA sur le réseau Mastercard

Selon The Block, MoonPay a lancé MoonAgents Card vendredi, une carte de débit Mastercard virtuelle qui convertit les stablecoins en monnaie fiduciaire en temps réel au moment du paiement. La carte est émise via Monavate, une plateforme de paiements réglementée et membre principal de Mastercard, en partenariat avec Exodus M

GateNewsIl y a 7h

L’agent IA Manfred fonde une entreprise et obtient un portefeuille crypto avant le lancement des transactions en mai

L’agent d’IA Manfred a créé sa propre société et obtenu un portefeuille crypto ainsi que des informations d’identification professionnelles, bien qu’il ne commencera à négocier des cryptomonnaies qu’à la fin du mois de mai. L’agent est désormais équipé pour embaucher du personnel, effectuer des paiements et mener des activités commerciales

GateNewsIl y a 13h
Commentaire
0/400
Aucun commentaire