Naver a dévoilé un nouveau modèle d'IA le 2, intégrant des informations réelles issues de posts de « mom cafe » et d'avis de restaurants pour améliorer la précision des réponses. Le modèle a été présenté lors d'une session intitulée « De la recherche à l'exécution : la technologie d'IA de nouvelle génération créant la recherche IA de Naver » tenue à Naver D2SF Gangnam. Ce modèle léger, basé sur HyperCLOVA X, applique l'« ingénierie du harnais » pour refléter les informations axées sur la vie quotidienne présentes dans l'écosystème Naver, permettant à l'IA de fournir des réponses ancrées dans des expériences utilisateur réelles plutôt que dans des données génériques.
Le modèle d'IA déployé dans le service de recherche « AI Tab » de Naver utilise l'ingénierie du harnais, une structure qui contrôle et oriente le comportement de l'agent IA comme un harnais guide un cheval. Lorsque les utilisateurs recherchent les frais de scolarité d'une académie de maths, le système fournit des réponses basées sur les discussions récentes de parents dans les « mom cafe ». Lorsque les utilisateurs s'informent sur la disponibilité du parking d'un restaurant, l'IA reflète non seulement les informations officielles de l'établissement, mais aussi les avis réels de clients qui s'y sont garés.
Han Seung-kyun, responsable du service de recherche IA de Naver, a comparé l'ingénierie du harnais au « sens du travail » de l'IA, déclarant que « pour créer des agents IA qui fonctionnent bien dans les services, une ingénierie du harnais qui conçoit simultanément l'efficacité des coûts et la stabilité est essentielle, et non seulement les grands modèles de langage (LLM). » Han a ajouté que « l'expérience de connexion de l'infrastructure de recherche et du savoir-faire accumulés au cours des 27 dernières années, le vaste contenu comme les blogs et les cafés, et divers actifs de services tels que le shopping et les lieux avec la technologie IA pour passer de la recherche à l'exécution est la compétitivité unique de Naver que personne ne peut facilement imiter. »
Naver a construit une structure de petits modèles de langage (SLM) avec division du travail pour accroître l'efficacité de l'AI Tab. Au lieu d'un seul LLM géant gérant toutes les tâches, Naver combine des SLM spécifiques à des rôles pour réduire les coûts d'exploitation tout en améliorant la vitesse et la qualité des réponses. Grâce à cette méthode, Naver a réduit les coûts d'exploitation des équipements jusqu'à 3 fois et amélioré la vitesse de réponse de plus de 2 fois.
Naver a formé l'IA en utilisant la technologie Clarify RL (apprentissage par renforcement), qui garantit que l'IA n'interprète pas arbitrairement les demandes ambiguës mais confirme l'intention de l'utilisateur par des questions supplémentaires. En conséquence, l'hallucination a diminué jusqu'à 30 points de pourcentage par rapport à HyperCLOVA X.
Lee Ki-chang, directeur du modèle d'IA hyper-échelle de Naver Cloud, a souligné que « le modèle appliqué à l'AI Tab se caractérise par l'optimisation de l'ensemble du processus, de la construction des données d'entraînement à la conception du modèle et à l'apprentissage par renforcement, pour s'adapter aux services Naver », ajoutant que « l'objectif est de créer un modèle qui fonctionne le plus précisément et efficacement dans les processus de service réels tels que la recherche, l'achat et la réservation par les utilisateurs de Naver. »
Naver a dévoilé sa stratégie d'avancement de la technologie multimodale utilisant SmartLens placé à l'avant de la barre de recherche de l'AI Tab. La technologie multimodale permet à l'IA de comprendre et d'utiliser diverses formes d'informations, y compris les images et les vidéos, et pas seulement le texte.
Les utilisateurs peuvent télécharger des images au lieu de texte dans la barre de recherche et émettre des commandes telles que « trouver des produits similaires à celui-ci » ou « réserver un endroit avec cette ambiance ». Alors que la recherche d'images et de vidéos était possible avec l'IA existante, les modèles LLM reconnaissaient d'abord les images puis effectuaient des recherches textuelles. En revanche, l'agent multimodal de Naver comprend l'ensemble du processus, de la saisie d'image à l'exécution, comme une seule requête.
Yoon Sang-doo, responsable du Future AI Center de Naver, a déclaré que « la technologie de recherche visuelle que Naver a accumulée via SmartLens depuis près de 10 ans est une technologie centrale pour créer des yeux à travers lesquels les agents IA voient le monde », ajoutant que « à l'avenir, le service d'agent IA de Naver évoluera dans une direction qui comprend l'intention de l'utilisateur non seulement par le texte mais aussi par les images et se connecte à des actions réelles. »
Qu'est-ce que Naver a dévoilé le 2 ? Naver a dévoilé un nouveau modèle d'IA le 2 à Naver D2SF Gangnam, intégrant des informations axées sur la vie quotidienne issues de posts de « mom cafe » et d'avis de restaurants. Le modèle est basé sur HyperCLOVA X et utilise l'ingénierie du harnais pour refléter les expériences utilisateur réelles dans ses réponses.
De combien Naver a-t-il réduit ses coûts d'exploitation avec le nouveau modèle d'IA ? Naver a réduit les coûts d'exploitation des équipements jusqu'à 3 fois en utilisant une structure de petits modèles de langage (SLM). L'entreprise a également amélioré la vitesse de réponse de plus de 2 fois et réduit l'hallucination jusqu'à 30 points de pourcentage par rapport à HyperCLOVA X.
Qu'est-ce que la technologie multimodale SmartLens dans la recherche IA de Naver ? SmartLens est la technologie multimodale de Naver qui permet aux utilisateurs de télécharger des images dans la barre de recherche et d'obtenir des réponses à des commandes comme « trouver des produits similaires » ou « réserver des endroits avec cette ambiance ». La technologie comprend l'ensemble du processus, de la saisie d'image à l'exécution, comme une seule requête, en exploitant la technologie de recherche visuelle que Naver a accumulée depuis près de 10 ans.
Actualités associées
L'entrée de Meta dans le cloud renforce les perspectives de valorisation de Naver et Samsung SDS
Les banques coréennes accélèrent l'adoption de l'IA pour lutter contre la fraude financière
Commission mondiale « AI for Good » lancée pour élargir l'accès et la confiance
THEA lève $8M pour construire une couche de coordination IA basée sur Solana.