OpenAI réduit les coûts d'inférence de plus de 50%, l'utilisation des GPU passe de dizaines de milliers à des centaines

Selon des sources citées par des médias, OpenAI a réalisé une avancée technique majeure plus tôt ce mois-ci, réduisant les coûts d'inférence de plus de 50 % et diminuant considérablement les besoins en GPU. Des ingénieurs internes ont présenté cette avancée, révélant que la nouvelle approche d'optimisation a réduit l'utilisation de GPU à seulement quelques centaines d'unités pour traiter les requêtes des visiteurs de ChatGPT, contre des dizaines de milliers de puces haut de gamme auparavant nécessaires.
Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.
Commentaire
0/400
Aucun commentaire