Nous utilisons des cookies pour vous offrir la meilleure expérience sur notre site. En utilisant ce site, vous acceptez que vos données soient utilisées pour améliorer votre expérience d'utilisation.
Accept
Crypto Education MagazineCrypto Education MagazineCrypto Education Magazine
  • Accueil
  • Lexique blockchain
  • News (Actualite)
  • Projet Communautaire
  • Nous contacter
Search
  • ACCUEIL
  • CONTACT
  • LEXIQUE BLOCKCHAIN
  • PUZZLE CRYPTO DU JOUR
© 2022 Crypto Education. All Rights Reserved.
Reading: Les nouveautés de Nvidia avec Jax et XLA
Share
Sign In
Notification Show More
Font ResizerAa
Crypto Education MagazineCrypto Education Magazine
Font ResizerAa
  • Blockchain
  • Banques et gouvernements
  • Cryptomonnaies
  • Arnaques
  • Shitcoins
  • News (Actualite)
  • NFT
Search
  • Categories
    • News (Actualite)
    • Arnaques
    • Cryptomonnaies
    • NFT
    • Blockchain
    • Banques et gouvernements
    • Shitcoins
    • Faucets
  • Bookmarks
  • More Foxiz
    • Sitemap
Have an existing account? Sign In
Follow US
  • ACCUEIL
  • CONTACT
  • LEXIQUE BLOCKCHAIN
  • PUZZLE CRYPTO DU JOUR
© 2022 Crypto Education. All Rights Reserved.
Les nouveautés de Nvidia avec Jax et XLA
Crypto Education Magazine > Blog > Blockchain > Les nouveautés de Nvidia avec Jax et XLA
BlockchainNews (Actualite)

Les nouveautés de Nvidia avec Jax et XLA

elvis.konjoh
Last updated: 19 July 2025 20h24
By elvis.konjoh - Crypto éducateur et blockchain expert
Published 19 July 2025
Share
5 Min Read
SHARE

Table de contenu
Relever les défis de latenceInnovations dans les algorithmes All-ReduceGains de fusion et de performanceOptimisations et développements futurs

Crypto Edu
19 juillet 2025 03:30

NVIDIA introduit des techniques avancées pour réduire la latence dans l’inférence du modèle de langage, en tirant parti de Jax et XLA pour des améliorations de performances significatives des charges de travail basées sur GPU.

Dans la quête en cours pour optimiser les charges de travail d’inférence, NVIDIA a dévoilé une série d’améliorations visant à réduire la latence lors de l’exécution de modèles de langues (LLM) dans les environnements de production. Selon NVIDIA, ces progrès sont particulièrement cruciaux pendant la phase de décodage LLM, où la réduction du temps à l’entrée est vitale.

Relever les défis de latence

L’approche de Nvidia implique le partitionnement des tâches d’inférence sur plusieurs GPU en utilisant le parallélisme du tenseur, ciblant spécifiquement le perceptron multicouche (MLP) et les couches GEMM de projection dans les blocs de transformateur. Ce partitionnement aide à minimiser les latences d’exécution, un goulot d’étranglement commun en informatique haute performance.

Pendant le stade de décodage, les frais généraux statiques tels que l’invocation du noyau et la configuration de la communication peuvent dominer, conduisant à une latence accrue. Pour lutter contre cela, NVIDIA a développé des techniques pour minimiser ces frais généraux, qui contribuent considérablement à la latence globale du décodage.

Innovations dans les algorithmes All-Reduce

Les recherches de Nvidia ont révélé que le collectif All-Reduce dans les couches parallèles du tenseur était un goulot d’étranglement important, consommant environ 23% de la latence de décodage de bout en bout. Traditionnellement, l’algorithme RING est utilisé pour les opérations de toutes les réductions, qui, bien que la bande passante optimale pour les messages plus importants, entraîne des latences élevées pour des tailles de messages plus petites.

Pour y remédier, NVIDIA a implémenté un algorithme All-Reduce à un seul coup personnalisé, qui agrége les données des pairs et effectue une réduction en une seule étape. Cette innovation réduit la latence de communication en permettant des échanges de données simultanés via NVLink, malgré l’augmentation de la bande passante totale.

En outre, NVIDIA a utilisé CudadeviceEenablePeerAccess pour éliminer les frais généraux de copie de mémoire supplémentaires, permettant un accès direct aux tampons sur les GPU homologues. Cette méthode est particulièrement efficace dans les configurations multi-GPU à nœuds, où un contexte CUDA partagé simplifie l’accès à la mémoire entre les appareils.

Gains de fusion et de performance

Le noyau All-Reduce unique a été encore optimisé en le fusionnant avec la normalisation de la couche et les opérations d’addition ponctuelle dans un seul noyau CUDA C ++. Cette fusion minimise les frais généraux de lancement du noyau et le mouvement des données, fournissant une accélération de ~ 3x sur les noyaux de réduction autonome et une amélioration de ~ 27% de la latence de phase de décodage.

En regroupant et en lançant ces noyaux en tant que graphique CUDA unique, NVIDIA a réalisé une réduction supplémentaire de 5% de la latence de décodage. Cette intégration complète démontre le potentiel des noyaux personnalisés pour améliorer l’efficacité de l’inférence.

Optimisations et développements futurs

Nvidia continue d’explorer d’autres optimisations pour l’inférence à faible latence, en particulier pour les charges de travail avec de petites tailles de message. Les fonctionnalités à venir dans le NCCL 2.27 et les versions futures visent à améliorer les frais généraux de communication, ce qui peut atteindre jusqu’à 4x communication plus rapide pour les charges utiles plus petites.

De plus, NVIDIA tire parti des API de communication côté périphérique initiées par le GPU disponibles dans la bibliothèque NVIDIA OpenShmem pour entrelacer les blocs de communication de calcul, masquant efficacement les latences de communication. Les progrès récents dans le DSL de la mosaïque-GPU facilitent l’expression des modèles de fusion de communication de calcul entrelacés, promettant d’autres améliorations des grains de fusion distribués pour divers paradigmes parallèles.

Pour des informations plus détaillées, l’article original de Nvidia est accessible ici.

Source de l’image: Shutterstock

Source: https://blockchain.news/news/enhancing-inference-efficy-nvidias-innovations-with-jax-and-xla

Résumé: NVIDIA met en avant des innovations importantes pour réduire la latence dans les tâches d’inférence des modèles de langage, en utilisant des techniques avancées adaptées aux environnements de production. Les améliorations récentes démontrent un engagement vers une efficacité accrue et des performances optimisées.

Source

You Might Also Like

Pepe peut-il retrouver son pic de 11 milliards de dollars ou s’agit-il d’un échec majeur ?

Vision de Venga : Récompenses cryptographiques faciles et accessibles avec Into-poche

La clé pour scaler Bitcoin

L’enthousiasme des traders de Stellar se concrétise avec un rallye de 30 % du prix du XLM.

Fundstrat prévoit que le Bitcoin pourrait atteindre 70 000 $, mais le prix actuel est perçu comme une excellente opportunité d’achat.

Inscrivez-vous à la newsletter quotidienne

Tenez bon ! Recevez les dernières nouvelles de dernière minute directement dans votre boîte de réception.
En vous inscrivant, vous acceptez nos Conditions d'utilisation et reconnaissez les pratiques en matière de données dans notre Politique de confidentialité. Vous pouvez vous désinscrire à n'importe quel moment.
Share This Article
Facebook Email Print
Share
What do you think?
Love0
Sad0
Happy0
Sleepy0
Angry0
Wink0
Byelvis.konjoh
Crypto éducateur et blockchain expert
Follow:
Ingénieur génie logiciel de formation. Actuellement en service tant que développeur d’applications web à Shanghai Chine. Je découvre la crypto en 2016 au travers d’une amie. Après multiples investissements à pertes, j’ai décidé d’en apprendre un peu plus sur le fonctionnement de cet univers. Ceci m’a permis d’être enthousiaste de la cryptomonnaie, crypto éducateur, crypto investisseur et blockchain expert. Au travers de ma chaine YouTube j’éduque les Africains à propos de cet univers que je décris comme plein d’opportunités et de potentiel.
Previous Article XRP diminue après un niveau record – les modèles d’accumulation indiquent une nouvelle étape XRP diminue après un niveau record – les modèles d’accumulation indiquent une nouvelle étape
Next Article Analyse des prix de SHIB pour le 19 juillet Analyse des prix de SHIB pour le 19 juillet
Leave a Comment Leave a Comment

Leave a Reply Cancel reply

Your email address will not be published. Required fields are marked *

Rester connecté

1kFollowersLike
1kFollowersFollow
20.6kSubscribersSubscribe
6.8kMembersFollow
- Publicité -
Ad imageAd image

Latest News

Une étape décisive pour Bonk, Pepe et d’autres
Une étape décisive pour Bonk, Pepe et d’autres
Blockchain News (Actualite)
21 July 2025
Le prix de Tron fait preuve d’une résilience supérieure à 0,31 $ malgré le retrait du marché après son introduction au NASDAQ.
Le prix de Tron fait preuve d’une résilience supérieure à 0,31 $ malgré le retrait du marché après son introduction au NASDAQ.
Blockchain News (Actualite)
21 July 2025
XRP présente un potentiel d’accroissement des gains avec une activité croissante sur la chaîne et une rupture technique
XRP présente un potentiel d’accroissement des gains avec une activité croissante sur la chaîne et une rupture technique
Blockchain News (Actualite)
21 July 2025
Le prix de Tron fait preuve d’une résilience supérieure à 0,31 $ malgré le retrait du marché après son introduction au NASDAQ.
COSMOS (ATOM) grimpe de 10 % grâce au développement du protocole IBC et à l’intérêt institutionnel
Blockchain News (Actualite)
21 July 2025
//

Nous sommes la première communauté cryptos – éducation francophone d’Afrique. Nous avons pour mission de faire découvrir cette merveille technologique au maximum de personnes possible.

Liens rapides

  • ACCUEIL
  • CONTACT
  • LEXIQUE BLOCKCHAIN
  • PUZZLE CRYPTO DU JOUR

Articles les plus vus

  • Amazon dévoile Bedrock, son système d’IA générative pour défier ChatGPT (25,116)
  • Des centaines de faux tokens ChatGPT attirent les parieurs en crypto, la majorité étant émise sur la Binance smart chain (20,013)
  • Coinbase Derivatives Exchange lance des contrats à terme institutionnels sur Bitcoin et Ether (5,438)
  • Implications juridiques du bitcoin (4,165)
  • Partenariat entre Celo et Google cloud (4,045)

Sign Up for Our Newsletter

Abonnez-vous à notre newsletter pour recevoir instantanément nos derniers articles !

Crypto Education MagazineCrypto Education Magazine
Follow US
© 2022 Crypto Education. Tous les droits sont réservés. Disclaimer: le contenu de Crypto Edu Mag est censé être de nature informative et ne doit pas être interprété comme un conseil en investissement. Le trading, l'achat ou la vente de crypto-monnaies doit être considéré comme un investissement à haut risque et il est conseillé à chaque lecteur de faire ses propres recherches avant de prendre toute décision.
  • ACCUEIL
  • CONTACT
  • LEXIQUE BLOCKCHAIN
  • PUZZLE CRYPTO DU JOUR
Rejoignez-nous!
Abonnez-vous à notre newsletter et ne manquez jamais nos dernières actualités, podcasts etc..
Zéro spam, désabonnez-vous à tout moment.
adbanner
Welcome Back!

Sign in to your account

Username or Email Address
Password

Lost your password?