Keynotes

12.2.1 : Keynotes

Keynotes GTC 2022

TRITON : inférence à grande échelle (et scalable)
Maxine : AI communication and remote conference (traduction à la volé en changeant l'image)
RIVA est la suite de NEMO (comme Jarvis, la goutte d'eau qui parle)
L'idée est de remplacer l'encodage audio par la reconnaissance de la parole, et la vidéo par la reconnaissance de visage
H100 : Pcie gen 5 and HBM 3 (Hopper) (now FP8) (7 multi instance)
- GPU confidencial computing
- DPX : Dynamic programming algorithm (new instructions)
  - L'idée est de permettre de résoudre des problèmes récursifs complexes
  - Les résultats intermédiaires sont sockés automatiquement (ça optimise les codes de ceux qui ne savent pas optimiser leurs calculs récursifs)
  - "Dynamic Programming algorithms reduce the computational complexity of exponential problem sets to a linear scale." (mon oeil)
  - Problème du voyageur de commerce (algorithme Floyd-Warshall)
  - Patern Matching (analyse génomique, algorithme Smith-Waterman)
  - Analyse de Graph
- Module SXM
- CX7 : 400Gbit/s
- DGX H100 (32 PFlops, 24TB/s)
- NVidia NVlink SWitch System (Jusqu'à 32 DGX H100) 768 TB/s
- Speed up 9 sur les softs NVidia
- EOS : dispo dans quelques mois
Grace 2023
Grace Hooper (900 GB/s bandwidth) : connection directe CPU-GPU en NVLink
Grace Supership (144 Cores) 500 Watt (avec 1 TB de Memoire)
cuOpt : optimisation du voyageur de commerce
cuQuantum
Sionna : 6G communiation network simulator
Omniverse
OVX : Data center time synchronous
Spectrum 4 switch
NVidia Drive pour les voitures autonomes
Hyperion 9 (14 camera, 4 radars, 3 lidars)
ORIN : Commence en Avril
ISAAC pour les vehicules autonomes