12.2.1 : Keynotes



Keynotes GTC 2022
  • TRITON : inférence à grande échelle (et scalable)
  • Maxine : AI communication and remote conference (traduction à la volé en changeant l'image)
  • RIVA est la suite de NEMO (comme Jarvis, la goutte d'eau qui parle)
  • L'idée est de remplacer l'encodage audio par la reconnaissance de la parole, et la vidéo par la reconnaissance de visage
  • H100 : Pcie gen 5 and HBM 3 (Hopper) (now FP8) (7 multi instance)
    • GPU confidencial computing
    • DPX : Dynamic programming algorithm (new instructions)
      • L'idée est de permettre de résoudre des problèmes récursifs complexes
      • Les résultats intermédiaires sont sockés automatiquement (ça optimise les codes de ceux qui ne savent pas optimiser leurs calculs récursifs)
      • "Dynamic Programming algorithms reduce the computational complexity of exponential problem sets to a linear scale." (mon oeil)
      • Problème du voyageur de commerce (algorithme Floyd-Warshall)
      • Patern Matching (analyse génomique, algorithme Smith-Waterman)
      • Analyse de Graph
    • Module SXM
    • CX7 : 400Gbit/s
    • DGX H100 (32 PFlops, 24TB/s)
    • NVidia NVlink SWitch System (Jusqu'à 32 DGX H100) 768 TB/s
    • Speed up 9 sur les softs NVidia
    • EOS : dispo dans quelques mois
  • Grace 2023
  • Grace Hooper (900 GB/s bandwidth) : connection directe CPU-GPU en NVLink
  • Grace Supership (144 Cores) 500 Watt (avec 1 TB de Memoire)
  • cuOpt : optimisation du voyageur de commerce
  • cuQuantum
  • Sionna : 6G communiation network simulator
  • Omniverse
  • OVX : Data center time synchronous
  • Spectrum 4 switch
  • NVidia Drive pour les voitures autonomes
  • Hyperion 9 (14 camera, 4 radars, 3 lidars)
  • ORIN : Commence en Avril
  • ISAAC pour les vehicules autonomes