12.1.1.3 : Calcul et simulation
- Fast and Simple Hash Tables [S31466] 38min
- Le son est pourrit
- Table de hashage sur GPU (ou plutôt des graphes de hashage)
- Scalable (tout est délicieusement parallèle)
- Implémentation dans CuDPP
- Une V100 est plus rapide que 96 threads sur un CPU 48 coeurs (et bien plus scalable), en même temps, c'est logique.
- Accelerating FFT toward Exascale Computing [P31661]
- Optimisation des FFT 3D
- $98\%$ de temps de communication
- Ils ont optimiser la base de MPI
- Scalabilité linaire mais pas parfaite ($90\%$ du pic de perf avec 100 coeurs et $30\%$ avec 6000 coeurs
- RTCore for Compute: Exploiting Computational Patterns Using NVIDIA RTX [S31809]
- Le son est pourrit
- Simulation de particules avec les unités RTX
- À 21min : Est-ce que mon application peut bénéficier du ray tracing ?
- Accelerating Real-Time Computations for Sharper Star Gazing on Giant Ground-Based Telescopes [S31457]
- GPU-Accelerated+Signal+and+Sensor+Processing+from+Prototype+to+Deployment
- Accélérer le traitement du signal sur GPU avec CUDA CuSignal, sigX pour C++
- Parallel Accelerated 1-bit Dense Matrix Multiplies for Genomics Applications [S31560]
- High-Performance Mining of Multidimensional Time Series with Multiple GPUs and at Reduced Precision [E31128]