Arquitecturas post-Kepler Flashcards
(2 cards)
1
Q
Paralelismo dinámico
A
- Se incorpora en arquitectura Kepler
- Antes los kernels se lanzaban únicamente desde el host
- Ideal para problemas con recursión o loops irregulares
- Permite que el algoritmo sea capaz de descubrir dinámicamente dónde concentrar el trabajo (Sin paralelismo se puede pero es engorroso porque todo debe ser comunicado al host para que refine)
2
Q
Warp Shuffle
A
- Para comunicar valores entre hilos de un bloque
- Desde Kepler, los hilos de un warp pueden leer los datos de los registros de otros hilos del warp
- Más rápido que usar shared memory en forma segura (incluyendo las sync)
- Reduce la cantidad de shared necesaria (por lo tanto se puede usar más)
- En las distintas arq, a veces aumenta más la cantidad de cores que la shared disponible
- Se usa el nombre carriles (lanes) para referirse a los hilos de un warp
- Los carriles tienen índice 0 a warpSize-1