Theory Flashcards

Question

Creazione e join dei threads overhead e come migliorare

Answer 1

Thread ovviamente porta a overhead, ma utilizzando una thread pool possiamo migliorare.

Answer 2

La cache ad oggi funziona seguendo due principi: spaziali se leggiamo da x, prob leggeremo da posizione vicina. Se accediamo ad un dato potremmo riaccedere dopo poco. per avere del buono codice parallelo ci conviene seguire questi principi, per esempio mettendo dati da eleborare per un thread in un singolo chunk

Answer 3

Non uniform memory access, indica quando poichè i core non possono comunicare direttamente, si accede a memoria Ram.

Answer 4

Poichè solo alcuni livelli di cache condivisi tra cores, bisogno che ci sia hardware che si assicuri dopo ogni scrittura che la cache line per tutti i cores sia aggiornata. Ovviamente questa operazione che porta overhead.

Answer 5

Abbiamo una memory line dove ci sono due variabili a e b. Due diversi thread sono responsabili uno per a e uno per b. Ad ogni modifica di a viene aggiornata la line anche per il thread responsabile di b e viceversa. Si risolve facile con padding.

Answer 6

Quando core troppo caldo cpu potrebbe spostare in auto thread ad altro core con conseguente overhead dovuto a spostamento. Con sistem call possiamo forzare ad utilizzare thread specifico.

Answer 7

La comunicazione tra threads come per esempio in una pipeline se avviene su cores differenti porta ad overhead. Triplo buffer aiuta a nascondere overhead. Es. uno per output, uno per input da altri cores, mentre abbiamo un thread per la gestione di quest' ultimo buffer che copia i dati in un terzo buffer quando sono stati ricevuti.

Answer 8

Dato che dovremmo gestire con lock/unlock e creare overhead, quello che ci conviene fare è usare chunks di memoria, per ogni thread, con cui gestire il tutto.

Answer 9

Block distribution dove creiamo numero di blocchi di mem/numero di threads blocchi. Downside ovviamente ultimo blocco dimensione minore. Cyclic distribution chunks di dim k che assegnamo in modo ciclico ai threads. Downside perdiamo caratteristiche di spazialità. (Meno efficienti in memoria)

Answer 10

Auto scheduling: viene richiesto il lavoro quando thread libero. Overhead di comunicazione soprattutto con rete. Leggermente aggirabile mediante utilizzo di triple buffer. + variable chunk size (se vogliamo aggiungere chunks di dimensione sempre minore). Job stealing, assegnazione statica e quando finisco rubo un job. Problema che ovviamente non so da dove rubare ed avrei bisogno per esempio di dimensione delle code, che per sapere porterebbe ad overhead. Metodo smart prendo coda random evitando overhead.

Answer 11

La vettorizzazione permette di eseguire un numero di operazioni contemporaneamente. Dobbiamo utilizzare single instruction multiple data per poter effettuare ops. Quando utilizzate queste ops hw ci da un registro dove i componenti sono una collezione di elementi. Il registro può essere diviso in sub registri, su cui viene eseguita la stessa operazione. Operazione importante che segua queste regole se in un loop, ogni operazione deve essere indipendente dalle successive, non dobbiamo usare funzioni esterne, non dobbiamo avere if, non dobbiamo avere overlapping puntatori. Esempio di unroll the loop.

Answer 12

Analizzare target architecture per capire se compatibile. Es. Pipelines hanno bisogno di shared memory non disponibile nativamente su architetture cloud. Costruire grafo delle attivita concorrenti: grafo dove nodo rappresenta attività concorrente e arco comunicazione tra attività Stimare performance ottenibile con pattern applicato.

Answer 13

Prima di tutto possiamo rifattorizzare il codice andando a creare delle regole di equivalenza es. pipe(x,y) = comp(x,y). Partendo da queste regole possiamo creare un albero con tutte le possibili soluzioni e valutare parametri come velocità o utilizzo performance. 3 metodi possiamo usare per ottimizzare 1) creiamo alberi di equivalenza e valutiamo migliore secondo parametri scelti. 2) applichiamo regole di rifattorizzazione ad albero originale, in modo da minizzare costi. 3) possiamo usare mix, creo k alberi ma mi fermo ad una profondità m. A partire da questi alberi applico metodo 2.

Answer 14

Per ottimizzare service time: 1) costruisco frontiera con tasks indipendenti. 2) trovo come applicare composition e mettere insieme risultati parziali es. somma[2,3,4] + somma[6,6,7]. 3) costruisco una farm per dividere su macchine differenti lavoro.

Answer 15

Valutare una metrica interessata, per ogni nodo partendo dalle foglie. Ottimizzare in base a questa metrica Automatizzare se necessario: potremmo avere flussi non costanti, es. notte. Quello che facciamo allora: 1)monitor che riceva dati da sensori installati in app. 2) Analisi 3) Azioni da eseguire 4) Eseguire azioni indicate. Strategie: 1) se tempo tra task aumenta diminuire workers. 2) se tempo tra task diminuisce Aumentare workers. 3) Ovviamente bisogna fare attenzione a non cambiare continuamente strategia. Per fare ciò potremmo aumentare tempo che i sensori devono registrare aumento diminuzione di tempo tra tasks.

Answer 16

Eventi che triggerano azioni Condizioni che fanno partire azioni Azioni eseguite Composizione di pattern: user può dare contratto con specifiche richieste di performance. Possiamo gestire in due modi contratto. 1) propagazione del contratto applico costraints modificando parametri 2) Mantenere contratto soddisfatto, abbiamo n manager uno per ogni pattern. Che effettua azioni quando servono.

Answer 17

Quando abbiamo + features da tenere in considerazione possiamo 1) usare un solo manager globale che prende decisioni 2) Usare piu manager, uno per feature interessata, questo porta problemi da risolvere nella fase di plan. In questa fase prima di procedere con modifiche nel piano, manager chiede auth agli altri, portando a situazioni dove potrebbe non intervenire.

Theory Flashcards

(41 cards)