Articles of cuda

Come viene gestita la memoria CUDA?

Quando eseguo il mio programma CUDA che alloca solo una piccola quantità di memoria globale (inferiore a 20 M), ho ricevuto un errore di “memoria insufficiente”. (Dai post di altre persone, penso che il problema sia legato alla frammentazione della memoria) Cerco di capire questo problema e mi rendo conto di avere un paio di […]

Requisiti di capacità di calcolo CUDA

Quali sono i requisiti minimi di capacità di elaborazione per: CUDA 5.5? CUDA 6.0? CUDA 6.5?

Perché cudaMalloc () usa il puntatore al puntatore?

Ad esempio, cudaMalloc((void**)&device_array, num_bytes); Questa domanda è stata posta prima e la risposta è stata “perché cudaMalloc restituisce un codice di errore”, ma non capisco – cosa ha a che fare un doppio puntatore con la restituzione di un codice di errore? Perché un puntatore semplice non può fare il lavoro? Se scrivo cudaError_t catch_status; […]

Emulatore GPU per la programmazione CUDA senza l’hardware

Domanda: Esiste un emulatore per una scheda Geforce che consenta di programmare e testare CUDA senza l’hardware effettivo? Informazioni: Sto cercando di velocizzare alcune mie simulazioni in CUDA, ma il mio problema è che non sono sempre sul mio desktop per fare questo sviluppo. Mi piacerebbe invece lavorare sul mio netbook, ma il mio netbook […]

invio di array 3d al kernel CUDA

Ho preso il codice dato come risposta per Come posso aggiungere due array (con pitching) 2d usando loop nested for? e ho provato ad usarlo per 3D invece di 2D e ho modificato leggermente anche altre parti, ora sembra il seguente: __global__ void doSmth(int*** a) { for(int i=0; i<2; i++) for(int j=0; j<2; j++) for(int […]

In che modo CUDA blocca / deforma / attacca i map sui core CUDA?

Ho usato CUDA per alcune settimane, ma ho qualche dubbio sull’assegnazione di blocchi / fili / filo. Sto studiando l’architettura da un punto di vista didattico (progetto universitario), quindi raggiungere il massimo delle prestazioni non è la mia preoccupazione. Prima di tutto, vorrei capire se ho capito bene questi fatti: Il programmatore scrive un kernel […]

Modifica del registro per aumentare il timeout della GPU, Windows 7

Sto cercando di aumentare il timeout sulla GPU dall’impostazione predefinita di 2 secondi a qualcosa di un po ‘più lungo. Ho trovato il seguente link ma sembra leggermente diverso in Windows 7 perché non vedo nulla di menzionato nella pagina web. Qualcuno l’ha già fatto prima? Se così fosse, potresti riempire le lacune per favore. […]

CUDA incompatibile con la mia versione di gcc

Ho problemi nella compilazione di alcuni esempi forniti con CUDA SDK. Ho installato il driver per gli sviluppatori (versione 270.41.19) e il toolkit CUDA, infine l’SDK (entrambi versione 4.0.17). Inizialmente non ha compilato affatto dando: error — unsupported GNU version! gcc 4.5 and up are not supported! Ho trovato la linea responsabile in 81: /usr/local/cuda/include/host_config.h […]

Qual è la versione di cuda per nvidia 304.125

Sto usando Ubuntu 14.04. Voglio installare CUDA. Ma non so quale versione è buona per il mio portatile. Traccio il mio drive che è $cat /proc/driver/nvidia/version NVRM version: NVIDIA UNIX x86_64 Kernel Module 304.125 Mon Dec 1 19:58:28 PST 2014 GCC version: gcc version 4.8.2 (Ubuntu 4.8.2-19ubuntu1) Ho provato ad installare CUDA cuda-linux64-rel-7.0.28-19326674 ma quando […]

Riduci le righe della matrice con CUDA

Windows 7, NVidia GeForce 425M. Ho scritto un semplice codice CUDA che calcola le somme di riga di una matrice. La matrice ha una rappresentazione unidimensionale (puntatore a un float). La versione seriale del codice è sotto (ha 2 loop, come previsto): void serial_rowSum (float* m, float* output, int nrow, int ncol) { float sum; […]