GPGPU.IT

  • Aumenta dimensione caratteri
  • Dimensione caratteri predefinita
  • Diminuisci dimensione caratteri
Benvenuto in GPGPU.IT

Rilasciato il CUDA Toolkit 3.0

E-mail Stampa PDF

NVIDIA ha appena rilasciato la versione 3.0 definitiva del toolkit di CUDA. Questa versione, molto attesa, introduce il supporto per i i chip grafici con Compute Capability 2.0, cioè le GPU basate suula nuova architettura Fermi. Le principali novità riguardano:

  • Supporto ad architettura Fermi, incluse memorie ECC, doppia precisione ad alte prestazioni, librerie per algebra lineare (BLAS e LAPACK), CUDA-GDB e Visual Profiler
  • Supporto per C++
  • Interoperabilità tra API GPGPU e Grafiche - al supporto per Direct3D 9 e 10 e OpenGL, e stato aggiunto il supporto per Direct3D 11, anche per OpenCL
  • Tool di sviluppo per Linux migliorati - incluso il nuovo CUDA Memory Checker che riporta disallineamenti e errori di accesso fuori dai limiti
  • Tesla Compute Cluster (TCC) - migliora le performance e la gestione dei cluster

Il toolkit può essere scaricato al solito link. Sono anche state pubblicate ulteriori guide per l'ottimizzazione del codice su Fermi. Ricordiamo che le prime scheda grafiche a montare Fermi (o meglio, GF100), le GeForce GTX 470 e 480, saranno presentate domani, venerdì 26 Marzo, al PAX EAST.

 

Larrabee: solo HPC all'inizio

E-mail Stampa PDF

Molti analisti (e, tra le righe, anche i concorrenti diretti) lo andavano dicendo da un po' di tempo, e alla fine c'è stata la conferma ufficiale da parte di Intel: la prima incarnazione di Larrabee sarà un prodotto dedicato esclusivamente all'High Performance Computing, e non una soluzione venduta anche come chip grafico per il mercato consumer. Del resto, il ritardo accumulato da Larrabee e la decisione di implementare per la maggior parte in software la pipeline di rendering, avrebbero difficilmente reso competitivo il chip nell'ambito della grafica 3D, con ATI e NVIDIA ancora fortemente impegnate a spingere in quella direzione con cicli di progetto comunque molto rapidi. D'altra parte, solo un paio di setimane fa, a SuperComputing '09 a Portland, Intel ha mostrato una versione funzionante di Larrabee, in grado di superare la barriera del TeraFLOPS nell'esecuzione del benchmark SGEMM (Single precision General Matrix Multiply), dato molto significativo se paragonato alle correnti GPU che a dispetto delle prestazioni di punta dichiarate si assestano attualmente a poco più di mezzo TeraFLOPS.

Del resto, anche come prodotto per il solo HPC, si parla di un'uscita adesso fissata per fine 2010 o inizio 2011, e dunque ragionevolmente se l'hardware non è ancora pronto del tutto, ben difficilmente Intel sarebbe riuscita a svilupparne adeguatamente la parte software dedicata al rendering grafico, senza comunque incorrere in pesanti limiti prestazionali quando comparata con i prodotti che saranno disponili al momento della sua uscita. Nell'ambito dell'HPC, invece, la promessa maggiore flessibilità e generalità del design, potrebbe avere ancora la possibilità di fare la differenza con diverse applicazioni.

Ragionevolmente, Larrabee potrà venire portato nel mercato consumer della grafica 3D forse solo con la sua versione successiva, corrispondente quantomeno al terzo progetto (si parla infatti di almeno un design completamente cestinato prima dell'attuale), evidentemente però ancora ben al di là dal venire.

Rimane dunque a questo punto il dubbio di quali saranno i core grafici che verrano integrati sui prossimi Arrandale, i processori a 32 nm basati su architettura Nehalem, che dell'inclusione della grafica sul chip hanno fatto un punto fermo. Difficilmente si tratterà di una soluzione basata su Larrabee, e sarà dunque da verificare la sua competitività rispetto alle soluzioni discrete anche di fascia bassa della concorrenza, e poi in futuro rispetto al programma Vision di AMD, in grado di sfruttare il know-how di ATI. E a quel punto bisognerà anche vedere se effettivamente un Arrendale potrà essere considerato una soluzione di computing eterogenea, con una GPU integrata in grado però di svolgere calcoli su specifici worload generali, o qualche cosa semplicemente pensata per vendere una CPU assieme alla parte grafica, togliendo in pratica fette di mercato ai produttori di chipset o di chip grafici.

 

CUDA Toolkit 3.0 Beta disponibile per gli sviluppatori registrati

E-mail Stampa PDF

NVIDIA ha appena rilasciato la prima Beta della versione 3.0 del Toolkit di CUDA agli sviluppatori registrati al programma di GPU Computing. Questa versione include tra le altre cose il supporto a molte delle caratteristiche della nuova architettura Fermi, segno che forse ci stiamo finalmente avvicinando al rilascio della prossima GPU NVIDIA.

Tra le caratteristiche rilevanti della nuova versione del toolkit segnaliamo:

  • Supporto all'interoperabilità tra CUDA Driver API e CUDA C Runtime, per permettere l'utilizzo con la prima di librerie sviluppate con il secondo
  • Una nuova versione, separata, del CUDA C Runtime (CUDART) per il debugging in modalità di emulazione
  • Supporto all'ereditarietà delle classi C++ e dei template
  • Una nuova API di interoperabilità per Direct3D e OpenGL, con il supporto per:
  • interoperabilità con texture OpenGL
  • interoperabilità con Direct3D 11
  • Supporto al debugging hardware con CUDA-GDB anche per applicazioni che utilizzano la Driver API
  • Un nuovo CUDA Memory Checker che riporta disallineamenti e accessi fuori dai limiti, disponibile come una modalità di debugging in CUDA-GDB e come un'utilità a sè stante
  • Le librerie del Toolkit hanno adesso una versione, permettendo così alle applicazioni di richiedere una versione specifica, supportare diverse versioni esplicitamente, ecc.
  • I kernel CUDA C/C++ sono ora compilati nel formato ELF standard
  • Supporto per tutte le caratteristiche di OpenCL nell'ultima versione 195.39 beta del driver:
  • Doppia precisione
  • Interoperabilità con OpenGL, per visualizzazione interattiva ad alte performance
  • Richiesta della Compute Capability, per poter sfruttare ottimizzazioni specifiche per l'architettura della GPU (cl_nv_device_attribute_query)
  • Possibilità di controllare le impostazioni di ottimizzazione del compilatore e altro tramite il supporto per gli NVIDIA Compiler Flag (cl_nv_compiler_options)
  • Supporto a OpenCL Images, per un migliore e più veloce filtraggio delle immagini
  • Istruzioni atomiche a 32 bit, per una veloce e conveniente manipolazione dei dati
  • Store indirizzabili a Byte, per la realizzazione di algoritmi di video e image processing e compressione più veloci
  • Supporto per l'ultima specifica (revisione 48) di OpenCL e agli ultimi headers OpenCL di Chronos al 1 Novembre 2009
  • Supporto iniziale all'architettura Fermi, inclusi:
  • Supporto a GPU native a 64 bit
  • Supporto al Multiple Copy Engine
  • Stato ECC
  • Esecuzione concorrente dei Kernel
  • Supporto al debugging hardware per Fermi in CUDA-GDB

Per gli sviluppatori registrati, questa versione del toolkit dovrebbe essere già liberamente scaricabile presso il sito http://nvdeveloper.nvidia.com o http://partners.nvidia.com.

 

Ultimo aggiornamento Venerdì 06 Novembre 2009 10:59
 

Rilasciato Sandra 2010 con benchmark per GPGPU computing

E-mail Stampa PDF

SiSoftware ha appena rilasciato la nuova versione del suo noto benchmark Sandra 2010. Punti di forza di questo nuovo rilascio sono il supporto alla virtualizzazione e al GPGPU computing, con test in OpenCL supportati sia da piattaforma NVIDIA che da piattaforma ATI e con l'introduzione dei primi benchmark con supporto per DirectX 11 Compute Shader. Particolarmente interessante risulta senza dubbio il supporto a OpenCL, che dovrebbe consentire un paragone su terreno comune tra i chip grafici dei due principali concorrenti, eventualmente anche in relazione a processori standard.

Per maggiori informazioni, e per scaricare il benchmark, vi invitiamo a visitare questa pagina.

 

NVIDIA OptiX Ray Tracing Engine

E-mail Stampa PDF

NVIDIA ha recentemente annunciato la disponibilità di OptiX, un nuovo motore di ray tracing programmabile. NVIDIA mette a disposizione questo motore senza costi di licenza, completo di kit di sviluppo gratuito, per permettere agli sviluppatori di sviluppare, in maniera relativamente semplice, utilizzando codice C tutta quella serie di applicazioni che possono richiedere un motore di visualizzazione ray tracing ad alte performance. OptiX è ovviamente ottimizzato per il funzionamento sui chip grafici NVIDIA, e in particolare richiede la presenza di una scheda Quadro FX o Tesla (le GeForce, cioè le schede di fascia consumer, verranno supportate con l'introduzione dell'architettura Fermi). Il motore si avvale delle funzionalità di GPGPU computing messe a disposizione dalle architetture NVIDIA per accelerare gli algoritmi di ray tracing, e offre la possibilità di venire accoppiato facilmente a API grafiche standard come OpenGL per garantire maggiore flessibilità e ulteriori possibilità di integrazione. L'obiettivo è quello, ovviamente, di arrivare ad ottenere un motore di Ray Tracing in gradi di funzionare in tempo reale in un elevato numbero di ambiti applicativi. I sistemi operativi supportati sono Windows XP, Windows Vista, Windows 7, Linux sia a 32 che a 64 bit. Per maggiori informazioni e il download, dirigetevi qui: http://developer.nvidia.com/object/optix-home.html.

Ultimo aggiornamento Giovedì 05 Novembre 2009 10:58
 
  • «
  •  Inizio 
  •  Prec. 
  •  1 
  •  2 
  •  3 
  •  4 
  •  5 
  •  6 
  •  7 
  •  8 
  •  Succ. 
  •  Fine 
  • »


JPAGE_CURRENT_OF_TOTAL

Sondaggi

Quale sarà il futuro di GPGPU?
 

Chi è online

 5 visitatori e 1 utente online

Pubblicità