NVIDIA ha appena rilasciato la prima Beta della versione 3.0 del Toolkit di CUDA agli sviluppatori registrati al programma di GPU Computing. Questa versione include tra le altre cose il supporto a molte delle caratteristiche della nuova architettura Fermi, segno che forse ci stiamo finalmente avvicinando al rilascio della prossima GPU NVIDIA.
Tra le caratteristiche rilevanti della nuova versione del toolkit segnaliamo:
- Supporto all'interoperabilità tra CUDA Driver API e CUDA C Runtime, per permettere l'utilizzo con la prima di librerie sviluppate con il secondo
- Una nuova versione, separata, del CUDA C Runtime (CUDART) per il debugging in modalità di emulazione
- Supporto all'ereditarietà delle classi C++ e dei template
- Una nuova API di interoperabilità per Direct3D e OpenGL, con il supporto per:
- interoperabilità con texture OpenGL
- interoperabilità con Direct3D 11
- Supporto al debugging hardware con CUDA-GDB anche per applicazioni che utilizzano la Driver API
- Un nuovo CUDA Memory Checker che riporta disallineamenti e accessi fuori dai limiti, disponibile come una modalità di debugging in CUDA-GDB e come un'utilità a sè stante
- Le librerie del Toolkit hanno adesso una versione, permettendo così alle applicazioni di richiedere una versione specifica, supportare diverse versioni esplicitamente, ecc.
- I kernel CUDA C/C++ sono ora compilati nel formato ELF standard
- Supporto per tutte le caratteristiche di OpenCL nell'ultima versione 195.39 beta del driver:
- Doppia precisione
- Interoperabilità con OpenGL, per visualizzazione interattiva ad alte performance
- Richiesta della Compute Capability, per poter sfruttare ottimizzazioni specifiche per l'architettura della GPU (cl_nv_device_attribute_query)
- Possibilità di controllare le impostazioni di ottimizzazione del compilatore e altro tramite il supporto per gli NVIDIA Compiler Flag (cl_nv_compiler_options)
- Supporto a OpenCL Images, per un migliore e più veloce filtraggio delle immagini
- Istruzioni atomiche a 32 bit, per una veloce e conveniente manipolazione dei dati
- Store indirizzabili a Byte, per la realizzazione di algoritmi di video e image processing e compressione più veloci
- Supporto per l'ultima specifica (revisione 48) di OpenCL e agli ultimi headers OpenCL di Chronos al 1 Novembre 2009
- Supporto iniziale all'architettura Fermi, inclusi:
- Supporto a GPU native a 64 bit
- Supporto al Multiple Copy Engine
- Stato ECC
- Esecuzione concorrente dei Kernel
- Supporto al debugging hardware per Fermi in CUDA-GDB
Per gli sviluppatori registrati, questa versione del toolkit dovrebbe essere già liberamente scaricabile presso il sito http://nvdeveloper.nvidia.com o http://partners.nvidia.com.
