Vezető: Csébfalvi Balázs
A nagyteljesítményű számítások (High Performance Computing, HPC) ipari alkalmazása során olyan feladatokat kell megoldani, ahol nem csupán a bemeneti adathalmaz óriási, hanem a szükséges számítások nagyságrendekkel az CPU által megoldható felett vannak, sőt az eredményhalmaz tárolása, valamint az eredmények értelmezése is komoly kihívást jelent. Az adatmennyiség tárolása és elfogadható időn belüli feldolgozása párhuzamos architektúrákon lehetséges. Az adatok értelmezéséhez pedig grafikus, adatvizualizációs eljárásokat szükséges alkalmazni.
Napjainkban a PC-k, játék konzolok magukkal hozták a grafikus processzorok (GPU) szédítő fejlődését. Ezek a grafikus processzorok nem csak grafikai feladatok, hanem általános célú számítási feladatok elvégzésére is alkalmasak. Egy új trend a HPC-ben, hogy a GPU-kban rejlő hatalmas számítási kapacitást úgy aknázzák ki, hogy a videokártyákat lényegében matematikai koprocesszornak használják. A kereskedelmi forgalomban kapható személyi számítógép (PC) alkatrészekből, és a pillanatnyilag kínált grafikus kártya csúcs modellekből már egyetlen PC és 4 videókártya felhasználásával készíthető több terafloppos – a magyarországon fellelhető legnagyobb szuperszámítógép teljesítményét is meghaladó – számítási kapacitású rendszer, mégpedig más megoldások árának töredékéért.
A CPU-t és GPU-t együttesen használó gépek önállóan vagy hálózatba kötve kitűnő ár/teljesítmény viszonyuknak köszönhetően új piaci szegmensek számára teszik megfizethetővé a nagyobb számítási feladatok elvégzését. Ez hozzájárulhat versenyképességük növekedéséhez, piaci térhódításukhoz. A technológia elterjedését gátolja, hogy az új felépítésű hardver nem Neumann architektúrájú, így előnyeinek kihasználásához új algoritmusokra és új szemléletű szoftverfejlesztési módszerekre van szükség.
Ezt az elvet követve új adatvizualizációs algoritmusokat dolgozunk ki a GPU architektúra elvárásainak megfelelően.
A GPU implementáció szűk keresztmetszete általában a limitált textúramemória. A folytonos jelenségek diszkrét közelítéséhez ezért célszerű olyan mintavételező rácsot alkalmazni, amely egységnyi térfogatból a legkevesebb mintát veszi ahhoz, hogy egy sávkorlátozott jelet a diszkrét mintákból tökéletesen rekonstruálni lehessen. Ilyen értelemben a tércentrált kockarács (body-centered cubic lattice – BCC rács) egy optimális mintavételező rács. BCC rácson közel 30%-kal kevesebb mintát kell venni, mint egy vele ekvivalens, hagyományos kockarácson (Cartesian cubic lattice – CC rács). A BCC rácson mintavételezett térfogati adatok egyrészt kevesebb memóriát foglalnak, másrészt egy adott voxel (volume element – térfogati elem) környezetét képesek izotrópikusabban, azaz kevésbé irányfüggően reprezentálni, mint a hagyományos CC rácson vett minták. A BCC rács ugyanakkor a CC ráccsal ellentétben nem szeparálható alacsonyabb dimenziókra, ezért a folytonos rekonstrukciós szűrést nehezebben lehet rajta implementálni. Mivel a modern GPU-k hardvertámogatást adnak a hagyományos trilineáris mintavételezéshez, ezért célszerű megvizsgálni, hogy a BCC rácsra kidolgozott nem szeparálható rekonstrukciós szűrők kiértékelését miként lehet trilineáris mintavételezésre visszavezetni.
A kutatóegyetemi projektből erre a témára jutó támogatás: 500 eFt K+F és 457 eFt hallgatói támogatás.