در این مطلب جمع دو ماتریس به کمک کودا به همراه محاسبه ی زمان انجام فرایند امده است:
در این مبحث قصد جمع دو بردار با سایز 10240 و محاسبه ی زمان آن را داریم. در این جا از 10 بلاک به ترد 1024 در هربلاک استفاده شده است.
در ادامه مطلب کد برنامه اورده شده است:
راهنمای نصب CUDA در WINDOWS
مقدمه:
CUDA® یک پلت فرم محاسباتی موازی و مدل برنامه نویسی است که توسط NVIDIA طراحی شده است.
CUDA با استفاده از قدرت واحد پردازش گرافیکی (GPU) باعث افزایش چشمگیر در محاسبات شد.
CUDA با چندین هدف طراحی شده است:
‣ CUDA محاسبات ناهمگن را پشتیبانی می کند یعنی محلی که در آن برنامه ها می توانند همزمان از CPU و GPU استفاده کنند. بخش های قابل اجرا به صورت سریالی بر روی CPU و بخش های موازی بر روی GPU اجرا می شوند. CPU و GPU به عنوان دستگاه های جداگانه ای که فضای حافظه ای خودشان را دارند، مورد استفاده قرار می گیرند. این ویژگی همچنین اجازه محاسبات همزمان بر روی CPU و GPU بدون درگیری بر روی استفاده از حافظه می دهد.
GPU ها با قابلیت CUDA دارای صدها هسته هستند که می تواند هزاران تابع محاسباتی را به طور دسته جمعی اجرا کنند. این هسته ها منابع مشترک که شامل یک فایل ثباتی(register file) و یک حافظه مشترک(shared memory) است را دارا می باشند. حافظه به اشتراک گذاشته شده بر روی تراشه اجازه می دهد تا وظایف موازی بر روی این هسته ها اجرا شود، تا داده ها را بدون ارسال آن بر روی گذرگاه حافظه سیستم به اشتراک بگذارد.
ادامه مطلب ...