مقدمه:
فن آوری NVIDIA® CUDA™ بزرگترین قدرت پردازش موازی NVIDIA GPUs است.
معماری کودا یک انقلاب در معماری محاسبات موازی است که ارائه می دهد عملکرد فن آوری پردازنده
گرافیکی NVIDIA برای هدف کلی به منظور محاسبه GPU .
برنامه هایی که بر روی معماری کودا اجرا می شوند می توانند مزیت نصب شدن بر روی بیش از صد میلیون GPU با CUDA فعال شده در دستاپ و کامپیوتر ها، ایستگاه های کاری حرفه ای و خوشه های سوپرکامپیوتر. با معماری و ابزار کودا، توسعه دهندگان در حال پیشرفت قابل توجهی در زمینه هایی مانند تصویربرداری پزشکی و اکتشاف منابع طبیعی و ایجاد برنامه های پیشرفت در زمینه هایی مانند تشخیص تصویر و پخش تصاویر real-time HD و رمز گذاری.CUDA این عملکرد بی سابقه را از طریق API های استاندارد مانند OpenCL ™ و DirectX® Compute و زبان برنامه نویسی سطح بالا مانند C / C ++، Fortran، Java، Python و Microsoft .NET Framework. انجام می دهد.ارجاع از سایت http://www.webhostingtalk.ir/showthread.php?t=85820فناوری cuda چیست؟ فناوری CUDA به معماری پردازش موازی NVIDIA گفته می شود که سرعت عملکرد پردازش گرافیکی را از طریق تحت کنترل درآوردن قدرت GPU امکان پذیر می کند. این تکنولوژی اجازه می دهد صدها تراشه گرافیکی مجزای انویدیا در کنار هم به پردازش موازی جهت پردازش حجیم ترین حجم اطلاعات بپردازند. تکنولوژی CUDA به وسیله هزاران نرم افزار پشتیبانی می شود تا سرعت سیستم را برای اجرای برنامه های سنگین افزایش دهد. با میلیونها GPUهای مبتنی بر CUDA، طراحان و توسعه دهندگان نرم افزار، متخصصین و محققان دامنه وسیعی از قابلیتهای CUDA را در برنامه هایی نظیر پردازش عکس و فیلم، زیست شناسی و شیمی محاسباتی، شبیه سازی پویا روان، نوسازی تصویر CT، آنالیز زمین لرزه، ردیابی اشعه و بسیاری دیگر را شناسایی می کنند.در حقیقت CUDA، معماری دستگاه یکپارچه محاسباتی است که محصول شرکت Nvidia می باشد، یک پلتفرم نرم*افزاری است که برای محاسبات موازی حجیم با کارایی بالا در پردازنده های گرافیکی قدرتمند بکار برده می شود. معماریCUDA شامل ابزارهای برنامه نویسی به زبان های برنامه نویسی C یا C++و یک مکانیزم انتزاعی سخت*افزاری است.هدف CUDA در برنامه های "متمرکز بر داده" که نیازمند ریاضیات با ممیز شناور و دقت معمولی هستند (عمدتاً علمی، مهندسی و محاسبات با کارایی بالا مانند برنامه های ویرایش عکس و فیلم) خلاصه شده است. ممیز شناور با دقت مضاعف طرح Nvidia برای GPUهای جدید است. این معماری همچنین به اجرای دیگر نرم افزارهای سنگین کامپیوتری کمک می کند و با آزاد کردن توان هزاران هسته موجود در پردازنده کارت گرافیک، توانایی سیستم را افزایش می دهد. از این رو، دیگر برای اجرای نرم افزارهای حجیم با مشکل کاهش سرعت مواجه نخواهید شد.ارجاع از سایت http://daneshyari.com/isi/articles/cudaکودا به انگلیسی (CUDA) که مخفف عبارت انگلیسی Compute Unified Device Architecture است یک سکوی پردازش موازی و مدل برنامهنویسی است که توسط شرکت انویدیا بهوجود آمده است و در واحدهای پردازش گرافیکی این شرکت پشتیبانی میشود. کودا به توسعه دهنده گان نرمافزار اجازه میدهد تا از یک GPU که ویژگی CUDA-enabled دارد برای هدف پردازش استفاده کنند، رویکردی که GPGPU شناخته میشود. کودا به توسعهدهنده گان امکان دسترسی مستقیم به حافظه و مجموعه دستورالعمل در واحد پردازش گرافیکی را میدهد. سکوی کودا برای کار با زبانهای برنامهنویسی مانند C و ++C و فرترن طراحی شدهاست. این دسترسی باعث میشود تا برای متخصصان استفاده از منابع GPU آسانتر شود برخلاف راه کار های API دیگر چون DIRECT3D و OpenGL که نیاز به توانایی حرفه ای در برنامه نویسی گرافیک داشتند. همچین کودا از چارچوبهایی چون OpenACC و OpenCL پشتیبانی می کند. کودا توسط کتابخانههای مجهز شده کودا،دستوردهنده کامپایلر مانند OpenACC و همین طور توسعههایی استاندارد صنعتی از زبانهایی شامل C، ++C و فرترن برای توسعهدهندگان قابل دسترسی است. برنامهنویسان C++/C از '++CUDA C/C' استفاده می کنند که کامپایل شده با "nvcc" است. nvcc یک کامپایلر C++/C بر پایه LLVM شرکت انویدیا است. برنامه نویسان فرترن نیز می توانند از 'CUDA Fortran' استفاده کنند که کامپایل شده با PGI CUDA Fortran Complier شرکت The Portland Group است. علاوه بر کتابخانهها،دستوردهندههای کامپایلر و ++CUDA C/C و CUDA Fortran،سکو کودا از سایر رابطهای محاسباتی شامل موارد زیر پشتیبانی می کند. OpenCL گروه Khronos DirectCompute مایکروسافت محاسبات سایه زنی OpenGL C++ AMP همچنین لفافه سوم شخص (Third party wrappers) برای زبان هایی مانند پرل (Perl)،پایتون (Python)،آر (R)،فرترن (FORTRAN)،جاوا (Java)،روبی (Ruby)،هسکل (Haskell)،متلب (Matlab)،آی دی ال (IDL)،لوآ (Lua) و نیز به طور پیشفرض متمتیکا (Mathematica) در دسترس هستند. در صنعت بازیهای کامپیوتری،GPUها تنها برای رندر کردن گرافیک نیست بلکه در محاسبات فیزیکی بازی (اثرات فیزیکی شبیه دود،آتش،ترشحات و آوار) نیز هستند. مثالهایی نظیر فیز-اکس و گلوله شامل این مورد هستند. کودا همچنین برای کاربردهای شتابدهی غیرگرافیکی در زیستشناسی محاسباتی،رمزنگاری و حوزه های دیگر نیز استفاده میشود. کودا هم یک API سطح پایین و هم یک API سطح بالا فراهم می کند. SDK اولیه کودا در 15 فوریه 2007 برای ویندوز مایکروسافت و لینوکس انتشار عمومی شد. پشتیبانی در سیستمعامل مک در نسخه دوم اضافه شد که جای نسخه تست 14 فوریه 2008 را میگیرد. کودا با تمامی GPUهای از سری G8x به بعد شامل جیفورس،کوادرو و تسلا(گرافیک) کار میکند. کودا با بیشتر سیستمعاملهای استاندارد کار میکند. انویدیا میگوید برنامههایی که برای سری G8x توسعهیافتهاند همچنین بدون تغییر روی نسلهای آینده کارتهای گرافیک بسته به سازگاری دودویی کارخواهند کرد. مزایا کودا چندین برتری در برابر محاسبات عمومی سنتی روی GPU ها (در کل منظور GPGPU) که از واسطهای گرافیکی استفاده میکنند، دارد. خواندن پراکنده یعنی کد میتواند از آدرسهای دلخواه در حافظه بخواند. حافظه مجازی یکپارچه (کودا نسخه 4. 0 به بعد) حافظه یکپارچه (کودا نسخه 6. 0 به بعد) حافظه مشترک کودا ناحیه ای که یک حافظه سریع مشترک است، نشان میدهد که میتواند میان نخها به اشتراک گذاشته شود. این حافظه میتواند به عنوان یک حافظه نهان مدیریت شده تحت دسترسی کاربر استفاده شود و پهنای باند بیشتری داریم یعنی امکان استفاده را از جستجو بافتی. دانلودهای سریع تر و مجدد خوانی پشتیبانی کامل برای اعداد صحیح و عملیات بیتی، شامل جستجوی بافتی صحیحکتاب برنامه نویسی موازی با کودا(CUDA) http://www.naghoospress.ir/bookview.aspx?bookid=1487003 چکیده : استفاده از توان محاسباتی رایانهها در تحقیقات علمی و فعالیتهای دانشگاهی، مراکز تحقیقاتی و شرکتهای تجاری، کاربرد روزافزونی پیدا نموده است؛ ازاینرو نیاز به پردازش سریعتر افزایش یافته و به یک نیاز اساسی تبدیل شده است. سرعت کامپیوترهای شخصی کنونی نسبت به اجداد خود بهطور سرسامآوری افزایش یافته است اما علیرغم وجود این موضوع باز جوابگوی نیازهای مطرحشده نیست. ازجمله عرصههایی که احتیاج به کامپیوترهایی با سرعت پردازش بسیار بالا دارند میتوان به برنامههای شبیهسازی در تحقیقات هستهای، نانو فناوری محاسباتی، برنامههای پیشبینی وضعیت هوا، برنامههای فیلمسازی کامپیوتری، برنامههای ساخت انیمیشن حرفهای و بسیاری از زمینههای مختلف دیگر که همگی بهسرعت پردازش بسیار زیاد نیاز دارند تا در یک زمان مناسب به نتیجه برسند اشاره کرد. یک راهحل برای این معضل، استفاده از سوپرکامپیوترها است. درست است که سرعت پردازش سوپرکامپیوترها بسیار بالاتر از کامپیوترهای شخصی است اما استفاده از آنها در همه موارد مقرونبهصرفه نیست؛ ضمن آنکه این فناوری در انحصار بعضی از کشورهای توسعهیافته است و سایر کشورها از دسترسی به این تجهیزات استراتژیک محروم هستند. راهحل دیگر در دستیابی به سرعت پردازش بسیار بالا، استفاده از روش پردازش موازی است. به بیان ساده در این روش چند پردازنده (در اینجا منظور پردازندههای گرافیکی) معمولی با همکاری یکدیگر به اجرای یک برنامه میپردازند که طی این همکاری، برنامه با سرعت بالاتری اجرا میشود. به عبارت دیگر، پردازش یا محاسبهی موازی، شکلی از پردازش است که در آن دستورالعملهای بسیاری در یک زمان و به صورت همزمان انجام میشوند و بر اساس این اصل اجرا میشوند که مسائل بزرگ را اغلب میتوان به مسائل کوچکتر تقسیم نمود که سپس باهم و بهصورت موازی اجرا شوند. کودا در نوامبر 2006 توسط انویدیا معرفی گردید، کودا یک پلتفرم محاسبات موازی همهمنظوره و مدل برنامهنویسی است که رابطهای برنامهنویسی را در اختیار برنامهنویسان قرار میدهد و به طراحان نرمافزار اجازه میدهد تا از تواناییهای جیپییو (GPU سرواژه Graphics Processing Unit بوده و به معنای واحد پردازش گرافیکی است) در جهت محاسبات همهمنظوره روی واحد پردازش گرافیکی استفاده کنند. پلتفرم کودا یک لایه نرمافزاری است که دسترسی مستقیم به مجموعه دستورالعملهای مجازی جیپییو و عناصر محاسبات موازی را میدهد. این پلتفرم به گونهای طراحی شده است که با زبانهای برنامهنویسی سی، سیپلاسپلاس، فرترن و متلب کار میکند. این قابلیت دسترسی، کار را برای متخصصان برنامهنویسی موازی به منظور استفاده از منابع جیپییو به همان شکلی که از دایرکتایکس (DirectX) یا اپنجیال (OpenGL) استفاده میکنند، هموار کرده است. با استفاده از این معماری ما میتوانیم برنامه خود را به زبان سی یا سیپلاسپلاس نوشته و سپس بر روی پردازنده گرافیکی اجرا کرده و از سرعت آن لذت ببریم. همچنین مورد مهم دیگر وجود پلتفرمی است که بتواند بر روی دستگاههای مختلف اجرا شود، کودا با این شعار که میتواند برای شما سطح قابل قبولی از کارایی و مقیاسپذیری را در یک زمان به ارمغان آورد، وارد بازار برنامهنویسی شده است. درباره معماری کودا گفته میشود که کودا معماریای است که به جای محدود کردن شما، توسط کارایی یکسری کتابخانه، اجازه میدهد که کار موردنظرتان را انجام دهید. در گذشته نوشتن نرمافزار برای جیپییو به این معنی بود که برای جیپییو باید برنامه نوشته میشد، در مقابل همانطور که عنوان شد، کودا به شما اجازه میدهد با زبانهای معمول برنامهای بنویسید که بر روی جیپییو نیز اجرا شود، همچنین به دلیل آنکه کودا میتواند نرمافزار شما را به صورت مستقیم روی سختافزار گرافیکی کامپایل کند، کارایی به دست آمده نیز افزایش مییابد. کتاب حاضر مرجع مناسبی برای برنامهنویسی موازی با کودا بوده و همچنین آموزش و درک عمیقی از مطالب برنامهنویسی موازی با کودا را با انجام مثالها و برنامههای این کتاب محقق میسازد. لذا خوانندگان، اساتید و دانشجویان میتوانند با استفاده از مثالها و برنامههای این کتاب یکی از مشکلات عمده سیستم آموزشی موجود، یعنی بیان مطالب به صورت صرفاً تئوری و نه با آموزش در قالب مثالهای عملی را فائق آیند.این کتاب مشتمل بر دوازده فصل و دو پیوست است؛ که تا حد ممکن سعی شده که مطالب و مباحث مربوط به کودا به تفصیل و به صورت جامع آموزش داده شود و از آن مهمتر اینکه در این کتاب تأکید بسیار بر مطالب عملی کدنویسی با کودا و مثالهای عملیمحور در کنار مطالب تئوری بوده است به گونهای که در این کتاب بالغ بر یکصد و سی مثال و پروژه عملی در بخشهای گوناگون کودا آورده شده است و سعی گردیده که کتاب به صورت خودآموز برای خوانندگان نوشته شود و آموزش آن گام به گام از سطح مبتدی تا پیشرفته بوده و تقریباً اکثر مباحث کودا را پوشش دهد و هر خوانندهای نیز که پیشزمینهای در زمینه کامپیوتر و کدنویسی داشته باشد بتواند از آن بهره گیرد.معماری CUDAمعماری CUDA شامل چندین جزء است که در جعبه های سبز زیر است:1. موتورهای محاسبه ی موازی داخل GPU های .NVIDIA 2. سطح بندی هسته سیستم عامل برای پشتیباتی از راه اندازی سخت افزار اولیه، پیکربندی و غیره3. درایور User-mode،که یک API ی device-level برای توسعه دهندگان فراهم می کند.4. معماری مجموعه دستورالعمل(ISA) برای محاسبه موازی هسته ها و دستورالعمل ها محیط توسعه نرم افزار CUDAمحیط توسعه نرم افزار CUDA تمام ابزارها، نمونه ها و اسناد لازم برای توسعه برنامه هایی که از معماری CUDA استفاده می کنند ، را فراهم می کند.محیط توسعه نرم افزار CUDA دو رابط برنامه نویسی متفاوت را پشتیبانی می کند:1. یک رابط برنامه نویسی سطح-دستگاه، که در آن برنامه ازDirectX Compute، OpenCL یا CUDA Driver API را به طور مستقیم استفاده می کند به منظور پیکربندی GPU ، راه اندازی محاسبات هسته و خواندن نتایج بازگشتی2. یک رابط برنامه نویسی یکپارچه سازی زبان، که در آن یک برنامه از C Runtime برای CUDA استفاده می کند و توسعه دهندگان از مجموعه کوچکی از توسعه استفاده می کنند تا مشخص کنند کدام توابع محاسباتی باید بر روی GPU به جای CPU انجام شوند. هنگام استفاده از رابط برنامه نویسی سطح-دستگاه، توسعه دهندگان محاسبات هسته را در فایل های جداگانه با استفاده از زبان هسته پشتیبانی شده توسط APIبا انتخاب خودشان انجام می دهند.DirectX محاسبات هسته ها (همانند "محاسبات شیدرها") در HLSL نوشته می شود. هسته هایOpenCL نوشته می شوند در یک زبان مانندC که با"OpenCL C"فراخوانده می شوند. API Driver API CUDA هسته هایی را که در C یا assembly PTX نوشته شده اند می پذیرد.هنگام استفاده از رابط برنامه نویسی یکپارچه سازی زبان، توسعه دهندگان توابع محاسباتی را در C و C Runtime نوشتند برای CUDA به طور خودکار تنظیمات GPU را انجام می دهد و توابع محاسباتی را اجرا می کند .این رابط برنامه نویسی، توسعه دهندگان را قادر می سازد تا از پشتیبانی محلی برای زبان های سطح بالا از قبیل C، C ++، Fortran، Java، Python و دیگر موارد استفاده کنند (نگاه کنید به زیر)، کاهش پیچیدگی کد و هزینه های توسعه از طریق ادغام نوع و ادغام کد:• ادغام نوع اجازه می دهد تا انواع استاندارد و همچنین انواع بردار و انواع تعریف شده توسط کاربر (از جمله ساختارها) را به صورت یکپارچه در سراسر توابع اجرا شده بر روی CPU و توابع اجرا شده در GPU ااستفاده کنند• یکپارچه سازی کد اجازه می دهد تا همان عملکرد را از توابع که در پردازنده و توابع اجرا شده بر روی GPU اجرا شود فراخوانی می شود.هنگامی که ضروری است تا تابع هایی را که در CPU اجرا می شوند، از آنهایی که بر روی GPU اجرا می شوند، تشخیص دهند، اصطلاح C برای CUDA برای توصیف مجموعه کوچکی از توسعه هایی استفاده می شود که به توسعه دهندگان اجازه می دهد تا مشخص کنند کدام توابع در GPU اجرا خواهند شد، چگونه از حافظه گرافیکی استفاده خواهند کرد، وچگونگه قابلیت پردازش موازی GPU توسط نرم افزار استفاده خواهد شد.اقتباس CUDAابتدا در مارس 2007 معرفی شد، و با بیش از 100 میلیون GPU های فعال CUDA در روز به فروش می رسد، هزاران نفر از توسعه دهندگان نرم افزار در حال حاضر به صورت رایگان از ابزارهای توسعه نرم افزار CUDA برای حل مشکلات در انواع برنامه های حرفه ای و خانگی - از پردازش تصویر و فیلم و شبیه سازی فیزیک، تا اکتشاف نفت و گاز، طراحی محصول، تصویربرداری پزشکی و تحقیقات علمی استفاده می کنند.برنامه های نوشته شده در C و C ++ می توانند از C Runtime برای CUDA به طور مستقیم استفاده کنند. برنامه های کاربردی نوشته شده به زبان های دیگر می توانند به runtime با استفاده از انقیاد متد های محلی دسترسی پیدا کنند، و چندین پروژه وجود دارد که توسعه دهندگان را قادر می سازد تا از این طریق از معماری CUDA استفاده کنند، از جمله:Fortran:o بسته بندی فورتن برای CUDA-http://www.nvidia.com/object/cuda programming tools.html o FLAGON Fortran 95 library for GPU Numerics - http://flagon.wiki.sourceforge.net/ o PGI Fortran to CUDA compiler - http://www.pgroup.com/resources/accel.htm:Javao JaCuda - https://sourceforge.net/projects/jacuda.wiki/ o Bindings for CUDA BLAS and FFT libs - http://javagl.de/index.htmlPython:o PyCUDA Python wrapper - https://mathema.tician.de/software/pycuda/.NET languages:o CUDA.NET - http://www.gass-ltd.co.il/en/products/cuda.netمنابع برای زبان های دیگر:o SWIG - http://www.swig.org (برای ده ها زبان از واسط های C / C ++ تولید می کند)توسعه دهندگان می توانند با بهره گیری از عملکرد عالی در معماری CUDA امروزه از API های غنی و انواع زبان های سطح بالا در نسخه های 32 بیتی و 64 بیتی لینوکس، MacOS و ویندوز، استفاده کنند.