Skip Navigation Linksلیست مقالات ترجمه شده / مقالات ترجمه شده مهندسی كامپيوتر /

عنوان ترجمه شده مقاله: الگوریتم های کارآمد اسکن موازی برای GPU ها

اسکن و الگوریتم های بخش بندی شده اسکن، بلوک های ساختاری مهمی برای یک الگوریتم خوب با داده های موازی بسیار است.

Abstract

Scan and segmented scan algorithms are crucial building blocks for a great many data-parallel algorithms. Segmented scan and related primitives also provide the necessary support for the flattening transform, which allows for nested data-parallel programs to be compiled into flat data-parallel languages. In this paper, we describe the design of efficient scan and segmented scan parallel primitives in CUDA for execution on GPUs. Our algorithms are designed using a divide-and-conquer approach that builds all scan primitives on top of a set of primitive intra-warp scan routines. We demonstrate that this design methodology results in routines that are simple, highly efficient, and free of irregular access patterns that lead to memory bank conflicts. These algorithms form the basis for current and upcoming releases of the widely used CUDPP library

چکیده

اسکن و الگوریتم های بخش بندی شده اسکن، بلوک های ساختاری مهمی برای یک الگوریتم خوب با داده های موازی بسیار است. اسکن بخش بندی شده و اشیای اولیه مربوطه نیز پشتیبانی لازم برای تبدیل هموار کننده را فراهم می کنند که این به برنامه های داده موازی تودرتو اجازه می دهد تا به صورت زبان های داده موازی تخت کامپایل شوند. در این مقاله، ما طراحی اسکن کارامد و اصول اسکن موازی بخش بندی شده در CUDA را برای اجرا روی GPU ها توضیح می دهیم. الگوریتم های ما با استفاده از یک رویکرد تقسیم و تصرف طراحی می شوند که همه اشیای اولیه اسکن را در بالای یک مجموعه از روتین های اسکن درون ریسمانی اولیه می سازد. ما ثابت می کنیم که این روش طراحی به روتین هایی می انجامد که ساده، بسیار موثر و بدون الگوهای دسترسی بی قاعده که به تضادهای بانک حافظه منجر می شود، هستند. این الگوریتم ها اساس نسخه های کنونی و آتی کتابخانه بسیار رایج CUDPP را شکل می دهند.

1-مقدمه

عملیات اسکن بخش بندی شده و اسکن موازی ، اشیای اولیه داده موازی هستند که اهمیت گسترده آنها آشکار است. فشردگی دنباله، دسته بندی پایه، دسته بندی سریع، ضرب بردار ماتریس پراکنده و ساخت درخت پوشای مینیمم، تنها چند تا از الگوریتم های بسیاری هستند که می توانند بطور موثر بر حسب عملیات اسکن، پیاده سازی شوند. این عملیات ها هم ارز مدارهای پیشوند موازی (13) هستند که تاریخچه ای طولانی دارند و در زبان های مجموعه گرای که به APL (12) بر می گردد، پرکاربرد هستند. همچنین آنها اساس نگاشت موثر زبان های داده موازی تو در تو نظیر NESL را روی ماشین های داده موازی تخت شکل می دهند...


موسسه ترجمه البرز اقدام به ترجمه مقاله " مهندسی كامپيوتر " با موضوع " الگوریتم های کارآمد اسکن موازی برای GPU ها " نموده است که شما کاربر عزیز می توانید پس از دانلود رایگان مقاله انگلیسی و مطالعه ترجمه چکیده و بخشی از مقدمه مقاله، ترجمه کامل مقاله را خریداری نمایید.
عنوان ترجمه فارسی
الگوریتم های کارآمد اسکن موازی برای GPU ها
نویسنده/ناشر/نام مجله :
NVIDIA Technical Report NVR
سال انتشار
2008
کد محصول
1003020
تعداد صفحات انگليسی
17
تعداد صفحات فارسی
24
قیمت بر حسب ریال
1,281,500
نوع فایل های ضمیمه
Pdf+Word
حجم فایل
2 مگا بایت
تصویر پیش فرض


این مقاله ترجمه شده را با دوستان خود به اشتراک بگذارید
سایر مقالات ترجمه شده مهندسی كامپيوتر را مشاهده کنید.
کاربر عزیز، بلافاصله پس از خرید مقاله ترجمه شده مقاله ترجمه شده و با یک کلیک می توانید مقاله ترجمه شده خود را دانلود نمایید. مقاله ترجمه شده خوداقدام نمایید.
جهت خرید لینک دانلود ترجمه فارسی کلیک کنید
جستجوی پیشرفته مقالات ترجمه شده
برای کسب اطلاعات بیشتر، راهنمای فرایند خرید و دانلود محتوا را ببینید
هزینه این مقاله ترجمه شده 1281500 ریال بوده که در مقایسه با هزینه ترجمه مجدد آن بسیار ناچیز است.
اگر امکان دانلود از لینک دانلود مستقیم به هر دلیل برای شما میسر نبود، کد دانلودی که از طریق ایمیل و پیامک برای شما ارسال می شود را در کادر زیر وارد نمایید


این مقاله ترجمه شده مهندسی كامپيوتر در زمینه کلمات کلیدی زیر است:



Parallel Scan Algorithms

تاریخ انتشار در سایت: 2015-01-17
جستجوی پیشرفته مقالات ترجمه شده

خدمات ترجمه تخصصی و ویرایش مقاله مهندسی كامپيوتر در موسسه البرز

نظرتان در مورد این مقاله ترجمه شده چیست؟

ثبت سفارش جدید