خرید و دانلود مقاله ترجمه شده درباره یادگیری تقویتی

جستجو کن

لیست مقالات ترجمه شده / خرید و دانلود

مشاهده چکیده

شما در حال خرید ترجمه فارسی مقاله Swarm Reinforcement Learning Algorithms Based on Particle Swarm Optimization هستید:

نام و نام خانوادگی:

تلفن همراه :

ایمیل :

مبلغ با احتساب مالیات بر ارزش افزوده: 1,941,500 ریال

شما در حال خرید ترجمه فارسی مقاله Swarm Reinforcement Learning Algorithms Based on Particle Swarm Optimization هستید:

پیش از اقدام به خرید ترجمه فارسی می توایند نسخه انگلیسی را به صورت رایگان دانلود و بررسی نمایید. متن چکیده و ترجمه آن در پایین همین صفحه قابل مشاهده است.

دانلود رایگان مقاله انگلیسی
پسورد: www.ir-translate.com

موسسه ترجمه البرز اقدام به ترجمه مقاله " مهندسی فناوری اطلاعات " با موضوع " الگوریتم‌های یادگیری تقویتی ازدحام، بر مبنای بهینه‌سازی ازدحام ذرات " نموده است که شما کاربر عزیز می توانید پس از دانلود رایگان مقاله انگلیسی و مطالعه ترجمه چکیده و بخشی از مقدمه مقاله، ترجمه کامل مقاله را خریداری نمایید.

عنوان ترجمه فارسی

الگوریتم‌های یادگیری تقویتی ازدحام، بر مبنای بهینه‌سازی ازدحام ذرات

نویسنده/ناشر/نام مجله :

Systems, Man and Cybernetics. IEEE International Conference

سال انتشار

2008

کد محصول

1008479

تعداد صفحات انگليسی

تعداد صفحات فارسی

قیمت بر حسب ریال

1,941,500

نوع فایل های ضمیمه

Pdf+Word

حجم فایل

611 کیلو بایت

عنوان مقاله انگليسی

Swarm Reinforcement Learning Algorithms Based on Particle Swarm Optimization

Abstract

In ordinary reinforcement learning algorithms, a single agent learns to achieve a goal through many episodes. If a learning problem is complicated, it may take much computation time to acquire the optimal policy. Meanwhile, for optimization problems, population-based methods such as particle swarm optimization have been recognized that they are able to find rapidly the global optimal solution for multi-modal functions with wide solution space. We recently proposed reinforcement learning algorithms in which multiple agents are prepared and they learn through not only their respective experiences but also exchanging information among them. In these algorithms, it is important how to design a method of exchanging the information. This paper proposes some methods of exchanging the information based on the update equations of particle swarm optimization. The proposed algorithms using these methods are applied to a shortest path problem, and their performance is compared through numerical experiments

چکیده

در الگوریتم ‌های یادگیری تقویتی معمول، یک عامل تکی اقدام به یادگیری نموده تا از طریق اپیزود های (بخش‌ ها) زیاد به یک هدف دست پیدا نماید. در صورتی که مسئله ‌ی یادگیری پیچیده باشد، ممکن است به زمان محاسباتی زیادی به منظور به دست آوردن یک سیاست بهینه نیاز بوده و در عین حال به منظور بهینه‌ سازی مسائل، روش‌ های مبتنی بر جمعیت، مانند بهینه‌ سازی ازدحام ذرات را باید تشخیص داد به طوری که بتوانند راه کار سراسری بهینه ‌ای را برای توابع چند مدله و آن‌هم با فضای راه‌حل گسترده پیدا نمایند. اخیراً، ما اقدام به ارائه ‌ی الگوریتم‌ های یادگیری تقویتی نموده‌ ایم که در آن، از چندین عامل استفاده شده است و این عوامل، نه تنها از طریق تجارب گذشته، بلکه از طریق مبادله‌ ی اطلاعات در بین خودشان به یادگیری می‌ پردازند. در این الگوریتم‌ ها، چگونگی طراحی یک مدل برای مبادله ‌ی اطلاعات ضروری می‌ باشد. در این مقاله، روش ‌هایی را برای مبادله‌ ی اطلاعات و آن ‌هم بر مبنای معادلات بروز رسانی در بهینه‌ سازی ازدحام ذرات ارائه می ‌دهیم. الگوریتم‌ های پیشنهادی که از این متدها استفاده می‌ کنند بر روی مسئله‌ ی کوتاه‌ ترین مسیر بکار گرفته شده و کارائی آن‌ ها به وسیله‌ ی تجارب عددی مورد مقایسه قرار می ‌گیرد.

1-مقدمه