- مدرس دوره : قائم تقی پور ( رزومه )
- تعداد ویدیوها : 79 ویدیو
- مدت زمان دوره : 13:49:00
- سطح دوره : پیشرفته
- وضعیت دوره : به اتمام رسیده
- تاریخ آخرین بروزرسانی : 1402/12/02
آموزش جامع یادگیری تقویتی (Reinforcement Learning) در پایتون
یادگیری تقویتی (Reinforcement Learning) یک زیرشاخه جذاب از هوش مصنوعی است که بر تعامل با یک محیط و انجام کنش هایی به منظور حل مسائل کنترلی توسط یک عامل هوشمند تمرکز دارد. این شاخه از هوش مصنوعی به ماشینها اجازه می دهد تا از تجربیات خود بیاموزند و تصمیمات خود را بر اساس الگوریتم های تعریف شده اتخاذ کنند. برخلاف یادگیری نظارت شده که در آن مدل ها بر اساس مجموعه داده های برچسب زده آموزش می بینند، و یا یادگیری بدون نظارت که در آن شباهت ها کشف می شوند، یادگیری تقویتی بر تعامل عاملها با محیط های مربوطه تمرکز دارد.
کاربردهای یادگیری تقویتی در دنیای واقعی بسیار گسترده و تاثیرگذار است، چرا که ماشینها در این شاخه از هوش مصنوعی به صورت خودکار و بدون نیاز به کمک انسانی عمل میکنند، و این تکنیک برای حل مسائل متنوع در دنیای واقعی از اهمیت بسزایی برخوردار است. از این حوزه در زمینه های مختلفی از جمله رباتیک، خودروهای خودران، پرنده های بدون سرنشین، بازی های ویدئویی، پزشکی، سیستم های معاملاتی و مسائل دیگری که در آن نیاز به یک عامل هوشمند جهت اتخاذ تصمیم و انجام اعمال در یک محیط وجود دارد، استفاده می شود.
در این دوره، مباحث مربوط به یادگیری تقویتی، با رویکرد پیاده سازی الگوریتم ها با استفاده از زبان برنامه نویسی پایتون و طبق سرفصل های استاندارد مباحث مربوط به این حوزه، و در قالب 6 فصل اصلی تدریس خواهد شد.
جهت کسب اطلاعات بیشتر در رابطه با این دوره، لطفا جلسه ی معرفی دوره را مشاهده نمایید.
سرفصل های دوره:
فصل1 : مفاهیم مقدماتی یادگیری تقویتی |
فصل2: برنامه نویسی پویا |
فصل3: روش مونت کارلو |
فصل4: الگوریتم های Temporal Difference |
فصل5: یادگیری عمیق (Deep Learning) و شبکه های عصبی مصنوعی (ANN) |
فصل 6: یادگیری تقویتی عمیق (Deep Reinforcement Learning) |
پیش نیاز های دوره :
- آشنایی با زبان برنامه نویسی پایتون
- آشنایی مقدماتی و علاقه مندی به یادگیری ریاضیات و آمار
فهرستـــ ویدیوها
مدت زمان دوره 13:49:00با مشاهده آنلاین جلسات در سایت ، هزینه اینترنت شما به صورت نیم بها محاسبه خواهد شد.
آشنایی با برخی از کاربردهای مهم یادگیری تقویتی
آشنایی با برخی از کاربردهای مهم یادگیری تقویتی
بررسی حل مساله ی MDP و راه اندازی محیط برنامه نویسی
حل مساله ی MDP و راه اندازی محیط برنامه نویسی
بررسی حل مسائل با روش مونت کارلو و نگاهی به مساله راهزن چند دست
بررسی حل مسائل با روش مونت کارلو و نگاهی به مساله راهزن چند دست
حل مسائل به روش مونت کارلو با تکنیک On-Policy
حل مسائل به روش مونت کارلو با تکنیک On-Policy
پیاده سازی روش مونت کارلو با تکنیک On-Policy - جلسه 1
پیاده سازی روش مونت کارلو با تکنیک On-Policy - جلسه 1
پیاده سازی روش مونت کارلو با تکنیک On-Policy - جلسه 2
پیاده سازی روش مونت کارلو با تکنیک On-Policy - جلسه 2
پیاده سازی روش مونت کارلو با تکنیک On-Policy - جلسه 3
پیاده سازی روش مونت کارلو با تکنیک On-Policy - جلسه 3
پیاده سازی روش مونت کارلو با تکنیک On-Policy - جلسه 4
پیاده سازی روش مونت کارلو با تکنیک On-Policy - جلسه 4
پیاده سازی تکنیک Off-Policy در مونت کارلو - جلسه 1
پیاده سازی تکنیک Off-Policy در مونت کارلو - جلسه 1
پیاده سازی تکنیک Off-Policy در مونت کارلو - جلسه 2
پیاده سازی تکنیک Off-Policy در مونت کارلو - جلسه 2
پیاده سازی تکنیک Off-Policy در مونت کارلو - جلسه 3
پیاده سازی تکنیک Off-Policy در مونت کارلو - جلسه 3
پیاده سازی الگوریتم SARSA در حالت چند مرحله ای
پیاده سازی الگوریتم SARSA در حالت چند مرحله ای
فصل پنجم - یادگیری عمیق (Deep Learning) و شبکه های عصبی مصنوعی (ANN)
یادگیری عمیق (Deep Learning) و شبکه های عصبی مصنوعی (ANN)
نظرات کاربران در رابطه با این دوره