آموزش جامع یادگیری تقویتی (Reinforcement Learning) در پایتون

دوره حضوری و آنلاین آموزش برنامه نویسی پایتون

پایتون یکی از زبان های چند منظوره ، شی گرا و سطح بالا می باشد که کاربرد بسیار زیادی دارد و همچنین از محبوبیت فوق العاده ای برخوردار است .

ساده بودن پایتون برای یادگیری و محاسبه معادلات پیچیده و تحلیل های داده ، از دلایل جذابیت بالای این زبان میباشد .

در طول این دوره به مفاهیم پایه و اساسی این زبان قدرتمند تسلط پیدا خواهید کرد .

پس وقت رو از دست نده...

آموزش جامع یادگیری تقویتی (Reinforcement Learning) در پایتون

یادگیری تقویتی (Reinforcement Learning) یک زیرشاخه جذاب از هوش مصنوعی است که بر تعامل با یک محیط و انجام کنش هایی به منظور حل مسائل کنترلی توسط یک عامل هوشمند تمرکز دارد. این شاخه از هوش مصنوعی به ماشین‌ها اجازه می‌ دهد تا از تجربیات خود بیاموزند و تصمیمات خود را بر اساس الگوریتم های تعریف شده اتخاذ کنند. برخلاف یادگیری نظارت شده که در آن مدل‌ ها بر اساس مجموعه داده ‌های برچسب‌ زده آموزش می ‌بینند، و یا یادگیری بدون نظارت که در آن شباهت ها کشف می ‌شوند، یادگیری تقویتی بر تعامل عامل‌ها با محیط ‌های مربوطه تمرکز دارد.

کاربردهای یادگیری تقویتی در دنیای واقعی بسیار گسترده و تاثیرگذار است، چرا که ماشین‌ها در این شاخه از هوش مصنوعی به صورت خودکار و بدون نیاز به ‌کمک انسانی عمل می‌کنند، و این تکنیک برای حل مسائل متنوع در دنیای واقعی از اهمیت بسزایی برخوردار است. از این حوزه در زمینه های مختلفی از جمله رباتیک، خودروهای خودران، پرنده های بدون سرنشین، بازی های ویدئویی، پزشکی، سیستم های معاملاتی و مسائل دیگری که در آن نیاز به یک عامل هوشمند جهت اتخاذ تصمیم و انجام اعمال در یک محیط وجود دارد، استفاده می شود.

در این دوره، مباحث مربوط به یادگیری تقویتی، با رویکرد پیاده سازی الگوریتم ها با استفاده از زبان برنامه نویسی پایتون و طبق سرفصل های استاندارد مباحث مربوط به این حوزه، و در قالب 6 فصل اصلی تدریس خواهد شد.

جهت کسب اطلاعات بیشتر در رابطه با این دوره، لطفا جلسه ی معرفی دوره را مشاهده نمایید.

سرفصل های دوره:

فصل1 : مفاهیم مقدماتی یادگیری تقویتی

فصل2: برنامه نویسی پویا

فصل3: روش مونت کارلو

فصل4: الگوریتم های Temporal Difference

فصل5: یادگیری عمیق (Deep Learning) و شبکه های عصبی مصنوعی (ANN)

فصل 6: یادگیری تقویتی عمیق (Deep Reinforcement Learning)

پیش نیاز های دوره :

آشنایی با زبان برنامه نویسی پایتون
آشنایی مقدماتی و علاقه مندی به یادگیری ریاضیات و آمار

آموزش جامع یادگیری تقویتی (Reinforcement Learning) در پایتون

آموزش زبان برنامه نویسی پایتون

آموزش جامع یادگیری تقویتی (Reinforcement Learning) در پایتون

پیش نیاز های دوره :

دوره های دیگر مدرس

آموزش پروژه محور یادگیری ماشین و یادگیری عمیق

آموزش جامع یادگیری ماشین و زیرشاخه ها در پایتون (با رویکرد مالی)

آموزش معاملات الگوریتمی ارز دیجیتال در پایتون

ورود به دنیای هوش مصنوعی

آموزش مقدماتی مبانی عملیات یادگیری ماشین (MLOps)

آموزش جامع نگارش مقالات علمی در حوزه هوش مصنوعی

آموزش جامع پردازش تصویر و بینایی ماشین در پایتون

آموزش جامع مبانی هوش مصنوعی – دوره تخصصی یادگیری عمیق

راهنمای جامع آمادگی برای آزمون های مصاحبه‌ در حوزه هوش مصنوعی

آموزش جامع مبانی هوش مصنوعی دوره تخصصی یادگیری ماشین

آموزش پروژه محور یادگیری ماشین و یادگیری عمیق

آموزش جامع یادگیری ماشین و زیرشاخه ها در پایتون (با رویکرد مالی)

آموزش معاملات الگوریتمی ارز دیجیتال در پایتون

ورود به دنیای هوش مصنوعی

آموزش مقدماتی مبانی عملیات یادگیری ماشین (MLOps)

آموزش جامع نگارش مقالات علمی در حوزه هوش مصنوعی

نظرات کاربران در رابطه با این دوره

آموزش جامع یادگیری تقویتی (Reinforcement Learning) در پایتون

پیش نیاز های دوره :

فهرستـــ ویدیوها

با مشاهده آنلاین جلسات در سایت ، هزینه اینترنت شما به صورت نیم بها محاسبه خواهد شد.

معرفی دوره

بررسی نقشه راه دوره

آشنایی با برخی از کاربردهای مهم یادگیری تقویتی

معرفی کتب مرجع و رفرنس های دوره

فصل 1 - مفاهیم مقدماتی یادگیری تقویتی

فرایند تصمیم گیری مارکوف

تعریف فضاها و مفهوم اپیزود

بررسی مفهوم Trajectory و مقایسه با Episode

پاداش و بازده (Reward و Return)

مفهوم Discount Factor

مفهوم Policy

مقادیر فضای حالت و فضای اکشن

معادله‌ی Bellman

بررسی حل مساله ی MDP و راه اندازی محیط برنامه نویسی

نصب پیشنیازها

پیاده سازی فرایند تصمیم گیری مارکوف 1

پیاده سازی فرایند تصمیم گیری مارکوف 2

پیاده سازی فرایند تصمیم گیری مارکوف 3

فصل دوم - برنامه نویسی پویا

مفهوم Value Iteration

پیاده سازی Value Iteration - جلسه 1

پیاده سازی Value Iteration - جلسه 2

پیاده سازی Value Iteration - جلسه 3

پیاده سازی Value Iteration - جلسه 4

مفهوم Policy Iteration

پیاده سازی Policy Iteration - جلسه 1

مفهوم Policy Evaluation

پیاده سازی Policy Iteration - جلسه 2

مفهوم Policy Improvement

پیاده سازی Policy Iteration - جلسه 3

پیاده سازی Policy Iteration - جلسه 4

آشنایی با Policy Iteration تعمیم یافته

فصل سوم - روش مونت کارلو

بررسی حل مسائل با روش مونت کارلو و نگاهی به مساله راهزن چند دست

حل مسائل به روش مونت کارلو با تکنیک On-Policy

پیاده سازی روش مونت کارلو با تکنیک On-Policy - جلسه 1

پیاده سازی روش مونت کارلو با تکنیک On-Policy - جلسه 2

پیاده سازی روش مونت کارلو با تکنیک On-Policy - جلسه 3

پیاده سازی روش مونت کارلو با تکنیک On-Policy - جلسه 4

پیاده سازی مونت کارلو با روش آلفا

تکنیک Off-Policy در مونت کارلو

پیاده سازی تکنیک Off-Policy در مونت کارلو - جلسه 1

پیاده سازی تکنیک Off-Policy در مونت کارلو - جلسه 2

پیاده سازی تکنیک Off-Policy در مونت کارلو - جلسه 3

فصل چهارم - الگوریتم های Temporal Difference

حل مسائل کنترلی با روش TD

مقایسه الگوریتم های TD و MC

معرفی الگوریتم SARSA

پیاده سازی الگوریتم SARSA - جلسه 1

پیاده سازی الگوریتم SARSA - جلسه 2

معرفی Q-Learning

پیاده سازی الگوریتم Q-Learning - جلسه 1

پیاده سازی الگوریتم Q-Learning - جلسه 2

الگوریتم TD چند مرحله ای

الگوریتم TD چند مرحله ای 2

الگوریتم SARSA در حالت چند مرحله ای

پیاده سازی الگوریتم SARSA در حالت چند مرحله ای

فضای حالت پیوسته

فضای حالت پیوسته 2

روش تجمیع فضای حالت

معرفی روش Tile Coding

فصل پنجم - یادگیری عمیق (Deep Learning) و شبکه های عصبی مصنوعی (ANN)

تعریف تخمین تابع

شبکه های عصبی مصنوعی (ANN)

شبکه های عصبی Feed Forward

نکات تکمیلی شبکه های عصبی

کاهش گرادیان تصادفی

نکات تکمیلی شبکه های عصبی 2

فصل ششم - یادگیری تقویتی عمیق (Deep Reinforcement Learning)

الگوریتم Deep SARSA

به کارگیری شبکه عصبی در الگوریتم SARSA

الگوریتم Deep Q-Learning

توضیح برخی نکات مهم

نصب پیش نیاز های پروژه DRL

پروژه‌ی DRL - جلسه 1

پروژه‌ی DRL - جلسه 2