قیمت این دوره: 700,000 350,000 تومان
  • مدرس دوره : قائم تقی پور
  • تعداد ویدیوها : 19 ویدیو
  • مدت زمان دوره : 3:41:00
  • سطح دوره : پیشرفته
  • وضعیت دوره : در حال برگزاری
  • تاریخ آخرین بروزرسانی : 1402/09/18
ثبتـــ نام در این دوره ثبت نام در دوره
آموزش جامع یادگیری تقویتی (Reinforcement Learning) در پایتون

آموزش جامع یادگیری تقویتی (Reinforcement Learning) در پایتون

یادگیری تقویتی (Reinforcement Learning) یک زیرشاخه جذاب از هوش مصنوعی است که بر تعامل با یک محیط و انجام کنش هایی به منظور حل مسائل کنترلی توسط یک عامل هوشمند تمرکز دارد. این شاخه از هوش مصنوعی به ماشین‌ها اجازه می‌ دهد تا از تجربیات خود بیاموزند و تصمیمات خود را بر اساس الگوریتم های تعریف شده اتخاذ کنند. برخلاف یادگیری نظارت شده که در آن مدل‌ ها بر اساس مجموعه داده ‌های برچسب‌ زده آموزش می ‌بینند، و یا یادگیری بدون نظارت که در آن شباهت ها کشف می ‌شوند، یادگیری تقویتی بر تعامل عامل‌ها با محیط ‌های مربوطه تمرکز دارد.

کاربردهای یادگیری تقویتی در دنیای واقعی بسیار گسترده و تاثیرگذار است، چرا که ماشین‌ها در این شاخه از هوش مصنوعی به صورت خودکار و بدون نیاز به ‌کمک انسانی عمل می‌کنند،  و این تکنیک برای حل مسائل متنوع در دنیای واقعی از اهمیت بسزایی برخوردار است. از این حوزه در زمینه های مختلفی از جمله رباتیک، خودروهای خودران، پرنده های بدون سرنشین، بازی های ویدئویی، پزشکی، سیستم های معاملاتی و مسائل دیگری که در آن نیاز به یک عامل هوشمند جهت اتخاذ تصمیم و انجام اعمال در یک محیط وجود دارد، استفاده می شود.

در این دوره، مباحث مربوط به یادگیری تقویتی، با رویکرد پیاده سازی الگوریتم ها با استفاده از زبان برنامه نویسی پایتون و طبق سرفصل های استاندارد مباحث مربوط به این حوزه، و در قالب 6 فصل اصلی تدریس خواهد شد.

جهت کسب اطلاعات بیشتر در رابطه با این دوره، لطفا جلسه ی معرفی دوره را مشاهده نمایید.

 

سرفصل های دوره:

فصل1 : مفاهیم مقدماتی یادگیری تقویتی
فصل2: برنامه نویسی پویا
فصل3: روش مونت کارلو
فصل4: الگوریتم های Temporal Difference
فصل5: یادگیری عمیق (Deep Learning) و شبکه های عصبی مصنوعی (ANN)
فصل 6: یادگیری تقویتی عمیق (Deep Reinforcement Learning)


پیش نیاز های دوره :

  1. آشنایی با زبان برنامه نویسی پایتون
  2. آشنایی مقدماتی و علاقه مندی به یادگیری ریاضیات و آمار

فهرستـــ ویدیوها

مدت زمان دوره 3:41:00
  • با مشاهده آنلاین جلسات در سایت ، هزینه اینترنت شما به صورت نیم بها محاسبه خواهد شد.

1
  • معرفی دوره

00:21:35

معرفی دوره

2
  • بررسی نقشه راه دوره

00:08:44

بررسی نقشه راه دوره

3
  • آشنایی با برخی از کاربردهای مهم یادگیری تقویتی

00:14:11

آشنایی با برخی از کاربردهای مهم یادگیری تقویتی

4
  • معرفی کتب مرجع و رفرنس های دوره

00:09:08

مرجع مطالب دوره

5
  • فصل 1 - مفاهیم مقدماتی یادگیری تقویتی

00:17:16

فصل 1 - مفاهیم مقدماتی یادگیری تقویتی

6
  • فرایند تصمیم گیری مارکوف

00:12:55

MDP

7
  • تعریف فضاها و مفهوم اپیزود

00:10:09

تعریف فضاها و مفهوم اپیزود

8
  • بررسی مفهوم Trajectory و مقایسه با Episode

00:04:00

بررسی مفهوم Trajectory و مقایسه با Episode

9
  • پاداش و بازده (Reward و Return)

00:04:35

Reward و Return

10
  • مفهوم Discount Factor

00:06:35

مفهوم Discount Factor

11
  • مفهوم Policy

00:06:17

مفهوم Policy

12
  • مقادیر فضای حالت و فضای اکشن

00:06:23

مقادیر فضای حالت و فضای اکشن

13
  • معادله‌ی Bellman

00:06:29

معادلات Bellman

14
  • بررسی حل مساله ی MDP و راه اندازی محیط برنامه نویسی

00:25:54

حل مساله ی MDP و راه اندازی محیط برنامه نویسی

15
  • نصب پیشنیازها

00:11:51

نصب پیشنیازها

16
  • پیاده سازی فرایند تصمیم گیری مارکوف 1

00:19:05

پیاده سازی فرایند تصمیم گیری مارکوف

17
  • پیاده سازی فرایند تصمیم گیری مارکوف 2

00:16:57

پیاده سازی فرایند تصمیم گیری مارکوف

18
  • پیاده سازی فرایند تصمیم گیری مارکوف 3

00:10:28

پیاده سازی فرایند تصمیم گیری مارکوف

19
  • فصل دوم - برنامه نویسی پویا

00:09:10

فصل دوم - برنامه نویسی پویا

دوره های دیگر مدرس

مشاهده همه دوره ها

نظرات کاربران در رابطه با این دوره

لطفا سوالات خود را راجع به این آموزش در این بخش پرسش و پاسخ مطرح کنید به سوالات در قسمت نظرات پاسخ داده نخواهد شد و آن نظر حذف میشود.
جهت ثبت نظر باید در سایت عضو شوید و یا وارد سایت شده باشید .