![]() |
شبیه سازی مقاله Q-Learning - نسخهی قابل چاپ صفحهها: ۱ ۲ |
شبیه سازی مقاله Q-Learning - kadoos - 16 تیر ۱۳۹۷ ۰۹:۳۲ ب.ظ
با سلام به تازگی با مباحث یادگیری ماشین آشنا شدم و به دلیل استفاده روز افزون از هوش مصنوعی در شبکه های بی سیم، باید تزم را در این زمینه انجام بدم. به همین دلیل باید یه مقاله که از multi-agent Q-Learning برای حل یک مسئله بهینه سازی در شبکه های بی سیم استفاده کرده را شبیه سازی کنم. کسی از دوستان با Q-Learning آشنایی داره یا کد آماده یا منبعی سراغ دارین بتونم استفاده کنم. لطفا راهنمائیم کنید متشکرم |
شبیه سازی مقاله Q-Learning - خانه سبز - ۱۷ تیر ۱۳۹۷ ۰۸:۰۱ ب.ظ
کیو لرنینگ یعنی یادگیری تقویتی معنیش هم میشه یادگیری کیو سوالی باشه در خدمتم |
RE: شبیه سازی مقاله Q-Learning - kadoos - 17 تیر ۱۳۹۷ ۱۱:۴۳ ب.ظ
(۱۷ تیر ۱۳۹۷ ۰۸:۰۱ ب.ظ)خانه سبز نوشته شده توسط: کیو لرنینگ یعنی یادگیری تقویتی سلام ممنون از جوابتون من روش Q-learning رو بلدم، ولی تو پیاده سازی مقاله مشکل دارم. از اینترنت یه سری کدهای Q-learning پیدا کردم ولی همشون single agent هستن در حالی که مقاله ای که من باید پیاده سازی کنم multi agent هستش، می تونید تو پیاده سازی مقاله کمکم کنید؟ |
RE: شبیه سازی مقاله Q-Learning - BBumir - 18 تیر ۱۳۹۷ ۱۲:۱۹ ق.ظ
(۱۷ تیر ۱۳۹۷ ۱۱:۴۳ ب.ظ)kadoos نوشته شده توسط:(17 تیر ۱۳۹۷ ۰۸:۰۱ ب.ظ)خانه سبز نوشته شده توسط: کیو لرنینگ یعنی یادگیری تقویتی سلام، من چیزی که از کیولرنینگ یادم میآد اینه که یه ایجنت یه سری اکشن وقتی تو یک استیت هست انتخاب میکنه بعد یه سری وزن که نشون دهنده ارزش اون حرکت در اون استیت هست رو تخمین میزنه و بهروزرسانی انجام میده. اینقد این کاررو میکنه تا همگرا بشه یعنی به ازای هر استیت و هر حرکت بدونیم هزینه و سودش چقده. البته فک کنم این واسه وقتی بود که محیط و حرکتها یا اکشنها در هر استیت بدونیم چیه. اگه اون چن تا ایجنتتون با هم همکاری خاصی ندارن و از هم مستقلن خیلی تاثیری نداره رو استراکچری که محیط بعد از همگرا شدنه الگوریتم بدست میآد. وقتی هم که ارزشها به ازای هر استیت و عمل به دست اومد هر ایجنت اگه مستقله میتونه حریصانه عمل کنه همیشه بهترین رو انتخاب کنه. |
RE: شبیه سازی مقاله Q-Learning - kadoos - 18 تیر ۱۳۹۷ ۰۱:۲۱ ق.ظ
[ سلام، من چیزی که از کیولرنینگ یادم میآد اینه که یه ایجنت یه سری اکشن وقتی تو یک استیت هست انتخاب میکنه بعد یه سری وزن که نشون دهنده ارزش اون حرکت در اون استیت هست رو تخمین میزنه و بهروزرسانی انجام میده. اینقد این کاررو میکنه تا همگرا بشه یعنی به ازای هر استیت و هر حرکت بدونیم هزینه و سودش چقده. البته فک کنم این واسه وقتی بود که محیط و حرکتها یا اکشنها در هر استیت بدونیم چیه. اگه اون چن تا ایجنتتون با هم همکاری خاصی ندارن و از هم مستقلن خیلی تاثیری نداره رو استراکچری که محیط بعد از همگرا شدنه الگوریتم بدست میآد. وقتی هم که ارزشها به ازای هر استیت و عمل به دست اومد هر ایجنت اگه مستقله میتونه حریصانه عمل کنه همیشه بهترین رو انتخاب کنه. [/quote] عملکرد agentها روی هم تاثیر داره و مهمه که هر agent چه اکشنی رو انتخاب کنه |
RE: شبیه سازی مقاله Q-Learning - BBumir - 18 تیر ۱۳۹۷ ۰۱:۵۰ ق.ظ
(۱۸ تیر ۱۳۹۷ ۰۱:۲۱ ق.ظ)kadoos نوشته شده توسط: [ عملکرد agentها روی هم تاثیر داره و مهمه که هر agent چه اکشنی رو انتخاب کنه [/quote] حدسی که برای جواب به این مساله میتونم بزنم یه همچین چیزیه که اگه ایجنتهاتون عین همن، مثلا فرض کنیم ۴ تا ایجنت داریم، تو یه محیط استیتها و حرکتهاشون رو در نظر میگیریم و ترتیب حرکتشون هم مثلا به صورت رندم در نظر میگیریم (چون حرکت هر کدوم رو بقیه قراره یه تاثیری بذاره) با این شرایط یه دفعه کیوهارو آپدیت میکنیم بعد دوباره یه سری استیت رندم برای ایجنتها در نظر میگیریم (به جای رندم میتونه ادامه حرکت قبل باشه یعنی بزاریم بعد از مقداردهی تصادفی استیت برای هر ایجنت چند بار حرکت کنه از همون جا و کیوهارو آپدیت کنه) و همین داستانو ادامه میدیم بعد از یه تعداد زیادی تکرار به نظرم کیوها همگرا میشه، البته فقط نظره. دوباره که کیوها بدست اومد بازم داستان قبلی با یه الگوی حریصانه بهترین کیو رو انتخاب میکنه هر ایجنت به ازای حرکت بقیه. |
RE: شبیه سازی مقاله Q-Learning - kadoos - 18 تیر ۱۳۹۷ ۱۲:۰۷ ب.ظ
سلام ممنون از جوابتون من مفاهیم رو بلدم ولی نمی دونم که چطور باید این مقاله رو شبیه سازی کرد. شبیه سازی این مقاله خیلی برام اهمیت داره چون قراره مبنای تزم باشه ولی تا حالا نتونستم شبیه سازی کنم و نتونستم کسی رو پیدا کنم که تو این زمینه کار کرده باشه و بتونم تو شبیه سازی ازشون کمک بگیرم. |
شبیه سازی مقاله Q-Learning - خانه سبز - ۱۸ تیر ۱۳۹۷ ۱۲:۴۳ ب.ظ
کیو لرنینگ خیلی روش خوبی هست ایده ایی که من دارم این هست QR لرنینگ ارائه بشه یعنی ترکیب R و Q کیو آر لرنینگ البته آی کیو لرنینگ هم خوبه سوالی باشه باز درخدمتم |
RE: شبیه سازی مقاله Q-Learning - kadoos - 18 تیر ۱۳۹۷ ۰۴:۳۶ ب.ظ
(۱۸ تیر ۱۳۹۷ ۱۲:۴۳ ب.ظ)خانه سبز نوشته شده توسط: کیو لرنینگ خیلی روش خوبی هست این مقاله که باید شبیه سازیش کنم از Q-Learning استفاده کرده. |
شبیه سازی مقاله Q-Learning - خانه سبز - ۱۸ تیر ۱۳۹۷ ۰۶:۱۲ ب.ظ
(۱۸ تیر ۱۳۹۷ ۰۴:۳۶ ب.ظ)kadoos نوشته شده توسط:(18 تیر ۱۳۹۷ ۱۲:۴۳ ب.ظ)خانه سبز نوشته شده توسط: کیو لرنینگ خیلی روش خوبی هست من نظرم رو QR یا IQ لرنینگ هست که میمونه بعد این پیاده سازی مقالتون اونا پیاده بشن اگه نتایج خوب بود بفرستیم برای کنفرانس |
RE: شبیه سازی مقاله Q-Learning - kadoos - 18 تیر ۱۳۹۷ ۰۹:۱۱ ب.ظ
(۱۸ تیر ۱۳۹۷ ۰۶:۱۲ ب.ظ)خانه سبز نوشته شده توسط:اگه نتایج خوب بود بفرستیم برای کنفرانس(18 تیر ۱۳۹۷ ۰۴:۳۶ ب.ظ)kadoos نوشته شده توسط:(18 تیر ۱۳۹۷ ۱۲:۴۳ ب.ظ)خانه سبز نوشته شده توسط: کیو لرنینگ خیلی روش خوبی هست ![]() ![]() ![]() در حال حاضر مشکل من پیاده سازی این مقالست، اگه بتونم این مقاله رو پیاده سازی کنم، سعی می کنم بهبودش بدم و مقاله بفرستم. ولی فعلا تو پیاده سازی این موندم چه برسه به پیاده سازی کار خودم |
RE: شبیه سازی مقاله Q-Learning - αɾια - ۱۸ تیر ۱۳۹۷ ۱۰:۰۰ ب.ظ
(۱۸ تیر ۱۳۹۷ ۰۹:۱۱ ب.ظ)kadoos نوشته شده توسط: در حال حاضر مشکل من پیاده سازی این مقالست،سلام ،منم همین مشکلُ دارم و سورس کد خوبی پیدا نکردم. چرا از اساتید هوش یا طراحی الگوریتمی کمک نمیگیرید؟ |
شبیه سازی مقاله Q-Learning - خانه سبز - ۱۸ تیر ۱۳۹۷ ۱۰:۰۲ ب.ظ
سخت نیست قدم اول انتخاب عنوان و کشیدن طرح هست قدم دوم داده سازی هست قدم سوم نگارش قدم اول رو ما الان برداشتیم برای مثال QR learning یا IQ Learning حالا باید یه طرح از این عنوان در بیاریم و تو مقاله بنویسیم این الگوریتم ما و این داده ها دادیم بهش خروجی هم باید نتایج ۵ درصد دقت بهتر بشه و بگیم یکم سرعتش بده ولی دقتش خوبه در نهایت میمونه نگارشش یک نویسنده حرفه ایی باید طوری بنویسه که واقعی نشون بده از رم ۸ گیگ و لبتاب دوال کور ۲ استفاده شده در متلب ۲۰۱۴ بعد می فرستیم برای ژورنال شانسمون امتحان می کنیم. |
RE: شبیه سازی مقاله Q-Learning - kadoos - 05 مرداد ۱۳۹۷ ۰۶:۳۸ ب.ظ
(۱۸ تیر ۱۳۹۷ ۱۰:۰۰ ب.ظ)Katerina Petrova نوشته شده توسط:سلام(18 تیر ۱۳۹۷ ۰۹:۱۱ ب.ظ)kadoos نوشته شده توسط: در حال حاضر مشکل من پیاده سازی این مقالست،سلام ،منم همین مشکلُ دارم و سورس کد خوبی پیدا نکردم. ببخشید من انقدر دیر جواب دادم. راستش پیامتونو الان دیدم. همین کارو باید انجام بدم. از یه سری احتمالات و روش ها توی این مقاله استفاده شده که من نمی تونم چطور باید پیاده سازی شن یا اصلا مفهومشون چیه. شما مشکلتون حل شد؟ ممنون از راهنماییتون |
RE: شبیه سازی مقاله Q-Learning - αɾια - ۰۷ مرداد ۱۳۹۷ ۱۰:۱۰ ق.ظ
(۰۵ مرداد ۱۳۹۷ ۰۶:۳۸ ب.ظ)kadoos نوشته شده توسط: سلامسلام ،خواهش میکنم اول روش ارائه شده توی مقاله رو باید کاملا درک کنید بتونید و بعد برید سراغ مقالاتی که با Q learning کار کردند... اینجوری تا حدودی دستتون میاد که چطور باید پیش برین. توصیه میکنم از فیلم های آموزشی رو هم ببینید. من بخاطر کوچک بودن سایز مسئله ،به توصیه استاد مشاور ،فعلا ،دارم با الگوریتم های زیستی کار میکنم و بعد از اتمام این پروژه قراره بریم سراغ دیپ و مخلفات.. ![]() |