هوش مصنوعی در پوکر چه نقشی می تواند داشته باشد؟

در حالی که هوش مصنوعی در شکست دادن انسان‌ ها در بازی‌ های دیگر مانند شطرنج و Go موفقیت‌ هایی داشت پیروزی در پوکر چالش‌ برانگیزتر بوده!

هوش مصنوعی پوکر

در حالی که هوش مصنوعی در شکست دادن انسان‌ ها در بازی‌ های دیگر مانند شطرنج و Go (بازی‌ هایی که از قوانین از پیش تعریف شده پیروی می‌کنند و تصادفی نیستند) موفقیت‌ هایی داشت، پیروزی در پوکر چالش‌ برانگیزتر بود زیرا به استراتژی، شهود و استدلال مبتنی بر اطلاعات پنهان نیاز دارد. با وجود چالش‌ ها، هوش مصنوعی اکنون می‌ تواند پوکر بازی کند و برنده شود.

سیستم‌ های هوش مصنوعی از جمله DeepStack و Libratus راه را برای Pluribus هموار کردند، هوش مصنوعی که پنج بازیکن دیگر را در Texas Hold’em شش نفره، محبوب‌ ترین نسخه پوکر، شکست داد. این شاهکار فراتر از بازی است. این دستاورد به این معنی است که هوش مصنوعی اکنون می تواند برای کمک به حل برخی از چالش برانگیزترین مسائل جهان گسترش یابد.

‏Tuomas Sandholm، استاد CMU که به ایجاد Pluribus کمک کرد، در یک بیانیه مطبوعاتی اظهار داشت: “توانایی شکست دادن پنج بازیکن دیگر در چنین بازی پیچیده ای فرصت های جدیدی را برای استفاده از هوش مصنوعی برای حل طیف گسترده ای از مشکلات دنیای واقعی باز می کند.”

‏DeepStack: رویکرد مقیاس پذیر برای برنده شدن در پوکر

تیم DeepStack، از دانشگاه آلبرتا در ادمونتون، کانادا، یادگیری ماشین عمیق و الگوریتم‌ها را برای ایجاد هوش مصنوعی با قابلیت برنده شدن در تگزاس هولدم دو نفره، «بدون محدودیت» ترکیب کردند، بازی پیچیده‌ تر برای تسلط هوش مصنوعی بر دیگران به دلیل ماهیت تصادفی، کارت های مخفی و بلوف های بازیکنان. شبکه های عصبی DeepStack با حل بیش از 10 میلیون موقعیت بازی پوکر آموزش داده شدند. هوش مصنوعی برای تعیین بهترین حرکات به شبکه های عصبی خود متکی است. DeepStack دو نفره Texas Hold’em را در مقابل بازیکنان پوکر حرفه ای فدراسیون بین المللی پوکر بازی کرد. پس از انجام 44852 بازی، نتایج DeepStack ده برابر آن چیزی بود که یک بازیکن حرفه ای پوکر حاشیه قابل توجهی در نظر می گیرد.

‏Libratus: حرفه ای در تگزاس هولدم دو نفره

‏Libratus یک هوش مصنوعی است که توسط Noam Brown و Tuomas Sandholm از دانشگاه کارنگی ملون در سال 2017 ساخته شد و در نهایت در پوکر دو نفره بی‌رقیب بود. این سیستم برای اجرا به 100 واحد پردازش مرکزی (CPU) نیاز داشت. لیبراتوس 120000 دست در یک رقابت 20 روزه پوکر در برابر چهار بازیکن برتر تگزاس هولد ام بازی کرد. با مبلغی خیره کننده برنده شد و با 1.8 میلیون دلار تراشه کنار رفت.

‏Pluribus: ربات فوق بشری در بازی پوکر

یک نقطه عطف بسیار مهم توسط Pluribus به دست آمد، رباتی که توانست برخی از بهترین بازیکنان پوکر جهان را در یک بازی شش نفره Texas Hold’em شکست دهد. دانشمندان دانشگاه کارنگی ملون به همراه هوش مصنوعی فیسبوک در این پروژه همکاری کردند، اولین پروژه ای که هوش مصنوعی در یک بازی با بیش از یک نفر رقابت کرد و در آن نمی توانست فقط به استراتژی بازی برای برنده شدن تکیه کند. اکنون که هوش مصنوعی می‌ تواند چندین بازیکن را در چنین بازی پیچیده شکست دهد، دروازه‌ای برای حل برخی از آزار دهنده‌ ترین مسائل جهان مانند مذاکرات خودکار، توسعه دارو، امنیت و امنیت سایبری، خودروهای خودران و تشخیص بهتر کلاهبرداری است.

نتایج Pluribus چشمگیر بود. این بازی 10000 دست پوکر در مقابل پنج نفر دیگر از جمعی از افراد میلیون دلاری پوکر بازی کرد. به طور متوسط، Pluribus از رقبای انسانی خود به ازای هر 100 عملی معادل 480 دلار با آنچه بازیکنان حرفه ای پوکر قصد دارند به دست آورند، برنده شد.

تیم تحقیقاتی Pluribus را با ساختن آنچه از Libratus آموخته بود، ایجاد کرد. این الگوریتم جستجو را به طور اساسی اصلاح کرد. به طور معمول، بخشی از فرمول موفقیت هوش مصنوعی هنگام انجام بازی های استراتژیک در برابر حریف، پردازش از طریق درختان تصمیم تا پایان بازی قبل از انجام حرکت است. با این حال، در یک بازی چند نفره، این فرآیند امکان پذیر نبود، زیرا اطلاعات بسیار پنهانی وجود داشت و امکان پردازش بسیار بیشتر بود. راه حل Pluribus این بود که به جای ارزیابی همه حرکات تا پایان بازی، فقط به چند حرکت جلوتر نگاه می کرد تا عملی را که انجام می دهد تعیین کند. هوش مصنوعی خود را از طریق یادگیری تقویتی می آموزد، به طور مداوم به بازی ها نگاه می کند و موفقیت را بر اساس شرایط ارزیابی می کند. اگر تشخیص دهد که نتیجه با یک حرکت متفاوت بهتر بود، یاد می گیرد که آن را در بازی های آینده اعمال کند.

قبل از مسابقه با انسان ها، پلوریباس تریلیون ها دست پوکر علیه خودش بازی کرد. سپس با یک بازیکن پوکر حرفه ای روبرو شد. وقتی اشتباه می کرد، بازیکن به تیم هشدار می داد. به زودی، ربات با توجه به اینکه اطلاعات جدید به سرعت از متوسط ​​بودن به یک بازیکن پوکر در سطح جهانی تبدیل شد، به سرعت در حال پیشرفت بود. در نهایت، سبک بازی خود را تعیین کرد، حتی استراتژی‌های ترکیبی را بر اساس موقعیت برای شکست دادن پنج بازیکن دیگر اتخاذ کرد.

شما قبلا به این مطلب رای داده اید. 5 / 5. 79