2020: Bangkitnya Mesin


oleh James Grosjean Hitung saya di antara drone Netflix yang menyukai The Queen’s Gambit (2020), tetapi saya selalu menjadi penggemar catur. Selama masa kuliah saya, saya mungkin makan seribu croissant cokelat sambil menonton Murray Turnbull yang unik dan luar biasa (alias “The Chess Master”) menghadapi semua pendatang di alun-alun kota – “$ 2, pengembalian dana jika Anda menang atau seri.” Merupakan kehormatan bagi saya untuk mengambil foto Karpov agung yang dibingkai oleh kaca patri di Memorial Hall ketika dia melakukan simulasi 40 papan di kampus. Saya adalah bagian dari pers mahasiswa ketika Kasparov membuat pernyataan kontroversialnya bahwa komputer akan menjadi juara utama sebelum seorang wanita menjadi juara. Menyimpan perdebatan tentang kemungkinan misogini Kasparov untuk forum lain dan hari lain, saya menganggap pernyataannya hanya sebagai proyeksi berdasarkan pengamatan empiris dari komunitas catur. Partisipasi perempuan selalu rendah, dan tidak meningkat berarti, sementara komputer sudah kuat, dan semakin kuat dengan cepat. Mesin tersebut akan mengantarkan pada kesetaraan baru — di mana semua jenis kelamin diremukkan seperti semut. Teorema Zermelo memberi tahu kita bahwa permainan dengan informasi lengkap (kedua pemain dapat melihat semua bidak di papan catur), yang terbatas (permainan AKAN berakhir setelah beberapa langkah), memiliki solusi, dan jika kedua belah pihak memainkan ini solusi optimal, maka setiap game memiliki hasil yang sama. Catur cukup rumit sehingga kami tidak yakin apa hasilnya, tetapi kami pikir Putih akan menang setiap saat, dalam hal ini tidak ada respons Hitam yang dapat mengubah hasilnya. Permainan Connect Four juga termasuk dalam Teorema Zermelo, dan analisis telah menentukan bahwa dalam permainan itu, licik selalu menang jika dia pergi lebih dulu dan bermain dengan optimal. Jika Anda seorang AP yang menyukai QGambit, dan menginginkan lebih banyak konten selama pandemi yang tidak pernah berakhir ini, maka tugas Anda selanjutnya adalah menonton AlphaGo, sebuah dokumenter tentang kebangkitan komputer di game kuno Go, yang lebih rumit daripada catur. Tidak main-main, film ini menyentak orang-orang yang tertarik dengan bidang ini dan menghargai drama emosional yang intens untuk juara kemanusiaan, Lee Sedol — yang terbaik yang pernah melakukannya. Film ini menangkap kesusahan, keberanian, kecemerlangan, dan kerendahan hati Sedol, saat ia menyadari bahwa pertandingan melawan mesin ini bukan hanya permainan, tetapi munculnya tatanan dunia baru. Bukan seorang programmer, Sedol tidak menghargai apa yang akan dia hadapi, tetapi sebagai seorang ahli dalam keahliannya, di papan tulis dia bisa merasakan beban lawannya yang tanpa henti dan tak tertembus. Setelah Anda menikmati AlphaGo, saya merekomendasikan (sebenarnya, Google merekomendasikan) agar Anda menonton beberapa pertandingan poker antara sekolah lama Dan Negreanu dan klon komputer modern Doug Polk. Pemain terbaik di dunia adalah mesinnya, jadi manusia pintar seperti Polk meniru strategi mesin tersebut. Beradaptasi atau mati. Saya pernah berbincang singkat dengan Howard Lederer. Saya bertanya kepadanya tentang bot di situs poker. Dia menepis masalah tersebut dengan mengatakan: “Poker tidak seperti catur. Poker adalah permainan informasi yang tidak lengkap. Komputer tidak bagus dalam hal itu. ” Saya tidak tahu apakah dia bodoh atau penipu bodoh untuk Full Tilt Poker. Bagaimanapun, saya tidak ingin melanjutkan percakapan itu 15 tahun yang lalu. Tapi sekarang di sinilah kita, di tahun 2021, dan inilah waktunya untuk melanjutkan percakapan itu, dengan menyangkal kesalahan pertama mengenai komputer GTO (game-theory optimal), dan semua kesalahan tumpang tindih lainnya yang dimiliki oleh dinosaurus poker dan ahli poker yang memproklamirkan diri. berpegang teguh pada: Kekeliruan # 1: Komputer tidak pandai dalam permainan informasi yang tidak lengkap. Ini hanya kebodohan. Benar bahwa Teorema Zermelo tidak berlaku untuk permainan seperti poker. Untuk poker, ada teorema LAIN yang pada dasarnya mengatakan bahwa ada solusi untuk permainan, dan solusi komputer umumnya akan melibatkan “strategi campuran” yang berarti bahwa ada beberapa komponen pengacakan pada strategi (seperti memanggil Gunting dengan probabilitas 1/3 ). Komputer cukup baik, lebih baik daripada manusia, dalam menghitung ekspektasi atas hasil probabilistik, terutama ketika distribusi probabilitas diketahui secara tepat, seperti halnya dalam permainan kartu. Misalnya, komputer tahu persis apa probabilitas menggambar Flush pintu belakang dan peluang pot apa yang dibutuhkan untuk membenarkan pengejaran. Meskipun poker melibatkan informasi yang tidak lengkap, poker head-up tanpa batas adalah permainan yang lebih sederhana daripada Go, meskipun Go melibatkan informasi lengkap (informasi pengetahuan umum). Kekeliruan # 2: Keunggulan komputer berasal dari kemampuan mengingat setiap tangan yang saya mainkan, dan menyesuaikannya. Sementara “bot eksploitatif” memang akan menganalisis permainan Anda sebelumnya dan menyesuaikan dengan kelemahan yang dirasakan, bot GTO standar (yang biasa kami sebut “bot Nash”) adalah setara poker dengan BS di blackjack. Strategi GTO tidak berubah, terlepas dari bagaimana Anda memainkan permainan sebelumnya. Itu tidak membutuhkan informasi itu, dan tidak peduli. Kekeliruan # 3: Solusi GTO hanya “benar” jika bermain melawan bot GTO lain, karena itulah yang diasumsikan saat bot dikembangkan — bot “dipelajari” dengan bermain melawan bot itu sendiri. Ini salah. “Bot bermain melawan dirinya sendiri untuk belajar poker” adalah salah karakterisasi dari proses pengembangan. Media suka menggembar-gemborkan clickbaitnya untuk membuat setiap hasil komputasi terdengar seperti terobosan generasi, menggunakan HAL dan Skynet. Bot GTO tidak tahu apa-apa tentang poker. Memperoleh strategi GTO merupakan latihan dalam perhitungan, yang dimungkinkan oleh memori besar dan kecepatan CPU yang tersedia di komputer saat ini dan pengembangan algoritma yang efisien untuk melakukan komputasi (“penyesalan minimisasi”). Kami tidak pernah mendeskripsikan algoritme sebagai “pembelajaran mesin” atau “AI” –kita biasa menyebutnya “mendaki bukit” atau “pemaksimalan” atau “pengoptimalan”. Pada setiap langkah algoritme berulang, komputer memiliki strategi saat ini yang sedang dikembangkan untuk setiap kursi di meja, dan strategi saat ini dapat secara populer digambarkan sebagai “dirinya sendiri”, seperti dalam: “PokerSnowie bermain melawan dirinya sendiri.” Tapi itu benar-benar hanya iterasi pada jalurnya mendaki bukit untuk bertemu di puncak — strategi optimal untuk poker. Optimal itu tidak mengasumsikan lawan tertentu. Ada cara lain untuk menghitung solusinya (meskipun mungkin tidak secepat), dan itu akan sama validnya. Strategi GTO ini adalah “Buku” untuk poker, dan tidak akan pernah dirugikan, terlepas dari lawannya. Tidak ada strategi yang bisa mengalahkannya. Kekeliruan # 4: Bot GTO mengasumsikan saya akan bermain dengan cara tertentu, tetapi saya akan mengelabui dengan memainkan off-suit 72 saya di luar posisi. Salah. Bot GTO tidak mengasumsikan apa pun tentang cara Anda bermain. Tidak peduli. Ini tidak terkalahkan melawan strategi lawan APA PUN. Bayangkan Anda akan menghadapi pertarungan melawan Floyd Mayweather, dan Anda berkata, “Floyd mengharapkan saya tampil dalam kondisi fisik yang sempurna. Dia berasumsi saya akan berlatih keras selama enam bulan ke depan. Aku akan menipunya — aku akan menonton Netflix dan makan donat selama enam bulan ke depan. ” Floyd tidak tahu berapa banyak Anda akan berlatih. Dia tahu bahwa jika dia sendiri muncul dalam kondisi sempurna, maka tidak ada lawan yang bisa mengalahkannya. Apakah masuk akal untuk mengatakan, “Bot menganggap saya akan bermain bagus. Saya akan menipu bot dengan bermain poker yang buruk! ” Ya, Anda benar-benar menunjukkannya! Kekeliruan # 5: Saya menemukan kelemahan — ketika saya memiliki ini dan itu, dari posisi ini dan itu, maka bot harus melakukan X, tetapi melakukan Y. Salah. Bot tidak memiliki kelemahan. Anda melihat pegangan tangan tertentu, dan hasil tertentu, tetapi berdasarkan kemungkinan berada dalam skenario itu, dan semua kemungkinan tangan yang dapat Anda pegang dilihat dari sudut pandang bot, permainannya benar, dan Anda bisa tidak menemukan lubang di sana. Sangat berbahaya untuk melihat sebuah drama secara terpisah. Bot membuat gerakan untuk menyeimbangkan jangkauannya, sehingga Anda tidak dapat memahat dalam situasi lain, atau jika kartu yang berbeda datang ke sungai. Jika Anda tidak melihatnya, maka kekurangannya ada pada pemikiran poker Anda sendiri, bukan botnya. Kekeliruan # 6: Jika saya memainkannya sebentar, saya akan mencari tahu cara memainkannya dan menemukan kelemahannya. Salah. Tidak ada kelemahan. Faktanya, kami dapat mempublikasikan strategi bot, dan tidak akan ada bedanya. Jika saya memberi tahu Anda bahwa saya akan bermain Gunting, Batu, dan Kertas dengan probabilitas masing-masing 1/3, fakta bahwa Anda mengetahui strategi saya tidak memberi Anda kemampuan untuk mendapatkan keunggulan. Tidak ada tumit Achilles. Kekeliruan # 7: Bot Heads-Up Limit yang diperkenalkan ke kasino sangat bisa dikalahkan, jadi mungkin bot GTO juga. Ini bukanlah perbandingan yang berarti. Beberapa bot kasino diinstruksikan untuk tidak memainkan permainan A mereka, karena terlalu kuat melawan manusia biasa. Jika kasino mengatur bot untuk memainkan permainan B-nya, untuk mencapai, katakanlah, keunggulan 5% melawan sebagian besar pemain, maka manusia yang sangat baik dapat menghasilkan uang melawan bot GTSO itu (bot sub-optimal teori permainan). Tapi itu masalah yang berbeda. Saya tidak peduli siapa Anda: Jika Anda berhadapan langsung dengan PokerSnowie, Anda akan kalah. Kekeliruan # 8: Bot GTO dapat mengalahkan pemain yang lemah, tetapi bot akan mengalami kesulitan melawan lawan top seperti Phil Ivey atau Dan Negreanu. Salah. Hal yang indah tentang bot GTO adalah tidak peduli siapa lawannya. Paling banter, seseorang bisa bermain bahkan dengan bot. Cincin bot GTO akan seperti wastafel, dengan uang mengalir searah jarum jam mengejar tombol, dan mengeringkan bagian tengah meja karena penggaruk. Masalah praktis yang dulu dimiliki oleh para profesional dunia nyata adalah memutuskan kapan keterampilan mereka cukup untuk melangkah ke taruhan lebih tinggi berikutnya yang tersedia, di mana para pemain mungkin lebih kuat. Tapi sekarang, pemain yang meniru strategi GTO dapat duduk di meja mana pun di dunia, dengan taruhan apa pun, dan tidak perlu khawatir menjadi ikan. Paling-paling, permainannya akan seimbang (di luar penggaruk), dan dalam praktiknya, strategi GTO memberikan keunggulan yang cukup besar terhadap siapa pun yang akan Anda temui di alam liar. Kekeliruan # 9: Dan Negreanu adalah ahli poker lama dengan gelang N, jadi dia akan menghancurkan nits komputer seperti Doug Polk yang tidak memahami nuansa poker sungguhan. Jika orang seperti Polk hanya menghafal “grafik” dan meniru strategi GTO, dia tidak perlu memahami apa-apa. Dia tidak perlu tahu apa arti kata “nuance”. Pengalaman poker pro seperti Negreanu adalah yang memungkinkan mereka menemukan permainan terbaik dalam skenario yang rumit. Pengalaman itu sudah usang sekarang karena komputer baru saja menghitung permainan yang benar. Mungkin pada tahun 1950, pengalaman seorang pemain memungkinkan dia untuk menentukan bahwa memukul 14 v T lebih baik daripada berdiri. Setelah Four Horsemen menghitung grafik BS, pengalaman blackjack itu menjadi tidak relevan. Buku membuat pengalaman tidak perlu. Sekarang Doug Polk bukanlah bot GTO. Dia adalah seorang profesional top yang menggunakan strategi GTO. Jadi, satu-satunya kesempatan Negreanu untuk mengalahkan Polk adalah jika emulasi GTO Polk tidak akurat, dan jika lubangnya cukup besar untuk ditemukan dan dieksploitasi oleh Negreanu. Aku meragukan itu. Keputusan panjang lainnya adalah jika mereka bermain secara langsung, dan jika Polk memiliki informasi fisik, berikan informasi tentang kartu hole-nya, dan jika Negreanu dapat membacanya seperti itu. Atau jika Polk memiliki masalah kemiringan dan mulai menyimpang dari GTO jika dia memiliki kartu yang buruk. Tidak mungkin. Atau, mungkin permainannya cukup pendek sehingga Negreanu beruntung dalam sampel kecil. Setelah bermain melawan AlphaGo, Lee Sedol meningkatkan permainannya dan mulai menghancurkan semua orang (bukan karena dia belum melakukannya), tetapi kemudian mundur dari permainan! Dia mengakui bahwa dia telah dikalahkan (konsep yang luar biasa!), Dan bahwa tidak ada manusia yang akan lagi menantang pemain terbaik di dunia, AlphaGo. Kami akan melihat apakah Negreanu akan memiliki pencerahan yang sama. Sebuah tweet baru-baru ini membuat saya bertanya-tanya, karena Negreanu sepertinya mempertanyakan permainan bot, dan menunjukkan bahwa ada garis tipis antara kejeniusan dan keledai. Saya pikir dia masih berharap ada kekurangan dalam strategi GTO. Tidak ada. Terakhir saya dengar, Negreanu mengejar ketinggalan dalam kontes, dan ada beberapa indikasi bahwa salah satu alasannya adalah, untuk pujiannya, Negreanu berlatih dengan PokerSnowie, dan beradaptasi! Jika Negreanu dapat dengan cepat mempelajari strategi GTO, maka dia dapat menyamakan kedudukan, yang akan menjadi pencapaian yang luar biasa. Satu-satunya cara dinosaurus bisa bertahan hidup adalah dengan berevolusi. Kita lihat di 2021.

[Next time, I’ll discuss some of the limitations and weaknesses of the poker bots, unless we thrash them out in the Comments below.]


ปอยเปต คาสิโน ออนไลน์
dgคาสิโน
ปอยเปต คาสิโน ออนไลน์
คาสิโนsa
คาสิโน sa

Leave a Reply

Your email address will not be published. Required fields are marked *