Matematika Poker – Bagian 10 – Strategi Kesetimbangan Nash

nash

Ini adalah bagian terakhir dari seri ini.

The Nash Equilibrium Strategy adalah Teori Permainan Strategi Optimal oleh John Forbes Nash.

Ini adalah strategi yang akan memenangkan uang sebanyak mungkin terhadap lawan yang selalu memilih strategi balik terbaik untuk Anda.

Contoh

Dalam permainan judi online Rock / Paper / Scissors, Nash Equilibrium Strategy (NES) adalah membuat pilihan acak sebesar 33% untuk setiap item melawan lawan yang SELALU memilih strategi balik terbaik. (Dia tidak melihat pilihan Anda; ia hanya menentukan strategi terbaik berdasarkan strategi Anda).

Mengapa kita menggunakan strategi eksploitatif di Poker bukannya NES?

Kami berharap hampir SEMUA pemain TIDAK akan memilih strategi balik yang optimal – oleh karena itu SEN bukanlah strategi terbaik untuk digunakan.

Anda perlu memainkan Strategi EXPLOITATIVE yang memiliki harapan terbaik.

Strategi EXPLOITATIVE mengacu pada strategi apa pun dengan harapan yang lebih tinggi daripada SEN terhadap lawan tertentu.

Contoh

Jika lawan memilih ROCK 45% dari waktu, Anda harus selalu memilih PAPER dan berharap untuk memenangkan 45% permainan dibandingkan dengan 33% dalam pemilihan acak NES yang sama.

(CATATAN: SEMUA strategi non-ekuilibrium dapat dimanfaatkan, tetapi 2 lawan tidak dapat saling mengeksploitasi pada saat yang bersamaan

Contoh

Anda bertaruh $ 50 ke dalam pot $ 100 di sungai dengan udara

Odds

Panci itu meletakkan Anda 2: 1 di tebing Anda

Panci itu meletakkannya 3: 1 pada panggilannya

Nash Equilibrium Strategy

$ 100: $ 50 = 2: 1 = 1/3 = 33% untuk gertakan Anda oleh karena itu NES lawan akan memanggil 67% dari waktu.

$ 150: $ 50 = 3: 1 = 1/4 = 25% untuk panggilannya, oleh karena itu SPN Anda akan menggertak 25% dari waktu

Analisis

Jika lawan menelepon kurang dari 67% dari waktu (NES-nya), Anda dapat mengeksploitasinya dengan menggertak lebih dari 25% (SPN Anda) – jika ia menelepon lebih dari 67%, Anda dapat mengeksploitasinya dengan menggertak lebih sedikit.

Jika Anda menggertak kurang ketika ia menelepon lebih sedikit, atau menggertak lagi ketika dia menelepon lagi, DIA akan mengeksploitasi ANDA – bahkan jika dia tidak mengeksploitasi Anda secara OPTIMAL.

Ringkasan

Anda dapat menggunakan pot: rasio taruhan untuk membentuk SEN dan menentukan, berdasarkan permainan lawan, apakah akan meningkatkan level gertakan atau menurunkannya.

Anda juga bisa melakukan kebalikannya – tentukan dari permainannya, berapa ukuran taruhan terbaik untuk mengeksploitasi lawan Anda.
Menyelesaikan masalah

Jalan menuju keuntungan jangka panjang yang konsisten dibangun berdasarkan keputusan poker yang baik.

Ada 2 bagian untuk setiap keputusan:

1. Menilai kemungkinan berbagai tindakan oleh lawan Anda dalam situasi saat ini. Ini adalah proses INDUKTIF berdasarkan pengalaman, disiplin dan pengambilan keputusan yang rasional.

2. Pilih strategi dengan EV tertinggi berdasarkan asumsi tersebut. Ini adalah proses DEDUKTIF, karena untuk setiap rangkaian asumsi Anda dapat membuktikan secara matematis apa strategi terbaik dan dengan keterampilan Anda dapat melakukan langkah ini dengan sempurna sebagian besar waktu.

Kami tahu, karena semua pemain tidak mengikuti strategi counter optimal, Anda perlu memainkan strategi eksploitatif dengan harapan optimal.

Leave a Reply