Šī Datorprogramma Var Pārspēt Ikvienu Pokera Spēlētāju

{h1}

Jauna datorprogramma var pārspēt cilvēkus divu spēlētāju pokera spēlē.

Datori ir izdomājuši, kā uzvarēt šahā, dambretē un tic-tac-toe, un tagad datorprogramma ir iekarojusi pokera spēli.

Pētniecības grupa, kuru vadīja Maikls Boulings, datorzinātņu profesors Alberta Universitātē Kanādā, izstrādāja datorprogrammu, kas var pārspēt cilvēkus divu spēlētāju pokera spēlē - īpaši heads-up limit hold 'em. Rezultātiem varētu būt tālejoša ietekme uz citām situācijām, kurām nepieciešama sarežģīta lēmumu pieņemšana, piemēram, ārpolitikā vai ārstēšanā.

Atšķirībā no šaha vai dambrete pokerā viens spēlētājs ne vienmēr zina citu spēlētāju pagātnes gājienus. Plus, spēlētājs var laimēt kombināciju, kad citi spēlētāji nomet. Tāpēc matemātiskā ziņā spēlei ir nepilnīga informācija. [10 populārākie datori]

"Šaham ir ideāls spēles risinājums - atbilde par noteikto pozīciju ir - uzvara melnajiem, uzvara baltajam vai izloze," sacīja Boulings. "Pokers ir ticamāks." Citiem vārdiem sakot, nav absolūti perfektas rokas vai stratēģijas.

Kā tas strādā

Hold 'em pokera versijā, kuru spēlēja dators, likmes starp diviem spēlētājiem tiek fiksētas un palielinājumu skaits ir ierobežots. Tirgotājs katram spēlētājam piešķir divas kārtis, ko sauc par “kārtīm”. Seko derību kārta, kas pazīstama kā “pre-flop”. Pēc tam uz galda tiek izliktas vēl trīs kārtis, ko sauc par "kritienu". Flops ir kopīgu kārtis, kas tiek izdalītas uz augšu, tāpēc abi spēlētāji zina, kas viņi ir. Seko vēl viena derību kārta, un pēc tam uz galda tiek uzlikta ceturtā kārts, ko sauc par "pagriezienu". Pēc trešās derību kārtas tiek izdalīta pēdējā kopīgā kārts (to sauc par "upi"), un tajā brīdī spēlētājiem ir jāuzrāda savas kārtis, pieņemot, ka viens spēlētājs vēl nav izlocījis.

Dators neaprēķina visas iespējamās rokas, jo tās spēlē. Tā vietā tā izveido rezultātu tabulu pirms spēles sākuma. Izmantojot divus tūkstošus centrālo procesoru divus mēnešus - tas ir aptuveni 1000 gadu skaitļošanas laiks -, tas simulē miljardiem pokera roku. Rezultātu tabula vien aizņēma apmēram 15 terabaitus datora krātuves, sacīja Boulings. Salīdzinājumam - tipisks darbvirsmas rezerves disks ir viens terabaits. [10 tehnoloģijas, kas pārveidos jūsu dzīvi]

Algoritms iziet cauri visām iespējamām rokām, kas varētu būt pretiniekam, un pēc tam apkopo katras taktikas rezultātus - piemēram, paaugstinot, salokot vai izsaucot likmi (t.i., pieskaņojot pretinieku). Lai iegūtu priekšstatu par to, cik liels ir uzdevums, ir 13,8 triljoni dažādu situāciju, kas var parādīties spēlē. Lai tur nokļūtu, ikvienam cilvēkam uz Zemes ir jāspēlē gandrīz 4000 pokera roku.

Tas atšķiras no šaha, kurā dators var veikt brutālu spēku, lai aprēķinātu kustības, spēlei progresējot, lai iegūtu rezultātu, kas ir pietiekami labs, lai uzvarētu. (Pretēji daudzu cilvēku uzskatiem, tikai dažas datorprogrammas faktiski iziet katru permutāciju, tikai tās, kas dod vislabākos rezultātus). Tā vietā iedomājieties, ja šaha spēlējošajiem datoriem būtu jāmeklē miljardu iepriekšējo spēļu rezultāti ar noteiktu tāfeles konfigurāciju uz tāfeles.

Spēlējot miljardiem roku, programma nāk klajā ar optimālu stratēģiju - tas ir, tas saplūst ar to, kas ir labākais dotās rokas gājiens. "Veids, kā tas darbojas... tas jau ir spēlējis miljardu miljardu pokera roku," sacīja Boulings.

Spēles apgūšana

Tā kā pokers nav atrisināms tā, kā ir šahs vai dambrete, Boulings un viņa komanda nāca klajā ar atšķirīgām prasībām, lai spēli sauktu par “atrisinātu”. Zinātniskā ziņā spēle ir "būtībā atrisināta", kas nozīmē, ka ir veids, kā izmantot datora izmantoto stratēģiju. Pētnieki pieņēma, ka kāds cilvēks datoru spēlēja 70 gadus, 365 dienas gadā, 24 stundas dienā. Viņu uzrakstītā programma spēlēja tik labi, ka, ja lielais neredzīgais - fiksētā likme - ir USD 1,000, visizdevīgākais spēlētājs var laimēt apmēram 1 USD uz vienu roku vai 1/1000 no lielā blind.

Citi eksperti ir strādājuši pie pokera spēlēšanas datoriem, kurus izmanto kazino, un vismaz viens uzņēmums apgalvo, ka ir izveidojis mašīnmācīšanās algoritmu, kas pielāgo stratēģiju atbilstoši cilvēka spēlētājam. Bet neviens nav pierādījis, ka tā izmantojamība - perfekta cilvēka spēlētāja spēja pārspēt mašīnu - ir tik maza kā Boulinga komandas izstrādātā programma. Tāpat spēle nav atrisināta tikpat matemātiski precīzi.

Bet algoritmam ir ierobežojumi. Vienam tas darbojas tikai ar divu roku spēlēm. Trīs spēlētāju spēlē ir iespējams, ka vienam spēlētājam var būt drausmīga stratēģija (piemēram, varbūt spēlētājam ir tendence visu laiku paaugstināt) un viņš zaudē mazāk nekā otrs spēlētājs, kuram ir labāka stratēģija, kā rezultātā uzvarā trešajam spēlētājam.

Vēl viena problēma ir izdomāt, kā godīgi pārbaudīt trīs spēlētāju spēles. Vienā eksperimentā varēja būt, ka divi cilvēki spēlē mašīnu, bet Boulings sacīja, ka cilvēku spēlētāji, iespējams, netīšām rīkojas slepeni pret mašīnu. Līdzīgas problēmas varētu rasties eksperimentos ar diviem mašīnu spēlētājiem un vienu cilvēku: Pat ja abas programmas neslēptos, tas varētu izskatīties šādi. "Mēs nezinām, kā to godīgi vadīt," viņš teica.

Boulings sacīja, ka šai tehnoloģijai var būt dažādi pielietojumi, sākot no valsts drošības, līdz izceļošanas maksas izsekošanai tranzīta sistēmās un lēmumu pieņemšanai par ārstēšanu. Piemēram, programma varētu palīdzēt ārstam, kuram jāpieņem lēmums par ārstēšanu, bet kurš nav pārliecināts par iespējamiem rezultātiem. Pokera programmā izmantotās metodes varētu palīdzēt ārstiem noteikt ārstēšanas iespējas ar optimālu rezultātu vai tādu, kurai ir vislabākā veiksmes iespējamība.

Pētījums tika aprakstīts tiešsaistē šodien (8. janvārī) žurnālā Science.

Sekojiet WordsSideKick.com @wordssidekick, Facebook. Oriģināls raksts par Dzīvā zinātne.


Video Papildinājums: .




LV.WordsSideKick.com
Visas Tiesības Aizsargātas!
Pavairošana Materiālu Atļauts Tikai Prostanovkoy Aktīvu Saiti Uz Vietni LV.WordsSideKick.com

© 2005–2020 LV.WordsSideKick.com