동크벳의 편견과 GTO: Pluribus 논문 리뷰
"동크벳 치는 사람은 레크다"라는 명제는 오랜 기간 포커 커뮤니티의 진리처럼 여겨졌습니다. 하지만 수학적으로, 그리고 장기적인 EV 관점에서 이 구시대적 편견은 완전히 박살났습니다.
우선 배경부터 확인하고 넘어가겠습니다.
2017년 Libratus가 헤즈업에서 인간 프로들을 상대로 147 mbb/hand라는 경이로운 승률을 기록하며 GTO의 위력을 증명했습니다. 하지만 멀티웨이는 완전히 다른 차원의 게임입니다.
이후 2019년 등장한 Pluribus는 6max 멀티웨이 환경에서 인간 프로 13명을 압도하며 Science지 표지를 장식했습니다. 놀라운 점은 이 AI의 블루프린트 학습 비용이 고작 $150 수준이었다는 것입니다.
그렇다면 이 $150짜리 블루프린트 전략에서 발견된 가장 충격적인 요소는 무엇이었을까요?
바로 특정 텍스처에서의 전략적 동크벳이 명백한 +EV라는 사실이었습니다.
<라인: BTN vs BB Srp>
<보드: 876r 혹은 654s>
위와 같은 미들 커넥트 보드에서 Pluribus는 BB 포지션임에도 높은 빈도로 동크벳을 구사했습니다.
이유는 명확합니다. BTN의 프리플랍 오픈 레인지보다 BB의 방어 레인지에 87s, 76s, 65s, 투페어 콤보 등 넛어드밴티지와 레인지어드밴티지를 구성하는 핸드가 훨씬 밀집되어 있기 때문입니다.
예상 반박: "실전에서 동크벳 레인지를 밸런싱하는 건 인간에게 불가능에 가깝고, 오프라인에서 치는 사람 대부분은 피쉬 아닌가요?"
솔직히 인간 수준에서 완벽한 폴라라이즈드 동크 레인지를 구축하는 것은 어렵습니다. 그러나 GTO 관점에서 보면, BB가 레인지어드밴티지를 강하게 갖는 스팟에서 무조건적인 x/c, x/r 라인만 고집하는 것은 스스로 캡된 레인지를 만들고 EV를 깎아먹는 행위입니다. 텍스처에 따라 BB 동크가 정당화되는 스팟은 분명히 존재합니다.
3줄 요약:
1. "동크 = 잘 모르는 사람"은 구시대 편견.
2. Pluribus는 6max 환경에서 동크벳의 수학적 당위성을 증명함.
3. 876r 같은 보드에서 BB의 레인지어드밴티지를 활용한 동크벳은 장기적으로 +EV.
실전에서 동크벳 레인지를 어떻게 섞어 쓰시는지, 혹은 여전히 밸런싱이 어려워 아예 배제하시는지 다른 분들의 의견이 궁금합니다.