В 2017 году шахматный мир был потрясён до глубины души, когда Stockfish (сильнейшая шахматная машина в мире) потерпела поражение в личном матче. Его победил не человек, а неизвестная компьютерная программа, которая казалась потусторонней - AlphaZero.
Давайте узнаем больше об этом движке. Вот что вам нужно знать о AlphaZero:
AlphaZero был разработан исследовательской компанией DeepMind, которая была приобретена Google. Это компьютерная программа, которая достигла практически немыслимого уровня игры, используя только обучение с подкреплением и самостоятельную игру для обучения своих нейронных сетей. Другими словами, ему были даны только правила игры, а затем он играл против самого себя много миллионов раз (44 миллиона игр за первые девять часов, согласно DeepMind).
AlphaZero использует свои нейронные сети для мега-продвинутой оценки позиций, что исключает необходимость просматривать более 70 миллионов позиций в секунду (как это делает Stockfish). По данным DeepMind, AlphaZero достигла показателей, необходимых для победы над Stockfish, всего за четыре часа.
Логотип DeepMind.
AlphaZero работает на специализированном оборудовании, которое некоторые называют «суперкомпьютером Google» - хотя DeepMind с тех пор пояснил, что AlphaZero в своих матчах работает на четырёх модулях тензорной обработки (TPU).
В декабре 2017 года DeepMind опубликовала исследовательскую работу, в которой сообщалось, что AlphaZero легко победила Stockfish в матче из 100 игр. AlphaZero побеждает Stockfish во втором матче, состоящий из 1000 игр; результаты были опубликованы в статье в конце 2018 года.
Матчи AlphaZero-Stockfish изменили шахматный мир.
Результаты матчей против Stockfish и невероятные партии AlphaZero привели к созданию нескольких шахматных проектов на нейронных сетях с открытым исходным кодом. Leela Chess Zero, Leelenstein, Alliestein и другие пытаются подражать стилю обучения и игре AlphaZero. Даже Stockfish, король прямого перебора добавил себе нейронные сети.
В 2020 году DeepMind и AlphaZero продолжили вносить свой вклад в шахматный мир в виде обновления шахматных правил. Когда говорят DeepMind и команда AlphaZero, шахматный мир слушает!
С момента своего появления на сцене AlphaZero изменил шахматы, породив новое поколение шахматных движков на нейронных сетях, создал трансцендентные игры и внёс свой вклад в изобретение новых шахмат.
Как уже упоминалось, AlphaZero победила сильнейший шахматный движок в мире Stockfish в личном матче из 100 партий в декабре 2017 года (28 побед, 72 ничьи и ноль поражений). Публике было представлено 10 партий из этого матча, и реакция шахматного мира была на грани недоверия. Гроссмейстер Питер Хайне Нильсен сравнил просмотр партий AlphaZero с наблюдением за высшими существами, приземляющимися на землю и показывающими нам, как играть в шахматы.
Мнение Нильсена разделили и другие гроссмейстеры, в том числе легендарный гроссмейстер Гарри Каспаров, который сказал: «Это замечательное достижение .... которое приближается к «Типу B», человеческому подходу в машинных шахматах, о котором мечтали Клод Шеннон и Алан Тьюринг, вместо прямого перебора».
Другие ставили под сомнение результаты из-за несоответствия оборудования, использованного в первом матче. Некоторые также сочли несправедливым то, что Stockfish не разрешили использовать его дебютную книгу и базу шахматных окончаний.
ГМ Хикару Накамура заявил: «Я не доверяю этим результатам, т.к. AlphaZero использовал суперкомпьютер Google, а Stockfish в основном работал на компьютере, похожим по характеристикам на мой ноутбук.»
Накамура сомневался в первом матче AlphaZero-Stockfish.
Примерно через год после первого матча DeepMind опубликовал новую статью, в которой было объявлено, что обновлённая версия AlphaZero победила Stockfish в матче из 1000 игр. На этот раз использовалась текущая версия Stockfish (версия 9 в то время), Stockfish мог пользоваться сильной дебютной книгой, был изменён контроль времени (при этом Stockfish имел большое преимущество по времени), а также Stockfish работал на том же оборудовании, что и в Top Chess Engine Championships (TCEC).
Результаты не сильно изменились - AlphaZero снова победила Stockfish со счётом 155 побед, 839 ничьих и 6 поражений.
В 2019 и 2020 годах гроссмейстер Владимир Крамник смог провести некоторое время с AlphaZero и командой DeepMind, чтобы изучить варианты шахмат и соавтор статьи с DeepMind об исследовании новых вариантов шахмат., включая боковые пешки, без рокировки, торпедные шахматы (где пешки всегда могут двигаться вперёд на одно или несколько полей).
В первом игровом примере мы видим магию, которой AlphaZero потряс мир в первом матче. AlphaZero отдаёт пешку в дебют и сразу же переходит в атаку. После 19...Kxh6 у Stockfish лишняя фигура, но король не в безопасности, а весь ферзевый фланг неразвит:
Stockfish в позиции, но король не в безопасности, а ферзевый фланг не развит.
AlphaZero поддерживает давление, но его компенсация за фигуру, нам смертным, в основном неясна. Только оглядываясь назад, мы можем сказать, что пара чёрных фигур (в первую очередь ладья а8 и ферзевый конь) никогда не будут частью игры. После 36.Qe6 позиция определилась, и AlphaZero убедительно выигрывает:
Этот пример взят из второго матча AlphaZero-Stockfish. AlphaZero использует позиционную технику и мучает Stockfish парой слонов в эндшпиле после 45. Bxe4. Вот полная игра:
К сожалению, AlphaZero недоступен для широкой публики ни в какой форме.
Теперь вы знаете, что такое AlphaZero, чего он добился и многое другое! Думаю в будущем данный проект так и останется исследовательским и скорей всего его наработки будут использованы в других сферах, возможно космос, медецина или робототехника.
Примечание: Если вы стремитесь к резкому увеличению шахматного уровня, то необходимо систематически работать над всеми элементами игры:
На первый взгляд кажется, что предстоит много работы. Но благодаря нашему учебному курсу Ваше обучение пройдёт легко, эффективно и с минимальными затратами времени. Присоединяйтесь к программе обучения «Шахматы. Перезагрузка за 21 День», прямо сейчас!