ИИ DeepMind стал сверхчеловеческим шахматистом за несколько часов, просто для удовольствия

06.12.2017 17:38 21

ИИ DeepMind стал сверхчеловеческим шахматистом за несколько часов, просто для удовольствия

В документе DeepMind описывает, как потомок программы ИИ, впервые выигравший настольную игру Go, научил себя играть в ряд других игр на сверхчеловеческом уровне. После восьми часов самостоятельной игры программа превзошла ИИ, который сначала победил чемпиона мира по Go; и после четырех часов обучения она обыграла действующую программу чемпиона мира по шахматам, Stockfish. Затем для победы она тренировалась всего два часа и выиграла у одной из лучших в мире программе для сёги по имени Элмо (shogi - японская версия шахмат, играемая на более крупной доске).

Одним из ключевых достижений здесь является то, что новая программа ИИ, названная AlphaZero, не была специально разработана для игры. В каждом случае ей давались некоторые основные правила (например, как рыцари двигаются в шахматах и т. Д.), но не были запрограммированы стратегии или тактики. Она просто улучшалась, играя снова и снова по ускоренным темпам - метод обучения ИИ, известный как «обучение усилению».

Инженеры DeepMind использовали тот же метод для создания AlphaGo Zero; программа ИИ, которая была обнародована в октябре этого года. Но, как описывает документ на этой неделе, новая AlphaZero является «более общей версией» одного и того же программного обеспечения, что означает, что она может применяться к более широкому кругу задач без предварительной загрузки.

Что примечательно, так это то, что менее чем за 24 часа одна и та же компьютерная программа смогла научить себя, как играть в три сложные настольные игры на сверхчеловеческих уровнях. Это новый подвиг для мира ИИ.

Это подводит DeepMind к созданию общей машины мышления, о которой мечтает компания, но впереди стоят серьезные проблемы. Когда в начале этого года генеральный директор DeepMind Демис Хасабис продемонстрировал AlphaGo Zero, он предположил, что будущая версия программы может помочь в решении ряда научных проблем - от разработки новых лекарств до открытия новых материалов. Но эти проблемы качественно отличаются от игры в настольные игры, и нужно проделать целую работу, чтобы выяснить, как именно алгоритмы могут их решать.