LINUX.ORG.RU

История изменений

Исправление olegsov, (текущая версия) :

ну игра такая что кол-во вариаций гигантское, поэтому ветвиться далеко нельзя. вся игра построена на паттернах т.е. как уже кто-то когда-то играл. просто программа не знала о такой вариации которую сыграл седол и думала что это не страшно. Потому что училась она не на профессиональных партиях, а на любительских доступных нахаляву в интернете - видимо гугл решил не париться с покупкой профессиональных баз ибо надеялись что обучение на игре с собой всё равно сыграет бОльшую роль. тут видимо какой-то глюк, в результате которого вариации такого варианта не рассматривались слишком глубоко, поэтому об ошибке игра догадалась слишком поздно, когда уже нельзя было ничего изменить.

после этого выиграть с ее точки зрения было невозможно, поэтому играла как попало. Все ходы ведут к поражению, а значит одинаково «хороши» с ее точки зрения - минимизировать очки проигрыша ее просто не научили. логично было бы сдаться, но критерий сдачи слишком занижен.

вообще эта игра была именно тем что пытались получить организаторы матча. у них был профессионал довольно низкого уровня, который не мог ввиду своего низкого ранга как-то напрячь движок. потому и договорились (не просто так конечно) о матче с топовым игроком - чтобы потестить на пределе возможностей. видимо так вышло, что просто нельзя найти эти глюки, не играя лучше чем сама программа...

вообще думаю, что само устройство алгоритма таково что прыгнуть выше профессионалов-людей почти невозможно. дело в том что на топовом уровне игры выигрываются инновационными ходами, которые никто никогда не использовал - тогда оппонент не может полностью просчитать все вариации и не знает как там играть, поэтому делает ошибки. программа должна сама придумывать такие ходы но т.к. она обучается на существующих партиях, нестандартные ходы просто не рассматриваются как валидные. а чтобы выиграть, нужны нестандартные ходы.

конечно, какие-то нестандартные приемы всё же имеются - из самообучения, но вот видеть и анализировать нестандартные ходы оппонента ее видимо не научили. дело в том что при анализе вариаций алгоритм использует тот же принцип, по кторому отбираются «осмысленные» ходы - ходы которые когда-то играли в партиях на которых сеть обучалась (или полученные из самообучения), то есть все нестандартные ходы нейронная сеть вообще не видит - ни как вариант для себя, ни когда их ходит оппонент, то есть даже в вариациях они, видимо, отсекаются. хотя это лишь предположение на основе того что рассказывали об алгоритме публично.

Исправление olegsov, :

ну игра такая что кол-во вариаций гигантское, поэтому ветвиться далеко нельзя. вся игра построена на паттернах т.е. как уже кто-то когда-то играл. просто программа не знала о такой вариации которую сыграл седол и думала что это не страшно. Потому что училась она не на профессиональных партиях, а на любительских доступных нахаляву в интернете - видимо гугл решил не париться с покупкой профессиональных баз ибо надеялись что обучение на игре с собой всё равно сыграет бОльшую роль. тут видимо какой-то глюк, в результате которого вариации такого варианта не рассматривались слишком глубоко, поэтому об ошибке игра догадалась слишком поздно, когда уже нельзя было ничего изменить.

после этого выиграть с ее точки зрения было невозможно, поэтому играла как попало. Все ходы ведут к поражению, а значит одинаково «хороши» с ее точки зрения - минимизировать очки проигрыша ее просто не научили. логично было бы сдаться, но критерий сдачи слишком занижен.

вообще эта игра была именно тем что пытались получить организаторы матча. у них был профессионал довольно низкого уровня, который не мог ввиду своего низкого ранга как-то напрячь движок. потому и договорились (не просто так конечно) о матче с топовым игроком - чтобы потестить на пределе возможностей. видимо так вышло, что просто нельзя найти эти глюки, не играя лучше чем сама программа...

вообще думаю, что само устройство алгоритма таково что прыгнуть выше профессионалов-людей почти невозможно. дело в том что на топовом уровне игры выигрываются инновационными ходами, которые никто никогда не использовал - тогда оппонент не может полностью просчитать все вариации и не знает как там игра, поэтому делает ошибки. порграмма должна сама придумывать такие ходы но т.к. она обучается на существующих партиях, нестандартные ходы протс не рассматриваются как валидные. а чтобы выиграть, нуэны нестандартные ходы

конечно, какие-то нестандартные приемы всё же имеются - из самообучения, но вот видеть и анализировать нестандартные ходы оппонента ее видимо не научили. дело в том что при анализе вариаций алгоритм использует тот же принцип по кторому отбираются «осмысленные» ходы - ходы которые когда-то играли в партиях на которых сеть обучалась, то есть все нестандартные ходы нейронная сеть вообще не видит - ни как вариант для себя, ни когда их ходит оппонент, то есть даже в вариациях они, видимо, отсекаются. хотя это лишь предположение на основе того что рассказывали об алгоритме публично.

Исходная версия olegsov, :

ну игра такая что кол-во вариаций гинантское, поэтому ветвиться далеко нельзя. вся игра построена на паттернах т.е. как уже кто-то когда-то играл. просто программа не знала о такой вариации которую сыграл седол и думала что это не страшно. Училась она не на профессиональных партиях, а на любительских доступных нахаляву в интернете - видимо гугл решил не париться с покупкой профессиональных баз ибо надеялись что обучение на игре с собой всё равно сыграет бОльшую роль. тут видимо какой-то глюк, в результате которого вариации такого варианта не рассматривались слишком глубоко, поэтому об ошибке игра догадалась слишком поздно, когда уже нельзя было ничего изменить.

после этого выиграть с ее точки зрения было невозможно, поэтому играла как попало. Все ходы ведут к поражению, а значит одинаково «хороши» с ее точки зрения - минимизировать очки проигрыша ее просто не научили. логично было бы сдаться, но критерий сдачи слишком занижен.

вообще эта игра была именно тем что пытались получить организаторы матча. у них был профессионал довольно низкого уровня, который не мог ввиду своего низкого ранга как-то напрячь движок. потому и договорились (не просто так конечно) о матче с топовым игроком - чтобы потестить на пределе возможностей. видимо так вышло, что просто нельзя найти эти глюки, не играя лучше чем сама программа...