Революция в шахматном мире: AlphaZero от Google обыграл StockFish

IT-новости

08.12.17

✎

12:28

http://www.newsru.com/sport/08dec2017/deep.html
AlphaZero обыграла Stackfish
Программа которую делали люди и рассчитывающую 70 000 000 позиций в секунду проиграла матч из 100 партий самообучающемуся искусственному интеллекту который оценивал всего 80 000 позиций в секунду. В сухую!
На обучение игре в шахматы AlphaZero потратило 4 часа.
Тут предварительный доклад программистов https://arxiv.org/pdf/1712.01815.pdf

Я в шоке.

1 Волшебник

модератор

08.12.17

✎

12:29

Где скачать движок AlphaZero? Я бы прикрутил к Fritz/Arena и провёл матч. Иначе всё это фуфло.

2 Волшебник

модератор

08.12.17

✎

12:31

(0) Только не Stackfish, а Stockfish (вяленая рыба)

3 Lama12

08.12.17

✎

12:33

(1) Да ладно этот AlphaZero. Googl занимается пиаром своего детища. Китайский ИИ на 1-2 года опережает Google. В ГО они обыграли того же чемпиона с которым играло Alpha Go, еще за год до этого события. Просто не "светились". Представляю какой ИИ сейчас Китае. Наши лет 5 назад тоже заявляли о подобном ИИ. Уж даже не знаю на какой уровень ИИ можно сейчас рассчитывать... такие темпы развития..

4 Волшебник

модератор

08.12.17

✎

12:33

Stockfish можно бесплатно скачать отсюда
https://stockfishchess.org/

Но надо иметь в виду, что это не шахматная программа, а UCI-совместимый шахматный движок. Т.е. его надо подключать к шахматной программе типа Arena или Fritz.

5 NSSerg

08.12.17

✎

12:43

Стокфиш был без дебютной книги (Альфа была с дебютной), уже этой форы достаточно сильной программе чтоб выиграть с таким счетом. То есть дальше уже обсуждать нечего.

6 Lama12

08.12.17

✎

12:45

(5) Извиняюсь, а где эта информация?

Посмотрел несколько партий. Альфа как-то особенным образом использует ладей. Хотя это явно не мой уровень игры :-)

7 NSSerg

08.12.17

✎

12:46

И второе передергивание - Альфа играла на намного более сильной машине, и количество позиций в секунду - это очень условное число. Сделал более мощную ОФ - вот у тебя количество позиций в секунду и уменьшилось, но это ни в коем случае не говорит о том что твой движок лучше.
Если ОФ в альфе на нейронных сетях, понятно что у неё намного более мощная и намного более медленная ОФ. Сравнивать надо железо, а не узлы в секунду.
(6) Нет такого понятия в шахматах "особенным образом использовать ладей".

8 NSSerg

08.12.17

✎

12:49

(6) Достаточно партии посмотреть, чтоб увидеть что Сток играл без книги, а книга - это несколько сотен пунктов Эло силы (матч показал перевес Альфы на сотню пунктов эло).
При этом у Стока отобрали несколько сотен на книге, несколько сотен на железе и т.д.
http://kasparovchess.crestbook.com/threads/7644/page-6#post-768342
Вот тут достаточно популярно собрано по пунктам, что в матче было не так.

9 Lama12

08.12.17

✎

12:51

(8) Спасибо! Без книги, согласен... Значит американцы, как обычно врут.

10 NSSerg

08.12.17

✎

12:52

То есть на текущий момент, на равноценном железе - Альфа несравнимо слабее Стока. Если Сток в полноценном варианте и Альфа в полноценном.
И при этом с альфой все - Нейронная сеть обучена до упора, дальнейшее обучение не дает прибавки в силе.

11 K1RSAN

08.12.17

✎

12:53

Как было написано в (5) и (7) - невнятная новость. Больше похоже на попытку раззадорить шахматное сообщество, которые сходу описанные "косяки" увидят. Наберут шумихи, как было с Го, а потом используют в разы более мощную программу.
(6) Эта информация мелькала, просто на ней не заостряли внимание. Просто мощный пиар для "несведущих", типа вот Гугл сходу снес программу, которая в сферическом вакуумном коне считается в разы мощнее, НО ИИ СДЕЛАЛ КАК РЕБЕНКА.
Но умалчивается разность в мощностях. Когда же речь идет о Гугле никогда нельзя сказать, правду ли они говорят про использованную мощность. С их облачными технологиями они при желании могут собрать машинку в 100 раз сильнее, чем у противника.

12 K1RSAN

08.12.17

✎

12:55

(10) В Го так же говорили. А потом люди посчитали, что ИИ, сыгравший с Фаном слабее на 3-4 камня той, что сыграла с ЛСД, а Ке Дзе играл с еще более сильной программой. Пиар и раззадоривание публики детектед

13 NSSerg

08.12.17

✎

12:58

(12) Когда была слабее - Го-разработчики и писали что слабее. Что в этом странного?

14 K1RSAN

08.12.17

✎

13:02

(13) Ситуация была похожая. Альфа победила Фана, который далеко не топовый профи, на что сообщество начало бурлить, но держалось за топовых игроков. Потом ЛСД проиграл 1-4, что привело к бурным обсуждениям и громким статьям. А потом Ке Дзе сыграл с версией, которая делает предыдущую версию со счетом около 1-9.
При этом многие не верили, что с выбранной архитектурой ИИ возможна дальнейшая прибавка в силе.

15 Базис

naïve

08.12.17

✎

13:20

(10) "Нейронная сеть обучена до упора" - эта реализация ограничена, или вообще у НС есть объективный предел?

16 Lama12

08.12.17

✎

13:34

(15) Есть предел. Ну в классический нейросетях :-)
Обычно обучение нейросети сводится к минимизации среднеквадратичного отклонения полученного результата от целевого.

17 K1RSAN

08.12.17

✎

13:43

(16) Таким образом предел определяет только человек, если на протяжении определенного времени отклонение остается на одном уровне, при этом находится ниже контрольного значения, обычно останавливают. Либо же изменяют "теорему"

18 shpioleg

08.12.17

✎

14:22

Свидлер с Шиповым обсуждают сие событие
https://www.youtube.com/watch?v=SLgAg0wL9_A&t=10s

Пример одной партии.
https://www.youtube.com/watch?v=nIy8E8yndcA

19 NSSerg

08.12.17

✎

14:28

(15) У любой оценочной функции с фиксированным количеством параметров есть объективный предел.
Ровно так-же как и в стокфише - ограниченный набор параметров в ОФ, и соответственно их тонкой настройкой можно усиливать только до определенного предела, который тоже достигнут.
Дальше расти - переборные алгоритмы, изменение состава параметров в ОФ и т.д., но не настройкой.

20 shpioleg

09.12.17

✎

09:23

Разбор новых партий от гроссмейстера Шипова.
Перворазрядникам+ будет интересно.
AlphaZero - новый бог шахмат! ? Сергей Шипов ??
https://www.youtube.com/watch?v=ba4_M7UINfo

21 Lama12

09.12.17

✎

10:26

(20) Почитав больше про эту программу, предполагаю, что она достигла своего максимума и он слабее современных программ.

22 Gobseck

09.12.17

✎

11:31

(18) партия впечатляет

23 shpioleg

09.12.17

✎

12:12

(21) Я думаю, что стоит довериться гроссмейстерам которые с движками постоянно работают. И раз говорят, что Альфа Зеро демонстрирует "космический" уровень игры и ,самое главное, понимание игры. Поначалу, вообще же сомневались, что программа может так научиться играть и думали, что это фейк.

24 NSSerg

09.12.17

✎

12:15

(21) Дело не в том, сильнее она или слабее, а дело в том что это первая в истории сильная программа с ОФ на нейронных сетях. И если я не ошибаюсь, переборные алгоритмы - mcts. Я знаю попытки сделать шахматные программы на Монте-Карло, но сильную программу никому не удавалось написать.
И так-же как в ГО - с появлением нейронных сетей и Монте-Карло получили быстрый рост силы программ, возможно так-же произойдет и в шахматах.

25 NSSerg

09.12.17

✎

12:16

(23) Потому что железо было в 100 быстрее чем у Стокфиша?
Стокфиш на подобном железе еще более фантастическую игру бы продемонстрировал.

26 Gobseck

09.12.17

✎

12:19

(22)По поводу той же партии Шипов говорит, что в этой партии в наиболее важный момент стокфиш сыграл странно (не дали подумать?). В любом случае альфа-зеро показывает блестящую позиционную игру.

27 NSSerg

09.12.17

✎

12:41

(23) Ну да, позиционный шедевр, поддерживаю мнение Шипова. И другие программы выдают позиционные шедевры, особенно на мощной технике - и чего такого?

Уровень не космический. Да, играет сильно, но на хорошем железе все сильные движки сильно играют.

28 Lama12

09.12.17

✎

12:51

(26) Вот именно! По сути, у альфы время заложено в его опыт. Рыбке время ограничили на ход. Если б была схема время на игру, предполагаю что рыбка играла бы по другому. И не факт что проиграла бы.

29 NSSerg

09.12.17

✎

12:56

(26) Как и все остальные движки, Стокфиш сам распределяет время, а не оператор. Единственное что отобрали у Стокфиша - это дебютную книгу. Ну и железо у Альфы было несравнимо мощнее.

30 NSSerg

09.12.17

✎

12:59

О как, а похоже что у Стокфиша действительно было ограничение времени на ход. Это уже просто хамство со стороны разработчиков Альфы.

31 APXi

09.12.17

✎

13:44

Если ИИ сейчас так резво учиться, каждый месяц какие либо новости о нем. Что будет через 10 лет, а потом через 50. Если он станет умнее людей как человек умнее хомячка, то зачем люди будут нужны ИИ?

32 Lama12

09.12.17

✎

14:10

(29) временная схема было 1 минута на ход, а не время на партию. Если б было время на партию стокфиш сам распределил бы его.

33 Карст

09.12.17

✎

17:59

де там Коля _))

34 wt

09.12.17

✎

18:14

+(31) это и поражает! Как на многие исследования люди тратят годы. Здесь же раз и готово! А представьте этот ИИ запустят в исследования в химию, генетику. Новые материалы, новые лекарства, считай уже найдены!

35 NSSerg

09.12.17

✎

19:11

(34) Всё не так.
Берем Стокфиш, сбрасываем все параметры в ОФ, начинаем "обучать" - настраивать параметры в ОФ с нуля.
Чтоб достаточно сильно настроить методами математической оптимизации - достаточно нескольких часов. Настраивается на результатах матчей с ультракоротким контролем.

Есть пример удачной попытки настроить методом Нелдера-Мида. Хотя настраивают параметры ОФ в Стокфиш другими методами.

В Альфе примерно тоже самое, но настраивали Нейронную сеть.

Такого что на что-то требовались годы, а сейчас потребовалось четыре часа - такого нет. Четыре часа не на полное написание программы, а на настройку ОФ ушло.

36 Волшебник

модератор

09.12.17

✎

20:19

(35) Правильно ли я понимаю, что за 4 часа на суперкомпьютере было сыграно туева хуча партий с ультракоротким контролем типа 0.01 сек на ход?

37 art commander

09.12.17

✎

20:47

(31) Не станет. Это - современное суеверие, что вот-вот появятся созданные нами ДРУГИЕ.

38 NSSerg

09.12.17

✎

20:54

(36) типа того. Но смысл в том - что имея такие-же вычислительные мощности - умеют в такое-же время настраивать и обычную ОФ, не на нейросетях.

То есть в этом ничего нового не случилось. А случилось то, что программа с ОФ на нейросетях в принципе смогла сыграть в хорошую силу. А это уже огромный прорыв.

39 Волшебник

модератор

09.12.17

✎

21:08

(38) Я сразу понял, что нейросети — тупиковая ветвь развития. Наш уровень понимания работы нейронов не соответствует простой модели нейрона в компьютерной нейросети. Биологический нейрон сохраняет информацию в собственную ДНК, тем и живёт. В компьютерной нейросети никакой ДНК не предусмотрено.

40 NSSerg

09.12.17

✎

22:38

У Стокфиша еще и эндшпильные базы были отключены.

41 Гость из Мариуполя

гуру

10.12.17

✎

12:27

(40) да понятно, что это фигня.
Я, даже ничего не зная об отключенных дебютных и эндшпильных базах, о гигантской разнице в железе, сделал вывод сразу из первой фразы:
<<Программа которую делали люди и рассчитывающую 70 000 000 позиций в секунду проиграла матч из 100 партий самообучающемуся искусственному интеллекту который оценивал всего 80 000 позиций в секунду. В сухую! >>

"На ошибках учатся", как говорится.
Ясен же пень, что любой самообучающийся субъект сперва должен делать ошибки и самообучаться, и только потом начинать блистать.
А тут. С нуля и сразу всухую? Необученная? ну-ну..

Если бы сказали, что, обучаясь, она сначала проиграла 1000 партий и только лишь затем выиграла 100, я бы еще как-то заинтересовался такой новостью, и стал бы читать дальше.

А так? Да любому хоть чуть-чуть логически мыслящему сразу из заголовка видно, что хрень полнейшая.

42 Gobseck

11.12.17

✎

03:52

"Да, главный эмоциональный аргумент в пользу мощи Alpha Zero – запредельные шахматы, продемонстрированные этой программой. Дайте Stockfish в сто раз больше времени на обдумывание, она всё равно не начнёт играть так. (Некоторые позиции из матча уже протестировали, и Stockfish не смогла найти выигрывающие ходы от Alpha Zero.) И я – любитель, кандидат в мастера, и гроссмейстеры, которых я опрашивал во время чемпионата России по шахматам в Петербурге, восприняли опубликованные партии примерно одинаково: игра огромной силы, бесспорно компьютерная по чистоте, но при этом на удивление «человеческая» по общей манере. Особенно впечатляют жертвы, выглядящие интуитивными – материал нередко отдаётся надолго и за довольно трудно формализуемые блага вроде пресловутой инициативы или позиционного зажима."
http://site.gipsyteam.ru/news/5773-neyroset-plenyaet-shahmatistov

43 Gobseck

11.12.17

✎

03:56

Похоже на то, что АльфаЗеро играет подобно человеку. О создании такой программы давно мечтали. Еще один шаг на пути к созданию полноценного искусственного интеллекта.

Будут ли разработчики дальше работать в шахматном направлении? ИМХО, более актуально развивать медицинские технологии.

44 K1RSAN

11.12.17

✎

06:36

(42) "некоторые позиции" - если бы была дебютная книга - эти позиции бы даже не возникли. Это как говорить "он не справился с этой ситуацией", когда сами создали эту ситуацию с шансом справиться в 1%. Есть многие ситуации, в которых далеко не каждый гроссмейстер найдет выход, только на интуиции, но каждый гроссмейстер может сыграть так, чтобы эта ситуация не случилась.

45 Зуекщмшср

11.12.17

✎

06:58

На ютубе есть видео гроссмейстера Шипова, где он подробно разбирает партии А0. Складывается впечатление, что А0, безусловно, следующая ступень развития, причем недосягаемая для человека. Потому что она выбирает ходы "как человек" и идет на позиции, где за материал приобретает инициативу (чего доселе редко встречалось у компьютерного мозга), но есть нюанс - чтобы эта инициатива принесла плоды, необходимо играть по-компьютерному точно, реализовывая инициативу по крупицам чуть ли не единственными точными сериями ходов. Человек так не сможет априори.
Еще складывается впечатление, что будущее уже скоро, и рано или поздно ИИ действительно придет к выводу, что основная болезнь планеты - безумное человечество. Да здравствует скайнет, матрица, и иже с ними!

46 Lama12

11.12.17

✎

07:05

(44) +1. Пусть эта альфа участвует на равных в турнире шахматных программ. На том же железе. Тогда посмотрим кто сильнее.
(45) Рано. :-)

47 K1RSAN

11.12.17

✎

07:25

(46) Играть на мощности ПК с отключенным интернетом (чтобы "случайно" не подключился к облачным серверам гугла)

48 K1RSAN

11.12.17

✎

07:27

(45) Этот так называемый ИИ работает только в рамках определенных задач. Не думаю, что шахматный ИИ смотрит инфу про текущую ситуацию на планете. Для этого надо подождать, пока люди создадут ИИ, которая должна регулировать мир во всем мире. Но, надеюсь, множество фильмов на генетическом уровне воспитала табу на это дело)

49 NSSerg

11.12.17

✎

12:13

(45) Ровно так-же игра Стока - следующая ступень недосягаемая для человека. И игра Комодо, и игра Гудини. Да и остальных топовых движков.

Там нет ИИ - просто ОФ на нейронной сети. Хотя с какой-то точки зрения все шахматные программы это ИИ. И уже давно подобная ОФ, тоже на нейронных сетях, например у сильнейших программ в нарды.

50 Вафель

11.12.17

✎

12:28

Сравнивать на одинаковом железе не интересно. нужно сравнивать на максимуме что программа может взять.
Но тогда скорее всего будут одни ничьи

51 Gobseck

11.12.17

✎

12:55

(50) Максимум того, что программа может взять, зависит от глубины расчета вариантов, которая зависит от времени на обдумывание хода. Может так получиться, что придется ждать неограниченное количество времени.
Хотя неплохо бы выяснить, так ли это. На мощном железе запустить одну программу против другой и дать по несколько часов времени.

52 Gobseck

11.12.17

✎

12:57

(51)+ и подключить все библиотеки

53 NSSerg

11.12.17

✎

13:02

(50) Если без дебютной но с ЭБ, то предпоследний матч (ровно год назад) на топовом железе - TCEC 9 superfinal, счет в матче сильнейших движков Stockfish 8 - Houdini 5
(+17=75-8) - четверть партий результативные

http://chessprogramming.wikispaces.com/TCEC+Season+9

В этом году в матче Houdini 6.03 - Komodo 1970.00 счет
(+15=76-9)

(51) Не понял что ты имеешь в виду.
Что никому не приходила в голову такая идея?
Или в том что результат этой партии ничего никому не скажет?

54 NSSerg

11.12.17

✎

13:03

+(53) http://chessprogramming.wikispaces.com/TCEC+Season+10

55 Gobseck

11.12.17

✎

13:17

(53) >Не понял что ты имеешь в виду.

Устроить что-то наподобие турнира (54). Но не турнир, а матч альфазеро против стокфиш. Сделать по несколько партий с разными настройками.
Количество времени по 1 часу
по 2 часа
по 4 часа
по 8 часов
С включенными и выключенными дебютными и эндшпильными библиотеками.

56 Gobseck

11.12.17

✎

13:21

(55) + количество времени по 10 минут (блиц)

57 Gobseck

11.12.17

✎

13:29

(55) + тогда мы узнаем, как зависит соотношение сил между традиционным движком и нейросетью от параметров (времени на обдумывание хода) и зависит ли

58 NSSerg

11.12.17

✎

13:43

(57) чтоб посчитать зависимость силы от времени обдумывания (мощности железа) - не нужна Альфа естественно. И для традиционных движков она известна конечно же.
Для альфы она так же естественно неизвестна.
Как правило разница в силе сильнейших движков с увеличением контроля сокращается. Но она и так микроскопически мала, и результаты матчей из 100 партий проводимых tcec - достоверно сильнейшего не вявляют.

И насчет альфы - рано смотреть динамику силы в зависимости от контроля, когда нормального матча не было, и разница в силе неизвестна. И достоверно неизвестно в чью она пользу.

59 ilou

11.12.17

✎

13:47

Вообще не понятно, зачем сравнивать мягкое с пресным, ну т.е. работу обычных программ по стандартным алгоритмам и нейросети, где механизмы работы другие, ну т.е. просто это сравнивать не получится?

60 K1RSAN

11.12.17

✎

13:54

(59) Надо просто запустить их в равных условиях, а не как было в "шоуматче". Поставь боксера, который неделю не ел и сидел на цепи, против того, кто готовился последний месяц к матчу. Даже если первый сильнее - второй получает огромную фору.

61 NSSerg

11.12.17

✎

14:03

(59) Чтоб гроссы, которым нужны движки для подготовки, могли понять какое железо им покупать, и какие движки использовать.

Почему не получится сравнить? Собирается два компа в одну, оптимальных для одного и для другого движка. И проводится матч из 1000 партий. И всех делов. При чем тут механизмы? Все шахматные программы разные, но это не мешает сравнивать их силу.

Например
http://www.inwoba.de/bayes.html
http://www.computerchess.org.uk/ccrl/4040/rating_list_all.html
http://www.cegt.net/40_4_Ratinglist/40_4_mp/rangliste.html
и т.д.

62 NSSerg

11.12.17

✎

14:06

(61) Собирается два компа в одну *цену

63 ilou

11.12.17

✎

14:06

(61) Принцип работы разный, одни делают пересчет, другие используют моделирование, т.е. для работы одни нужно меньше ресурсов, а для других больше, а возможно для них нужен специальный процессор - это про Альфу0, и как это сравнить?

64 NSSerg

11.12.17

✎

14:12

(63) Я же написал как сравнить.
Методика сравнения сил шахматных движков отработана как минимум с 1984 года, с появления рейтинг листа ssdf, при этом тогда разные движки тестировались на разном железе, а часть вообще была аппаратно-программным комплексом.

65 ilou

11.12.17

✎

14:14

(64) Так принцип работы движков был одинаковый, пересчет вариантов, работа нейронных сетей несколько другой варинт, по этой причине старый подход просто не подходит, как таковой.

66 K1RSAN

11.12.17

✎

14:24

(65) По какой причине не работает? Вопрос пока что стоит в определении сильнейшей программы. Есть два варианта - либо поставить в "схожие" условия, как в (61), либо дать каждой максимальный простор, на сколько хватит аппетита у программы. Первый вариант более интересен, потому что по нему будет ясно, какой метод использует ресурсы и время более качественно. И по результатам такого матча можно делать выводы по поводу "громкости" прошедшего недавно матча. Либо это взрыв из будущего, либо определенный звуковой эффект в лужу.

67 Вафель

11.12.17

✎

14:26

(61) Сейчас не смысла сравнивать альфа зеро "в одну" цену

68 NSSerg

11.12.17

✎

14:26

http://ssdf.bosjo.net/long.txt
Вот типа такого.
(63) Я так и не понял, что мешает сделать подобный рейтинг лист? Разве нельзя написать кроме использованного проца еще и использованный GPU/TPU?

(65) В каком месте одинаковый?

То есть движок построенный на нейронных сетях не умеет играть матчи? Чудеса. А мы как раз результат матча обсуждаем в этой ветке.
Рейтинг считается по результатам матчей (партий). Не по содержанию партий, а по результатам. Так же как и у людей. Кто мешает проводить матчей?

69 NSSerg

11.12.17

✎

14:26

(67) Почему?

70 Волшебник

модератор

11.12.17

✎

14:28

(64)
В 2016 году лидером является Komodo 9.1 MP x64 с рейтингом 3366 (на железе 2GB Q6600 2.4 GHz)
https://en.wikipedia.org/wiki/Swedish_Chess_Computer_Association

71 Волшебник

модератор

11.12.17

✎

14:29

(68) Ого! Komodo 11.01 уже имеет рейтинг 3406

72 Вафель

11.12.17

✎

14:29

(69) Этло для "серийных" продуктов

73 NSSerg

11.12.17

✎

14:30

(72) Ориентировочно прикинуть же цену TPU можно.

74 Вафель

11.12.17

✎

14:32

Сейчас интереснее сравнить "потенциал"

75 ilou

11.12.17

✎

14:34

(68) по причине того, что алгоритмы работы разные, я написал выше, что для полноценной работы данной системе скорее всего потребуются свои процессоры, которые работают по другим принципам чем текущие, в этом и есть различие. Просто в "тупую" сравнивать вообще не корректно и смысла не имеет.

76 NSSerg

11.12.17

✎

14:39

(75) Посмотри наконец рейтинг лист в (68)
Нет никаких проблем сравнивать разные движки на разном железе. Рассматривая их как программно-аппаратные комплексы.

Я не понимаю о чем ты говоришь. Текущий матч уже дал силу Альфы - на 100 пунктов сильнее Стокфиша. Проблема только в том что наигрывать матчи лучше с несколькими соперниками, а не с одним. И резать функционал соперников нехорошо.

77 NSSerg

11.12.17

✎

14:40

(75) Для кого не имеет? Всю жизнь сравнивали силу разных шахматистов (которые думают по разному), разных программ на разном железе, играющих по разным алгоритмам и использующие разные принципы. А сейчас вдруг стало нельзя?

78 ilou

11.12.17

✎

14:43

(76) Да это ведь все понимают, что силы были не равны и если посадить стандартные комплексы на суперкомпьютер, они уделают этот Альфа0.

Это иной класс программ, другой принцип, а по факту вопрос в следующем стоит: что победит перебор и мат анализ или вот такой вот алгоритм, вопрос в будущее.

79 NSSerg

11.12.17

✎

14:48

(78) И что? Кто мешает как в (68) Рассматривать любой движок как аппаратно-программный комплекс, и просто указывать железо в рейтинг-листе?
Такое впечатление что переклинило тебя на нейронных сетях.
Программы давным-давно используют нейронные сети. И это ну никак не мешает вести рейтинг-листы. И железяки новые появлялись - и тоже это никак не мешало. Что сейчас то случилось?

80 NSSerg

11.12.17

✎

14:50

(78) Ты понимаешь что нейронная сеть это по сути немного другой вид ОФ, и немного другой способ её настройки (хотя и очень похожий) - не более того?

81 Вафель

11.12.17

✎

14:51

(80) откуда такая инфа?

82 ilou

11.12.17

✎

14:52

(80) если бы было все так просто, то Го работала бы по похожим алгоритмам, не думаю, что твои представление о НС соответствуют действительности.

83 NSSerg

11.12.17

✎

14:55

(81) Может потому что я в теме?
(82) ОФ в го тоже настраивают при помощи нейронных сетей.
ОФ в нарды - тоже нейронная сеть.
>> твои представление о НС соответствуют действительности.
Может наоборот? Ибо я наверно единственный разработчик шахматных движков в этой теме? И достаточно хорошо представляю себе как играют и традиционные движки, и mtsc движки, и обучение ОФ на нейронных сетях, и сама ОФ на нейронных сетях?

84 ilou

11.12.17

✎

14:58

(83) ты уверен, что сама топология нейронной сети, которая сейчас формируется у Альфы, соответствует тому, что ты делаешь у себя на компьютере, если да, то вопросов больше нет.

85 NSSerg

11.12.17

✎

15:04

(84) То есть существует такая топология нейронной сети, которая запрещает считать силу в пунктах эло?
В (0) Это сделано, проведен матч, из которого легко считается сила Эло. Проблема только в том что провести нужно гаунлет (с разными движками) и не резать функционал соперников.
При чем тут топология сети? Каким образом она влияет на саму возможность проведения матчей и расчета силы движка?

86 K1RSAN

11.12.17

✎

15:07

(84) Почитай статью Гугла о принципах работы АльфаГо. Довольно интересные вещи описаны. Может быть там и найдете ответы на некоторые свои вопросы.
А считать силу игры никто и никогда не запрещал. У АльфаГо помнится была даже таблица ЭЛО для одной версии на разных мощностях. Ничто им не мешало сравнивать в тех же числах, что и другие программы. В чем принципиальная разница, что в Го можно и делали (сейчас у АльфаГо есть даже официальный рейтинг на основе сыгранных партий с Про), а в шахматах нельзя?

87 NSSerg

11.12.17

✎

15:08

(84) Походу разговор слепого с глухим. Ты понимаешь что такое сила шахматного движка, рейтинг Эло, как он считается и т.д.?
Каким образом тут алгоритмы программы? Они вообще не причем.
Сила считается исходя из результатов матчей (партий) с набором соперников. Всё. Больше ничего не нужно. Какая разница какие алгоритмы программа использует для игры?
Альфа набрала 61% очков в матче из ста партий.
Берется таблица Эло, из которой следует что Альфа показала силу на 80 пунктов сильнее Стокфиша. Всё.

88 NSSerg

11.12.17

✎

15:09

+ (87) Но хочется чтоб был матч не с одним движком, а с несколькими, в полноценных условиях. Чтоб нормально добавить Альфу в рейтинг-листы. На текущем железе.

89 ilou

11.12.17

✎

15:13

(87) топология - это к вопросу о том, соответствуют ли действительности твои представления о НС или нет.

Еще раз в данном контексте ограничения на движки рассчитать не получится, это просто не имеет смысла, т.к. принципы работы разные, но для публики рано или позно это обязательно сделают, ну для примера это процессор и видеокарта, служат для разных целей и смысла их сравнивать нет.

90 Волшебник

модератор

11.12.17

✎

15:15

(88) Я об этом говорил ещё в (1)

91 NSSerg

11.12.17

✎

15:16

(89) что такое "рассчитать ограничения на движки"?
Это что за хрень? Есть четкие правила шахмат, и общепринятые контроли. Какие нафик ограничения? Берется полноценный движок, и играет с другим полноценным движком. Без ограничений. Я честно говоря не понимаю что ты пишешь.
При чем тут внутренности и алгоритмы движка вообще?

92 NSSerg

11.12.17

✎

15:18

(89) Ты не слышишь? У всех движков разные алгоритмы, каким образом алгоритм может повлиять на сравнение силы?

Вот, стратегия. Куча движков, совсем разные алгоритмы, но это не мешает силу считать.
http://russianaicup.ru/contest/1/standings
Каким образом алгоритм движка может повлиять на возможность проведения матчей и расчет силы?

93 NSSerg

11.12.17

✎

15:20

(90) Я всё-таки пытаюсь понять его мысль, что он имеет в виду. Пока не получается.

94 ilou

11.12.17

✎

15:22

(92) да слышу я тебя, что алгоритмы разные, компьютер для всех один, что ту не понятного. Я про то, что иного это класса алгоритм, качественно он отличается от остальных, под этот алгоритм нужен особый класс процессоров, в этом моя претензия к методам сравнения, надеюсь то же мысль понятна.

95 NSSerg

11.12.17

✎

15:33

(94) Не понимаю тебя, ты до сих пор не смог посмотреть рейтинг лист SSDF?
Пишется так
Альфа 1024*RISC A11 4Ггц + 4*TPU v.12 2Ггц Rating:3560
Stockfish Intel i9-7800X 4Ггц Rating:3480

Укажи, какое железо используется, как это и так делается в рейтинг-листах. Почему раньше это можно было делать, а с Альфой нельзя?

96 Gobseck

11.12.17

✎

15:34

(88) +1

97 Вафель

11.12.17

✎

15:35

нет у них такой цели. Им нужен хайп

98 NSSerg

11.12.17

✎

15:41

(94) http://ssdf.bosjo.net/long.txt

40 Shredder 12 256MB A1200 MHz 2984
358 Novag Constellation Primo 1543

В первом указано железо, во втором вообще черный ящик. Ибо название проца мало кому что скажет
https://www.schach-computer.info/wiki/index.php?title=Novag_Primo

Но это не мешает сравнить их силу.
У Гугла используется TPU - кто мешает написать в рейтинг листе на каком проце и сколько и каких TPU использовалось?

99 ilou

11.12.17

✎

15:46

(98) ну вот ты будешь этот TPU переводить во что-то, а если еще более подходящий процессор сделают, то как это вообще сравнивать то?

100 VS-1976

11.12.17

✎

15:48

(99) Забей. Это измерение силы на предоставленном железе

101 ilou

11.12.17

✎

15:48

(98) хотя я тебя понимаю, что и к любому алгоритму можно запилить особый процессор, который будет более удачно рассчитывать ходы.

102 NSSerg

11.12.17

✎

15:49

(99) Ты походу просто издеваешься.
Как ты сейчас "256MB A1200 MHz" будешь переводить в "Novag Constellation Primo"?
Ты понимаешь что у них и разная система команд, и разная архитектура, и даже примерно соотношение производительности не известно?
Но это не мешает их поместить в один рейтинг лист.

103 ilou

11.12.17

✎

15:49

(100) я это понимаю, я хочу просто донести мысль, что железо пилилось под математику, а не под "математику" нейронных сетей.

104 VS-1976

11.12.17

✎

15:50

Под нейросети на сколько я знаю лучше всего подходят видеокарты. Греф закупался карточками в сбер

105 NSSerg

11.12.17

✎

15:51

(101) Нихрена ты не понимаешь.
Не к алгоритму можно запилить проц - а в рейтинг лист можно поместить программу игравшую на конкретном железе.
Сейчас альфа играла на железе, правильно?
Кто мешает именно на этом железе Альфу свести в матче с сильнейшими движками, посчитать рейтинг, и указать в рейтинг листе вместе с железом на котором альфа играла?

(103) А это что за хрень? TPU - это специализированный нейронный процессор. Он пилился именно под нейронные сети.

106 VS-1976

11.12.17

✎

15:51

(102) Ну производительность как раз сравнивается в терафлопсах

107 NSSerg

11.12.17

✎

15:51

(104) Под нейросети лучше подходят недавно появившиеся специализированные нейронные процессоры. Например TPU

108 NSSerg

11.12.17

✎

15:52

(106) Зачем её сравнивать?

109 ilou

11.12.17

✎

15:53

(105) да не спорю я что Альфа проиграет, не в этом же разговор был.

110 VS-1976

11.12.17

✎

15:53

(107) Ожидаемое решение, так как в видеокарте много лишнего

111 NSSerg

11.12.17

✎

15:55

(106) Нужно взять движок на любом железе, провести матч, и сравнивать только силу, а не производительность железа.
В рейтинг листе SSDF ты видишь сравнение производительности железа? Нет? Конечно не видишь, потому что его там нет. Оно не нужно.
(109) Кому проиграет? При чем тут выиграет она или проиграет? Разница в силе считается не в проиграет/выиграет, а в пунктах эло.

112 VS-1976

11.12.17

✎

15:59

(111) Мне кажется что товарищ хочет донести мысль что если бы у противника было побольше времени подумать ( производительность железа выше ), то возможно он бы играл лучше.

113 NSSerg

11.12.17

✎

16:01

Попробую еще раз объяснить. Альфа играла на 4 TPU по 45 Терафлоп.

Берем Альфу, на этом компе, проводим матчи с
1 Komodo 11.01 MP x64 16GB 1800X 3,6 GHz
2 Deep Shredder 13 x64 16GB 1800X 3,6 GHz
3 Komodo 9.1 MP x64 2GB Q6600 2,4 GHz
4 Stockfish 6 MP x64 2GB Q6600 2,4 GHz

Считаем получившийся рейтинг Альфы, и добавляется строчка
в http://ssdf.bosjo.net/long.txt
Альфа 4 TPU х 45 Терафлоп, и напротив неё рейтинг.
(109) Так понятно?

114 NSSerg

11.12.17

✎

16:02

(113) Рейтинги этих четырех движков на указанном железе известны, поэтому когда будет получен результат матчей, можно будет посчитать рейтинг Альфы на 4 TPU х 45 Терафлоп.

115 NSSerg

11.12.17

✎

16:14

(112) Если на другом железе сила выше (ежу понятно что на разном железе разная сила), никто не мешает посадить альфу на другое железо, и добавить еще строчку в рейтинг-лист, с указанием другого (более мощного железа), и другого, более высокого рейтинга.

Например как сделано для этого движка.
32 Deep Shredder 11 x64 2GB Q6600 2,4 GHz rating: 3014
49 Deep Shredder 11 256MB Athlon 1200 rating: 2897

Неужели непонятно, что именно поэтому железо и указывается, что играли разные движки на разном железе, а на разном железе разная сила?

116 NSSerg

11.12.17

✎

16:17

Или вот
192 Genius 4.0 DOS Pentium 90 MHz 2304
202 Genius 4.0 DOS 486/50-66 MHz 2268

117 ilou

11.12.17

✎

16:44

(114) ладно свою мысль я донес. По поводу рейтингов вообще никаких вопросов нет, рано или поздно дадут они данную информацию и можно будет этот рейтинг сосчитать.

118 Вафель

11.12.17

✎

16:44

мне кажетеся специально параметры сток фиша подбирали так чтобы он все игры проиграл.

-Эх выигрывает нас.
-Давайте отключим библиотеку дебютов.
-Все равно выигрывает
-Эндшпили тоже отключим
-Еще чуть чуть нужно
-Может времени поменьше поставим, версию постарее возьмем?

119 ilou

11.12.17

✎

16:47

Вполне вероятно, что так оно и было, я все ж сомневаюсь, что на типовом железе, можно обогнать расчет вариантов.

120 ilou

11.12.17

✎

16:48

Если бы только ИИ запилило свою "математику", но и опять же она работать будет у "него в голове", а не из формул.

121 NSSerg

11.12.17

✎

16:56

(117) Донес - это когда её, мысль, собеседник понял. Я так и не понял.
(119) Что значит "Обогнать расчет вариантов"?
Альфа - тоже переборный движок, только у него более мощная, но более медленная оценочная функция.
(120) Оценочная функция Альфы - тоже формула, но существует она в виде нейронной сети с весами. Её легко можно переписать под любой обычный CPU - только считаться будет медленно.

(118) Отключения ЭБ и я не понял. Это вообще какая-то жесть, ибо на текущий момент шестифигурки фактически неотъемлемая часть стока.

Дебютная не является неотъемлемой частью. Но у стока дебютную отобрали, а Альфе поставили, еще вдобавок и обучаемую.

122 ilou

11.12.17

✎

17:08

(121) ох, тебя шатает от мысли о рейтинге к мысли о НС.

С рейтингом надеюсь ты понял, что рано или поздно напишут товарищи, кого они обыграли и на каких машинах и можно будет посчитать, что да как, ну а если не напишут, то значит все плохо, это то же понятно.

Мысль, что сам рейтинг не дает представление о системе, я понял. .он описывает, что кто-то кого-то обыграл и на этом все, это мы то же обсудили, т.е. или дадут данные или нет.

по НС я понял, что у тебя свое представление о данной области знаний, по факту, ты пишешь, по следующей аналогии, что "клетка - это просто молекулы, которые взаимодействуют", но это уже совсем другой подход к данным.

123 NSSerg

11.12.17

✎

17:25

(122) Опять я ничего не понял. Что значит свое представление? Нейронная сеть, она и в Африке нейронная сеть.
Я всего лишь отвечаю на посты, но отвечать очень тяжело, ибо по большей части я не понимаю что ты пишешь, для меня это бессвязный набор слов.

Рейтинг не дает представление о том кто кого обыграл. Рейтинг эта единица измерения силы. Любой движок на конкретном железе (и любой игрок, человек) имеет силу, измеряется она в единицах рейтинга Эло.
То есть рейтинг Эло - это число, которое показывает силу.
Если Hiarcs 10 HypMod 256MB Athlon 1200 MHz
имеет рейтинг 2834 (58-ая строчка в http://ssdf.bosjo.net/long.txt), значит на этом железе (256MB Athlon 1200 MHz) в Классические шахматы он играет чуть сильнее Карлсена, чей рейтинг 2829
https://2700chess.com/players/carlsen

Это у тебя мысли скачут. Ты умудрился связать НС - с невозможностью измерения силы движка, использующего НС в качестве оценочной функции.

124 NSSerg

11.12.17

✎

17:29

(122)
+(123) Попробую теперь объяснить как устроен движок - совсем упрощенно это переборная часть + ОФ(оценочная функция)
ОФ бывает простой, тогда движок будет быстрый, бывает сложной, тогда движок будет медленный.
Устройство Альфы в целом не отличается от других движков.
Основное отличие в том что в качестве ОФ у него используется НС (очень медленная, но очень мощная ОФ), а в качестве переборных алгоритмов похоже mcts.

Ты пытаешься рассуждать о тех вещах, которые не понимаешь - как устроен шахматный движок, что такое рейтинг и т.д. И в итоге получается бессвязный набор слов.

125 NSSerg

11.12.17

✎

17:37

https://2700chess.com/
Вот рейтинг-лист людей (Это Live! рейтинг)
Несмотря на то, что ну никак нельзя сравнить мощность "железа человека" и железа на котором играют программы - все равно у людей тоже есть рейтинг, благодаря которому можно узнать кто сильнее, и насколько.
Так как рейтинг ssdf откалиброван на людях, то можно узнать кто сильнее - человек, или конкретная программа на конкретном железе.

126 NSSerg

11.12.17

✎

17:39

Поподробней про рейтинг Эло
https://ru.wikipedia.org/wiki/Рейтинг_Эло

127 ilou

11.12.17

✎

18:10

(123) опять 25, еще раз это сравнение процессора с видеокартой, мягкого с кислым, нельзя их сравнивать, нельзя сравнивать движки работающие на мат анализе и движки работающие на НС на одном и том же железе, как ты этого не понимаешь, если уж и сравнивать, то только результаты, как ты сам выше и писал, результаты в не зависимости от железа, только так.

Но попробую по твоему решить задачу, с другой стороны я понимаю твое упорство, что мол вот есть готовые алгоритмы перебора ходов и выбора оптимального варианта и давайте их сравнивать, мол ограничением у нас будет мощность компьютера, а раз данный параметр у нас ограничен, то остается качество кода. у НС есть некоторая потребность в мощности в рамках которого она работает, больше ей просто не нужно, вот это и должно быть ограничение (это очень грубо), если уж на то пошло, а не просто какой-то компьютер, вот эту систему и должны тебе по идее написать по Альфа0, но что для тебя будет значит TPU хз и как находить аналог и будет ли он аналогом я ума не приложу.

128 NSSerg

11.12.17

✎

18:45

(127) я ни разу не пытался сравнить производительность нейронных сетей на процессоре и tpu (кстати, это не видеокарта)
Я всего-лишь написал что те-же алгоритмы можно запустить на cpu.
При чем тут сравнение производительности?
Я ни разу в ветке не предложил сравнить игру движка (и силу движков) на нейронных сетях и классической ОФ на одном железе.
Я писал что Альфа должна играть на своем железн (на TPU), а классические движки на своем.
Вы кому и на какую фразу отвечаете?

129 NSSerg

11.12.17

✎

18:49

И еще раз - альфа такой же переборнвй движок.
И если удвоить количество tpu, то на оценку каждой позиции будет уходить в два раза меньше времени, и соответсвенно за то же время Альфа сможет рассмотреть в два раза больше позиций (узлов дерева перебора) с соответствующим ростом силы.

Еще раз повторяю - в альфе играет не нейронная сеть, она не выбирает ход, а всего лишь дает оценку позиции, а за выбор хода, так же и а классических движках отвечает перебор.

130 NSSerg

11.12.17

✎

18:50

мне кажется, что так же как рассуждая о рейтинге, вы даже примерно не представляли что это такое, так же и с выбором хода Альфой, вы даже примерно не представляете как это происходит.

131 ilou

11.12.17

✎

20:25

(130) собственно я понял, что вы сравниваете калькулятор и Альфо0, вас просто терзает мысль, что мол они негодяи книгу ходов запихнули в нейронную сеть и теперь тупым перебором выбирают самую подходящую, а вот программке это сделать не дали и типа требуют от неё все ходы просчитывать заранее с 0ми данными. Еще раз если бы все так было просто, тупой мат анализ и т.д. то всякие нейронные сети были бы не нужны, вы опять говорите, по аналогии "клетка - есть набор взаимодействующих молекул и ничего более", нейронные сети это больше чем набор мат алгоритмов, хотя будет вопрос, а что же это такое, если не система с выбором ходов...

132 NSSerg

11.12.17

✎

21:56

(131) Еще раз повторить? Вы даже примерно не понимаете как работает Альфа. Я, как разработчик шахматного движка, примерно (или больше чем примерно) понимаю как он работает. И с моей точки зрения вы пишете ахинею.
Какая книга ходов?
Еще раз попытаюсь обяснить - на базе НС в Альфе сделана оценочная функция. Не более того.
Так же как и любой другой движок, Альфа строит дерево перебора, оценивая листья дерева при помощи ОФ (своей нейронной сети).
Правда в mcts немного всё сложнее, но не буду вас грузить.
Насчет дебютной книги отдельный разговор, так же считаю что вы к нему просто не готовы.

133 Lama12

11.12.17

✎

21:57

(131) Вообще-то NSSerg все верно говорит. Нейросеть просто оценочная функция.

134 Dzenn

гуру

11.12.17

✎

22:22

ИИ наступает, как и предсказывал Рэй Курцвейл.
Через 10 лет ждём домашних роботов https://hi-news.ru/technology/prognozy-reya-kurcvejla-na-blizhajshie-25-let.html

135 КомПрог

11.12.17

✎

23:33

(134) Вот здесь эти же прогнозы:
https://youtu.be/WL0Dj50x2Gs

136 shpioleg

12.12.17

✎

00:34

(133) Тогда и шахматиста-человека можно представить как просто оценочную функцию.

137 NSSerg

12.12.17

✎

00:52

(136) Да причем тут представить? Там прямо в коде написаны переборные алгоритмы, чем больше времени отводится программе тем дальше она считает, а оценка позиции производится за фиксированное время. И выдает НС получая на вход позицию, не ход, а оценку этой позиции.
Точно так-же как и оценочная функция любой другой шахматной программы.

Не представить можно, а прямо в коде прописаны переборные алгоритмы, и чем дольше программа думает, тем дальше считает. Для mcts понятие "дальше" конечно условное, но суть в другом. Это обычный переборный движок.

138 NSSerg

12.12.17

✎

00:52

Просто роль оценочной функции играет нейронная сеть, с уже посчитанными весами.

139 NSSerg

12.12.17

✎

01:01

В (0) же достаточно четкое описание.
Вместо ОФ используется нейронная сеть, не стали использовать Альфа-бету, а в качестве переборного алгоритма используется mcts.

Использование mcts с наложенной ОФ - уже давно стандартный метод перебора в ГО.

Такой метод перебора использовала моя программа участвовавшая в открытом чемпионате Голландии 2013 года.
http://archive.codecup.nl/2013/49/rules_symple.html
http://archive.codecup.nl/2013/27/competitionlist.html

Игра похожа на ГО, поэтому в ней хорошо работает MCTS (вместо альфа-беты)

140 Gobseck

12.12.17

✎

01:24

(136) +100
Причем среди людей были шахматисты, которые быстро и далеко считали варианты (Михаил Таль) и шахматисты, у которых в голове была "хорошая оценочная функция" (Капабланка, Карпов).

141 NSSerg

12.12.17

✎

01:33

(140) Шахматисты считают все, поэтому ни одного шахматиста нельзя представить как оценочную функцию. И человек выдает ход, а не оценку (а если и выдает оценку позиции, то обязательно подкрепляет её перебором)
В отличии от человека, нейросеть, так же как и обычная ОФ - выдает именно оценку, без какого-либо перебора.
И чтоб программа могла играть - её ОФ обязательно нужно подкрепить перебором.

142 NSSerg

12.12.17

✎

01:35

Или иными словами - программа, как и человек - это перебор + ОФ (где у Альфы в качестве ОФ - Нейронная сеть)

143 ILM

гуру

12.12.17

✎

06:17

(140) У Каспарова были хороши обе ачивки. Про Таля не согласен, он играл скорее интуитивно и эмоционально. У него было видение партии как произведения искусства. По красоте игры, Таля пока ещё никто не превзошёл.

144 Зуекщмшср

12.12.17

✎

06:21

(143) Накамура иногда выдает талевские партии. Дубов пытается мутить воду в стиле Таля.

145 Волшебник

модератор

12.12.17

✎

09:06

Искусственный интеллект Гугла оказался фикцией!
Опять перебор, тупая заученная вусмерть нейросеть, которая дальше не обучается, хоть учи её тыщу лет!
А-ха-ха!

146 antgrom

12.12.17

✎

09:21

Программа от Гугла просто умеет гуглить.
Поэтому и выигрывает.

147 NSSerg

12.12.17

✎

15:25

Похоже что нейросеть выдает не только оценку позиции, но еще вероятность того что будет сделан тот или иной ход из этой позиции (вероятность того что он лучший), и эта вероятность используется в переборных алгоритмах.

148 КомПрог

12.12.17

✎

15:43

В 2014г ИИ за 4 часа мог только в пинг-понг научиться играть:
https://youtu.be/y81ryf_eDHA?t=1m46s
Прогресс за 3 года поражает. Толи еще будет...

149 NSSerg

12.12.17

✎

16:01

(148) Ничего подобного. Так-же можно было посчитать веса в ОФ.
Не научилась Альфа играть в шахматы за четыре часа. За четыре часа веса в ОФ (нейронной сети) были посчитаны.

150 ERWINS

12.12.17

✎

17:54

NSSerg рекомендую почитать как там сделано.

нейросеть кроме подсчета оценочной функции предсказывает еще и перспективные ходы. Если в первых версиях для ГО это были 2 разные нейросети, то сейчас используется одна и таже.

Программа научилась играть за 4 часа, правда на уровне человека, в дальнейшем ее дообцчали ДОЛГО.

В остальном ты прав.

151 ERWINS

12.12.17

✎

18:02

"Не научилась Альфа играть в шахматы за четыре часа. За четыре часа веса в ОФ (нейронной сети) были посчитаны."
не научилась играть в Го веса за ... часа были подсчитаны, ненаучилась в .... веса были подсчитаны.

А научиться и посчитать веса одно и тоже. Не?

152 NSSerg

12.12.17

✎

19:23

(151) Повторюсь - почитать веса в ОФ за четыре часа умели и раньше.
Нет, посчитать веса в ОФ, и научиться играть в шахматы не одно и то-же.
Оценочная функция не умеет играть в шахматы. Ей нужен генератор ходов, исполнитель, переборные алгоритмы и т.д.
Более того - Прежде чем ОФ научить (посчитать веса) - её нужно написать.

Ровно так-же как и Стокфиш - написана полностью программа, включая переборные алгоритмы и ОФ. Теперь посчитать веса признаков в ОФ - можно достаточно быстро.

Так же и Альфа - написана полностью программа, включая переборные алгоритмы и ОФ, и только после этого за четыре часа она была обучена.

153 NSSerg

12.12.17

✎

19:28

(150) Я это знаю, ибо это есть в моих постах на Каспаровчесс. Это не меняет сути. Нейросеть - это все-равно всего-лишь ОФ (понятно что одна ОФ умеет кое-как считать ценность ходов - ценность хода это разница между ОФ в позиции перед ходом, и в позиции после хода), которая еще вдобавок умеет достаточно точно выдавать веса ходов, которые в дальнейшем используются в переборе (MCTS)

И то что её на огромных вычислительных мощностях обучили за четыре часа - в принципе в этом ничего такого нет.

А есть - Альфа это первая шахматная программа на MCTS играющая достаточно сильно, и первая шахматная программа с ОФ на Нейронных сетях, играющая достаточно сильно. Ну и что сделало это возможным - это появление TPU. Потому что без TPU производительности для такой силы игры бы не хватило, и на этот проект не обратили бы внимания.

154 ERWINS

12.12.17

✎

19:35

(152) значит не понял суть.
Алгоритм один и тот же под шахматы и под го и под какую то там еще игру. Т.е. если ты поменяешь правила то для фиш тебе придется переписывать программу? например конь ходит как жираф? а тут нет.

(153) вероятно сеть не сжимали. Насколько можно ее сжать не известно, но например для картинок в 1000 раз практически без потери точности. Но тогда качество игры при одинаковой вычислительной мощности должно будет практически сравняться.

155 NSSerg

12.12.17

✎

19:52

(154) переборные алгоритмы, оф, представление доски, генераторы и исполнители ходов - разные под разные игры.
если у тебя написаны шахматы, а нужно шашки - придется все переписывать с нуля. если тебе нужно из программы в бразильские шашки сделать программу в русские - меняется генератор ходов и исполнитель, нужно пересчитать веса в оф, и переписать в оф эндшпильный блок.

только я не понимаю какое это имеет отношение к теме.

что такое «алгоритм один и тот-же» - алгоритм чего?

156 NSSerg

12.12.17

✎

19:53

Нормальная шахматная программа - это достаточно большой количество алгоритмов и эвристик.

Это не один алгоритм. И не два :)

157 ERWINS

12.12.17

✎

20:01

Программа имеет на вход правила ходов и начальную расстановку.

Обрабатывая и формируя веса она учиться играть используя правила ходов. Ей без разницы что ты запихнешь.

"это достаточно большой количество алгоритмов и эвристик" - вот в данном случае нейросеть заменяет эвристики собой.

Время рукописных программ игры в .... ушло. Скоро такая же судьба постигнет и программистов и сантехников.

158 NSSerg

12.12.17

✎

20:18

(157) Зачем фантазировать? Все не так.
У Альфы полноценные переборные алгоритмы (MCTS), вместо ОФ нейронная сеть. Обученная. Которая кроме ОФ дает веса ходов.

На самом деле обучение ОФ нейронными сетями - давно уже стандарт и в ГО и в нарды. В принципе в этом ничего нового нет.
Новое только сила, и то что эта схема впервые применена в шахматах. Именно в шахматах не получалось сделать сильную программу на mcts (в другие игры уже 10 лет как получается)
И именно в шахматах не получалось сделать ОФ на нейронных сетях (в нарды тоже уже 10 лет как)

Но по форумам зачем-то распространяют слухи что Альфа с помощью нейронной сети научилась играть в шахматы.

Нет. Нейронная сеть в ней это ОФ, а обучение - это настройка весов в ОФ. Играть в шахматы она умеет вообще без нейронной сети, но естественно очень слабо. Как и любая другая программа с непосчитанными весами в ОФ.

Кстати, программе с mcts в принципе ОФ для игры не обязательна, может играть вообще чисто на переборных алгоритмах.

159 ERWINS

13.12.17

✎

13:00

(158)
"У Альфы полноценные переборные алгоритмы (MCTS), вместо ОФ нейронная сеть. Обученная. Которая кроме ОФ дает веса ходов. " - полностью согласен

"Новое только сила, и то что эта схема впервые применена в шахматах" - она была применена 3 года назад с хорошими результатами, но разработка была прекращена.

"Играть в шахматы она умеет вообще без нейронной сети, но естественно очень слабо" - без ОФ? круть! Тогда можно сказать что она умеет играть в шахматы без перебора, но только слабо - используя веса ходов.

160 NSSerg

13.12.17

✎

13:34

(159)
1.Применена в шахматах она была не только три года назад. Применение нейросети или mcts в ОФ можно считать нормальным, только когда оно дает нормальную силу игры. Всякие Жирафы в нормальную силу не играли. И естественно Жираф не первая неудачная попытка.

2. Зачем ты споришь? Еще раз повторяю - программы с mcts могут играть без ОФ, совсем. Есть примеры достаточно сильных программ в ГО, совсем без ОФ.

На всякий случай еще раз повторю ссылку - я автор не только программ на альфа-бете, но и программ на mcts. И знаю о чем говорю. Ссылку в ветке я уже давал. (139)

161 NSSerg

13.12.17

✎

13:55

+ (160) Опечатка. Применение нейросети или mcts в *программе можно считать нормальным...

162 ERWINS

13.12.17

✎

14:07

Понял. В ГО чистый mcts работает, а вот в шахматах насколько я знаю нет.

163 Волшебник

модератор

13.12.17

✎

14:14

(148) Вы арканоид с пинг-понгом не путаете?

Роботов для игры в настольный теннис пока не придумано. Есть робопушки, которые выстреливают шарики по программе и/или рандомно.

164 ERWINS

13.12.17

✎

14:48

(162) насколько я помню это связано с конечностью партии в ГО и потенциальной бесконечностью в шахматах.

165 ДемонМаксвелла

13.12.17

✎

15:11

(164) неверно. дерево перебора в го ветвится быстрее. и партия шахмат не бесконечна, есть, например, правило 50 ходов.

166 ERWINS

13.12.17

✎

15:13

(165) партия в го не может длиться больше чем 19*19 ходов.
Какома максимальная длительность партии в шахматы?

167 ДемонМаксвелла

13.12.17

✎

15:19

(166) лучше говорить о правиле 75 ходов, там ничья засчитывается автоматом.

теоретически это приводит к верхней планке менее 10 тыс ходов.

Но на практике 99,99 % партий (и у людей, и у машин) длятся менее 100 ходов.

168 ERWINS

13.12.17

✎

15:21

(167) а в ГО это 19*19 ходов если кто то раньше не сдастся. Но такое можно не учитывать.

169 ДемонМаксвелла

13.12.17

✎

15:29

Длина партии растет линейно, а ветвление экспоненциально. Длина партии на количество расчетов сильно не влияет.

170 ДемонМаксвелла

13.12.17

✎

15:33

(163) придумано

https://geektimes.ru/post/215405/

171 ERWINS

13.12.17

✎

15:35

(169) для MCTS важна длина партии, точнее как часто мы будем приходить к варианту пройгрыш/выйгрыш.

172 NSSerg

13.12.17

✎

15:37

(166) (171) С этой точки зрения mcts важна не максимальная длина партии, а средняя.
Чем меньше возможных ходов в позиции, тем проще mcts (в шахматы меньше чем в ГО)
Чем короче средняя партия - тем проще mcts (в шахматы средняя партия короче чем в ГО)

173 NSSerg

13.12.17

✎

15:41

В шахматы препятствие для MCTS было совершенно другое, а именно то что в шахматы в отличии от ГО - Альфа-бета хорошо играет. Но есть примеры и шахмат на MCTS - но играют слабее альфа-беты. Например WildCat пробовал, можно у него спросить чем закончилось (игра осмысленная, но слабая относительно классической альфа-беты)

А вот уже в шашки говорят были успешные попытки с mcts.
Только я уже потерялся, о чем спор?
Что сделано нечто феноменальное? Да, но я уже повторял, то что на обучение потрачено 4 часа - это ни о чем. Феноменально что сильно играет MCTS, и что при этом сильно играет с ОФ на нейросетях. Ни то ни другое не удавалось.
И если бы не появились TPU, то и не удалось бы.

174 ERWINS

13.12.17

✎

15:42

(172) важна даже не длина партии,а партии с однозначным исходом. Если мы не используем в шахматах ОФ то работать MCTS не будет.

175 ERWINS

13.12.17

✎

15:43

Спор в твоем утверждении что для шахмат чистый MCTS без ОФ будет работать.

176 NSSerg

13.12.17

✎

15:43

(174) (175) Будет.
Что ты понимаешь под словом "работать"?
И что такое MCTS без ОФ? UCT+RAVE? Будет работать. Будет играть. Несравнимо сильнее чем рандомный движок.

177 ERWINS

13.12.17

✎

15:44

(176) "Несравнимо сильнее чем рандомный движок" жесткое утверждение. Не верю.

178 NSSerg

13.12.17

✎

15:48

(177) На основании чего не веришь? Я, когда приступал к написанию Symple - вообще не мог понять как mcts работает, и не верил что сможет играть. А оно вона как - играет, осмысленно, видит тактику. То есть у меня есть причины думать что сможет играть.

Потом в шахматы - тоже не верилось что сможет играть, но есть пример WildCata - движок играющий в шахматы на mcts.

179 NSSerg

13.12.17

✎

15:50

(174) Что такое "партия с однозначным исходом"?

180 NSSerg

13.12.17

✎

15:51

Все партии, наигранные mcts - с однозначным исходом. Конечная позиция имеет однозначный результат.

181 ERWINS

13.12.17

✎

15:52

(179) победа/поражение или разница в числе камней и т д.

в шахматах почти всегда при случайных ходах будет или ничья очень долгая партия.

182 NSSerg

13.12.17

✎

16:52

(181) MCTS это не случайные ходы. Мы точно оба понимаем о чем идет речь? Что такое RAVE например?

183 NSSerg

13.12.17

✎

17:22

Применительно к шахматам в качестве RAVE можно использовать статистику ходов, включающую в себя - Какая фигура, откуда, куда пошла, и если взятие, что съела.

У программы, в которой только RAVE - хорошие взятия вылезут в топ, и она начнет объедать рандомный движок.
А далее в ТОП вылезут матующие ходы.
То есть естественно нет никаких сомнений что только на одном RAVE MCTS-движок будет всё выигрывать у рандомного.
Ну и никто не мешает наложить на статистику данные, например SEE, MVV/LVA (это ну никак не ОФ), так что программе не нужно даже набирать статистику по RAVE чтоб объедать, она будет уметь делать это изначально.

UCT - вполне достаточно чтоб для 3ЭБ шахматная программа смогла построить готовую эндшпильную библиотеку, в реальном времени, прямо во время партии. Думаю что сможет и для 4ЭБ. Например KBNK, KQKR - думаю что и с этим проблем не будет.

И это всё без ОФ.

184 ERWINS

13.12.17

✎

17:31

(183) "хорошие взятия вылезут в топ" игра партии идет до конца. Хорошие взятия алгоритм не увидит, так как может идти очень долго. Если мы например ограничиваем 30 ходами и потом считаем простую стоимость фигур то ваш вариант будет работать.

Неуверен что мат ладья+король вс король можно поставить случайными ходами меньше чем за 1000 ходов.

185 ERWINS

13.12.17

✎

17:32

Мы берем чистый монтекарло который работает на ГО и вероятно не работает на шахматах.

Любые улучшения это эвристика.

186 NSSerg

13.12.17

✎

17:44

(184) То есть как не увидит?
(185) Да, чистый mcts, без ОФ.
Согласен даже на только UCT + RAVE + MVV/LVA.
Совсем простая схема, аналогичная которой будет работать в ГО.

187 ERWINS

13.12.17

✎

17:47

(186) ты вероятно делаешь предположения что ходы взятий будут в приоритетах и работать форсированные варианты.
но эта эвристика, а мы говорим о чистом монтекарле.

188 NSSerg

13.12.17

✎

17:47

+ (186) Вообще ничего кроме этого. Генератор ходов, исполнитель хода, проверка окончания партии, и простенькая формула для расчета миксующая UCT, вышеописанный RAVE.
И что-то для взятий. Например просто в случае остальных равных - рассматриваем ход лучший по MVV/LVA

И утверждаю что такое будет выигрывать 100% против рандомного движка.

189 ERWINS

13.12.17

✎

17:51

(188) согласен с таким утверждением.

190 NSSerg

13.12.17

✎

17:54

(187) Какие форсированные варианты в mcts? Как это?
Что такое чистый Монте-Карло? Это Монте-Карло без ОФ.
Считается минимально играет UCT+RAVE+еще немножечко.

191 ERWINS

13.12.17

✎

18:06

(190) да, такое будет играть.

192 ERWINS

13.12.17

✎

18:07

"И что-то для взятий" - форсированные варианты?

193 NSSerg

13.12.17

✎

18:32

(192) нет, не переборное, либо mvv/lva, либо see.
Просто расставить приоритеты для ходов при одинаковой статистике.
То же самое что простая сортировка ходов в обычной альфа-бете.
Например приоритет по mvv/lva, у взятий приоритет перед остальными ходами. Я бы еще и шахам дал приоритет.

Но мы обсуждали совсем другое, что альфа - полноценный движок, который уже умеет играть в шахматы. А обучение нужно только чтоб он играл хорошо. Как и классические шахматные программы с непроставленными весами в оф. Чтоб нормально играла - веса нужно настроить. И настройка за четыре часа, да и еще на сверхмощностях - это не достижение. Достижение Альфы в другом.

194 ERWINS

13.12.17

✎

18:37

Спор начался с фразы "Еще раз повторяю - программы с mcts могут играть без ОФ, совсем." - с ней я согласен для ГО и любой игры с конечным числом шагов в партии и не согласен с шахматами. Кстати с шашками я согласен если не учитывать дамки.

195 NSSerg

13.12.17

✎

18:58

(194) ты же только что в (190) сказал противоположное.

196 NSSerg

13.12.17

✎

19:37

Тут наверно стоит разобраться в устройстве шахматной программы. Сортировки ходов не имеют ни малейшего отношения к ОФ.

Может все-таки определимся, может ли играть MCTS без ОФ в шахматы или нет? Допустим если за "может играть" принять например набор 99,9% набранных очков против "рандомного движка" - движка который в любой позиции равновероятно делает ход из списка легальных ходов.

в (191) Ты согласился что такое будет играть в шахматы.
в (194) Ты опять не согласен.

197 ERWINS

13.12.17

✎

19:51

(196) с таким дополнением "Сортировки ходов не имеют ни малейшего отношения к ОФ" разночтений между нашими позициями нет.
Но я считаю что Сортировка ходов напрямую связана с ОФ и следует из ее статистики.

198 NSSerg

13.12.17

✎

20:48

(197) ты точно знаком с устройством шахматной программы?
мне то доказать что я знаком - ничего не стоит.
И я утверждаю, что в шахматных программах ОФ и сортировка ходов - ну никак не свзяны. И если используется сортировка по mvv/lva, see, шахам, истории, киллеры, лучшие ходы - ну ни малейшего отношения к ОФ это не имеет. Мне очень тяжело что-то доказывать, когда собеседник на ходу придумывает новые определения классическим блокам шахматной программы.

199 NSSerg

13.12.17

✎

20:52

mvv/lva - это не статистика, так же как и see.
первое это просто разница номиналов берущей и взятой фигуры, а второе - статичная (без перебора) оценка результата разменов.
К ОФ, статистике - это никаким боком.

200 ERWINS

14.12.17

✎

10:26

(198) ты меня не понял. Внос сортировки порядка ходов - это эвристика которая неявно следует из ОФ. В коде это разные куски которые никак не связаны.

(199) ты говоришь с точки зрения реализации, а я с точки зрения общих принципов.

201 NSSerg

14.12.17

✎

10:49

(200) Я тебя понял. Ни в одной сильной программе до сих пор ОФ не использовалась ни явно ни неявно в сортировке ходов.
Может быть можно притянуть за уши на история, киллеры и лучшие ходы - как-то повлияла ОФ, но я их использовать в простейшей программе на MCTS не предлагал.
А mvv/lva и see - вообще статические методы. К Которым ну совсем никак нельзя притянуть ОФ.

Далее - UCT и RAVE - это часть именно MCTS, переборных алгоритмов, основа MCTS. Поэтому к ОФ их тоже притянуть за уши не выйдет.

В альфа-бете программе ОФ - это процедура вызываемая в листьях дерева. В ней нет ни SEE, ни других методов сортировки ходов. И ОФ не используется для сортировки ходов (и если бы даже использовалась, то я не предлагал её использовать в программе на MCTS без ОФ)

в MCTS ОФ это добавка к рассчитанной статистике для выбора хода. Обычно это такая-же ОФ как в альфа-бете, но иногда для быстроты счета её делают инкрементальной (она не умеет считать полную ОФ, а умеет считать только разницу в ОФ до хода и после него).

То есть все умные слова написанные выше -
MVV/LVA, SEE, вытягивание шахов наверх, UCT, RAVE - ну никак невозможно притянуть к ОФ, они не имеют к ней никакого отношения.

И еще немного. Кое у кого проскакивает мысль что Альфа вообще научилась играть в шахматы при помощи нейронной сети - конечно же нет. У неё естественно есть полноценный генератор ходов, и без всякой нейронной сети она знает какие легальные ходы (по правилам шахмат) есть в позиции.

202 ERWINS

14.12.17

✎

12:31

(201) В ГО в какой то из версий системе вообще не давали какие ходы легальны, а какие нет. Просто код возврата в случае плохого хода был поражение.

Не исключаю что и тут могли такое реализовать. В случае некорректного кода возврат - поражение.

(201) я говорю о неявном использовании ОФ. Например взятия в самом примитивном варианте повышают ОФ - значит повышаем их вес.

203 NSSerg

14.12.17

✎

14:08

(202) >>Не исключаю что и тут могли такое реализовать.

Зря не исключаешь. Не могли. Ибо цели совсем другие. Научить НС правилам - это задачка уровня курсовой, серьезным людям такими извращениями заниматься не пристало, тем более что цель Альфы совершенно иная, и "немного" глобальней.

То есть задача написать сильнейшую в мире шахматную программу "немного" глобальней чем задача написать извратный генератор ходов на нейронных сетях, поэтому такого в Альфе точно нет.

Никаких проблем у классических генераторов ходов нет, они абсолютно точно генерируют ходы (или легальные ходы в легальном генераторе) - без единой ошибки, и с огромной скоростью, тысячекратно превышающей достаточную для Альфы-Зеро. Поэтому нет смысла заниматься глупостями.

>> я говорю о неявном использовании ОФ. Например взятия в самом примитивном варианте повышают ОФ - значит повышаем их вес.

Жесть. Ты еще запрети взятия в программе которая не использует ОФ. Или сильные ходы, потому что они повышают ОФ.
Еще раз повторюсь - сортировки ходов не имеют ни малейшего отношения к ОФ. А если натягивать сову на глобус - так можно вообще программе в принципе запретить делать ходы. Так как любой ход изменяет значение ОФ. И есть общепринятая терминология, которой вообще желательно придерживаться, иначе понять друг друга будет невозможно.

204 NSSerg

15.12.17

✎

00:54

На каких ресурсах Альфа обучилась за четыре часа, это кстати не 4 TPU
AlphaZero defeated Stockfish after just 4 hours of self-play, using 5,000 first generation TPUs to generate the games and 64 second generation TPUs to train the neural networks
https://en.wikipedia.org/wiki/AlphaZero
И мнение автора Стокфиш о матче:
https://www.chess.com/news/view/alphazero-reactions-from-top-gms-stockfish-author
Тем временем Chess.com также получил длинный комментарий от одного из авторов оригинальной книги Stockfish Tord Romstad, который мы дадим в полном объеме:

Результаты матчей сами по себе не имеют особого значения из-за довольно странного выбора параметров времени и настроек параметра Stockfish: игры были сыграны в фиксированное время 1 минута / ход, что означает, что Stockfish не использует эвристику управления временем ( много усилий было предпринято для того, чтобы компания Stockfish определила критические моменты в игре и решила, когда потратить дополнительное время на ходу, в фиксированное время за ход сила будет значительно страдать).Используемая версия Stockfish - один год, играла с гораздо большим количеством поисковых потоков, чем когда-либо получала значительное количество тестов, и имела слишком маленькие хеш-таблицы для количества потоков.Я считаю, что процент ничьих был бы намного выше в матче с более нормальными условиями.

С другой стороны, нет никаких сомнений в том, что AlphaZero мог бы сыграть лучше, если бы в проект было включено больше работы (хотя «4 часа обучения», упомянутые в документе, очень вводят в заблуждение, когда вы принимаете во внимание огромные аппаратные ресурсы, используемые в течение этих 4 часов).Но в любом случае, Stockfish против AlphaZero - это очень сравнение яблок с орангутанами.Одна из них - обычная шахматная программа, работающая на обычных компьютерах, другая использует принципиально разные методы и работает на специально разработанных аппаратных средствах, которые недоступны для покупки (и это будет выход из бюджета обычных пользователей, если это так).

205 ERWINS

15.12.17

✎

16:03

(204) плата с 4 тенсорными процами стоит 700 долларов. Но она под экспортными ограничениями, так что ее не купишь.

в остальном согласен.

206 Волшебник

модератор

15.12.17

✎

16:07

(170) Это фейк

207 ДемонМаксвелла

15.12.17

✎

17:41

(206) с чего это? там видео есть, его подделать сложнее, чем сделать робота. И вообще, нафига одному из ведущих производителей промышленных роботов (https://en.wikipedia.org/wiki/KUKA) делать фейки?

208 ДемонМаксвелла

15.12.17

✎

17:43

(206) они максимум могут приврать насчет силы игры робота из маркетинговых соображений. Но робот то вообще играть умеет.

209 ДемонМаксвелла

15.12.17

✎

17:50

там в статье о двух таких роботах рассказано. и видео игры обоих есть.

210 NSSerg

15.12.17

✎

18:13

(205) это развод, TPU не продается.

211 КомПрог

18.12.17

✎

17:24

Кто-то тут еоворил что-то про покер... получите:
https://hitech.newsru.com/article/18dec2017/libratus
Искусственный интеллект превзошел сильнейших игроков в покер

Ошибка? Это не ошибка, это системная функция.