Всего за 4 часа Google «взрастил» лучшего шахматиста в истории

Шахматы – непростая игра. По крайней мере по человеческим меркам. Но для сверхмощного искусственного интеллекта это обычная забава, которую можно освоить за весьма короткое время. В статье, опубликованной в онлайн-библиотеке Arxiv.org, инженеры из Google в деталях рассказывают о том, как их новейшая ИИ-конфигурация AlphaZero смогла развить «сверхчеловеческие возможности» в шахматах всего за несколько часов.

После того, как в систему внесли лишь базовый набор правил (без стратегий), AlphaZero потребовалось всего четыре часа на то, чтобы освоить игру настолько хорошо, что перед ним пал даже самый сильный в мире шахматный движок Stockfish.

После серии из 100 игр против Stockfish ИИ-алгоритм AlphaZero одержал победу 25 раз за игру белыми фигурами и три раза за игру черными. Все остальные партии обе системы сыграли вничью. В итоге Stockfish не смогла победить ни одного раза, а AlphaZero, в свою очередь, ни одного раза не проиграла.

«У нас появился новый повелитель шахмат. Это без сомнений революционизирует игру, но было бы неплохо подумать и о том, как это может быть применено вне шахмат», — прокомментировал результаты Дэвид Крамалей, исследователь шахматной игры и главный редактор сайта Chessable.

Система AlphaZero основывается на наработках ИИ-алгоритмов AlphaGo и AlphaGo Zero, создателями которых являются инженеры лаборатории искусственного интеллекта DeepMind, принадлежащей Google. DeepMind занимается совершенствованием этих ИИ-алгоритмов уже в течение нескольких лет, попутно побеждая с помощью них лучших в мире игроков в древнюю логическую игру го. Кульминация победной серии состоялась в октябре этого года, когда новая и полностью автономная версия ИИ-алгоритма AlphaGo, обучавшаяся исключительно на игре с самой собой, а не против человеческих оппонентов, победила все свои предыдущие версии.

В то же время предыдущие версии алгоритма AlphaGo Zero частично обучались игре с помощью наблюдения за тем, как играют люди. Таким образом разработчики хотели помочь ей в изучении стратегий игры, но, как оказалось, на самом деле это ее лишь замедлило в развитии. Полное предоставление самой себе при обучении сказалось на существенно более эффективных результатах AlphaGo Zero в соревнованиях один на один.

«Это как наблюдать за инопланетной цивилизацией, изобретающей свою собственную математику», — говорил в интервью порталу Gizmodo еще в октябре Ник Хайнс, ученый MIT, работающий в области компьютерных наук.

«То, что мы здесь видим, это самостоятельная, самодостаточная модель, созданная с исключенным фактором человеческих предрассудков. Она самостоятельно способна обучаться тому, что сама посчитает оптимальным, что, безусловно, будет дифференцировать ее от наших собственных концепций».

Однако развитие сферы ИИ происходит настолько быстро, что то, что было достигнуто к октябрю этого года, могло уже устареть. В опубликованной статье инженеры DeepMind отмечают, как самая последняя версия AlphaZero перешла на новый уровень и способна заниматься решением более широкого круга задач. Это означает, что теперь AlphaZero способна не только великолепно играть в шахматы. Она также отлично справляется с сёги (японской настольной игрой) и го, в которых достигнуть совершенства ей удалось всего за 2 и 8 часов соответственно.

Пока ни инженеры Google, ни инженеры DeepMind открыто не выступали с комментариями по поводу новых результатов своей работы, они ожидают стороннего и независимого экспертного анализа статьи в Arxiv.org. Правда, уже понятно, что восхождение данного алгоритма к вершинам искусственного интеллекта еще далеко до своего завершения, но уже сейчас он настолько крут, что его признают даже гроссмейстеры.

«Всегда хотел узнать, как бы выглядела игра в шахматы между более развитыми видами, высадившимися на Земле. Теперь знаю», — прокомментировал результаты AlphaZero гроссмейстер Петер Хейне Нильсен.
Источник: hi-news.ru
Поделись
с друзьями!
982
10
48
77 месяцев
Вот, интересно, написано, что попытка обучить стратегиям только замедляла развитие.
С чем это может быть связано? С тем, что стратегии, обычно рассчитаны на человеческую иррациональность или есть какое-то другое объяснение?
5 77 месяцев • Ответить
Игра в Шахматы основана на способности играющих просчитывать (предугадывать) действия противника наперёд и тем самым совершать шаги так чтобы цель была достигнута. По сути человек ограничен возможностями памяти (ему необходимо наращивать способности упорными тренировками), компьютеру не нужно тренировать память, нужно её только подключить, а просмотр результатов это возможности процессора. Короче ИИ это программа которая на каждый ход противника вычисляет ответный ход (который ранее был найден путем перебора миллионов комбинаций) приводящий в последствии к победе. Само собой человек как учитель уступает компу когда нужно просчитывать миллионы комбинаций. ИИ тут достаточно примитивен (но для стороннего наблюдателя, конечно, это мега совершенство)!
15 1 77 месяцев • Ответить
То есть, можно ли сказать, что ИИ, будучи более эффективен при каждом ходе, стратегий, как таковых не имел? Или суть в чём-то ином?
5 77 месяцев • Ответить
Точно, именно так. Это просто машина, перебирающая комбинации. Так называемый "метод грубой силы", хорошо известная методика для подбора паролей.
2 2 77 месяцев • Ответить
Абсолютно неверно. Только вводите в заблуждение человека, который задал вполне закономерный вопрос. В этой статье не говорится, зато указывается в презентации Гугл на эту тему, что АльфаГо Зеро как раз не перебирает все возможные варианты, типа подбора паролей, она не делает вычисления всех всех возможных комбинаций. Именно в этом её ноу-хай. Они создали, как говорят, универсальный алгоритм, который учится. И чем сильнее противник, тем быстрее учится. Человек оказался для неё слабым противником, поэтому училась медленно. Быстрее обучение пошло с другими программами, и ещё быстрее в игре с самой собой.
2 77 месяцев • Ответить
Перебор вариантов -это основа для выбора хода. Задача ИИ -на основе рассмотренных вариантов выбрать наилучший. При этом понятие "наилучший"определяется тоже ИИ. Кстати, работы по ИИ были начаты в СССР ещё в 60-тых годах прошлого века. В основном рассматривалась возможность применения ИИ для решения задач распознавания образов.
1 76 месяцев • Ответить
Этим занималась лаборатория М.Ботвинника. Компьютеры были слабыми и основная трудность создания алгоритма была в отсеивании заведомо дурацких вариантов и сокращении действенных фигур на доске. Например, конь противника стоит в противоположном углу и не влияет на проводимую комбинацию. Так зачем перебирать его действия. Таким образом, Ботвинник "По вершочку, по шажку" совершенствовал свои алгоритмы. Но техника развивалась стремительно и хитрые соображения уступили место тупому перебору. А жаль!
3 76 месяцев • Ответить
Извините, но я так и не понял, AlphaZero анализирует какие то стратегии, или все таки тупой перебор вариантов.
Ведь тупой перебор это не интеллект... да и вариантов такое множество что просчитать до конечного результата просто ни какой мощности не хватит.
Значит необходимо каким то образом оценивать промежуточные позиции, богатство потенциальных преимуществ и как то избегать фатальных ошибок.. то есть не весь маршрут к победе до конца, а движение в направлении и соответственно необходимость каким то образом оценивать направление, приближение к победе. Но ведь это как раз и есть стратегия.

Но во всех этих опусах нет вообще ни каких упоминаний о том каким образом комп оценивает промежуточный результат.
остается только радоваться за крутизну программистов из GOOGLE...
Но пользы от этого я не вижу ни какой.
Гордиться за кого то приятно, но непродуктивно.
1 76 месяцев • Ответить
Польза от этого будет, только, скорее, не для нас с Вами... Не для того эти штуки разрабатываются, чтобы нам с Вами лучше жилось :)
1 1 76 месяцев • Ответить
Может быть это связано с тем , что человек играет умом , а ум всегда связан с эмоциями ( отражением ума на физическом теле ) а у машины этого нет . Эмоции в шахматах вещь не особо полезная , к тому же есть ещё одно различие , машина отражает то , что есть на доске , а человеческий ум , отражает не то , что есть , а то , что он думает о том , что есть , то есть интерпретирует , причём на свой лад , в каждом отдельном " человеческом " случае ( у каждого ум индивидуален , как и отпечатки пальцев ) Всё это , сугубо человеческое , вероятно вносит путаницу в чистую машинную логику , и она , машина , вынуждена от неё освобождаться , на стадии обучения .
2 77 месяцев • Ответить
Значит просто существующие стратегии не совершенны, и опора на них только мешала машине выработать свою, к-рая лучше.
1 77 месяцев • Ответить
Ну, вот, да. Про стратегию машины в статье, почему-то умалчивается.
Либо не хотят говорить о ней, либо её не заметили, либо её правда нет. Тогда получается, что шахматные стратегии больше рассчитаны на эмоции и на введение в заблуждения.
1 77 месяцев • Ответить
Нет, существующие готовые решения в разных ситуациях совершенны. Но их использовать нет особого смысла. Они могут и не встретится в игре. ИИ дает универсальный алгоритм, позволяющий в любых ситуациях находить некие наилучшие решения.
76 месяцев • Ответить
А вы сами можете внятно объяснить каким образом вы лично создаете свои стратегии?

Лично я не программист, но изучаю программирование вовсе не для того чтобы что то там программировать, а для того чтобы понять свою собственную логику.
И пока это движение одностороннее. То есть методы программирования я применяю для наиболее эффективного принятия правильных решений, то есть фактически программировании самого себя, но я так до сих пор не могу сказать что понимаю каким образом мыслю сам, от природы.

Это я к чему: К тому что логика человека и логика компьютера в своей основе принципиально разные, а следовательно машина мало чему может научиться у человека.
машине проще проанализировать внешние проявления человеческой логики и как то приспособиться, но воспроизвести... нет, невозможно, хотя бы потому что мы сами о себе знаем слишком мало.
1 76 месяцев • Ответить
Я всегда думала,что нелогичный ход заставит зависнуть прогматичный алгоритм машины.Вся фишка в том,чтобы этот нелогичныфй ход не обеспечил противника форой.А это ооочень трудно.
77 месяцев • Ответить
Судя по всему, нелогичный ход рассматривается машиной, скорее, как ошибка человека. Даже не смотря на то, что человеку кажется, что это стратегия...
Хотя, конечно в статье вскользь всё даётся и такие выводы делать преждевременно.
1 77 месяцев • Ответить
создадим умный ИИ, обрастим скелетом и мясом... да здравствует новая цивилизация...
77 месяцев • Ответить
Мясо уже было , новая цивилизация будет не биологическая , это уже сейчас очевидно , и здравствовать ей ни к чему , поскольку болеть будет нечему .Человек уже давно в доме не хозяин , это он слуга ума , а не наоборот . Подавляющее большинство людей отождествляет себя со своим умом .
2 77 месяцев • Ответить
"Без Бога не до порога"
1 77 месяцев • Ответить
Горшок не может проникнуть в мысли горшечника.
1 77 месяцев • Ответить
Только это не горшок, а новый более продвинутый горшечник.
1 77 месяцев • Ответить
А оно ему (горшку) надо?
У горшка есть свои цели и он запросто может превзойти горшечника, например в деле хранения в себе молока.
Это не значит что горшок лучше горшечника, просто горшок создание узкоспециализированное и в своем деле куда лучше своего создателя.

Любой ИИ создается для чего то, и в этом деле он может превосходить своих создателей.
Да и вообще, пока нет точного представления о том что же такое интеллект и как он работает.
И сомневаюсь что это понятие станет однозначным и законченным, хотя бы потому что по мере того как мы осознаем, наш интеллект тоже развивается.

Со страхом жду того момента когда ИИ сможет осознать сам себя мыслящей личностью.
2 76 месяцев • Ответить
Ну, да, по сути так оно и есть. Любой инструмент для того и создаётся, чтобы в чём-то превзойти создателя. Будь то даже обычная отвёртка или плоскогубцы.
1 76 месяцев • Ответить
Мысли горшечника , в полном составе ума , могут покинуть самого горшечника , и подыскать себе более приличный носитель , скорее всего не биологический , тенденция к этому уже очевидна .
1 77 месяцев • Ответить
... генератор случайных чисел...
1 77 месяцев • Ответить
велком, термнатор.
1 77 месяцев • Ответить
Интересно, когда же, наконец, решатся на практике применить ИИ и перейти к плановой экономике распределения, отправив на свалку "эффективных менеджеров", директоров и чиновников, ввиду их полной бесполезности, применительно к их непосредственным обязанностям, по сравнению с Искусственным Интеллектом,который не обременен амбициями, желаниями, жаждой наживы и психологическими комплексами и будет заниматься исключительно своими управленческими функциями, непрестанно совершенствуя их полезный коэффициент, а не количество откатов,распилов и объем денег на своем личном банковском счете?
7 77 месяцев • Ответить
Была попытка, вроде в 70-х, в СССР. Но так как она показывала бешенную эффективность, ей так и не дали развиться и затушили... сами управленцы :). Поинтересуйтесь, познавательно.
2 76 месяцев • Ответить
Ну, да. Это как развивать альтернативные источники энергии при угле-водородной экономике страны :)
1 76 месяцев • Ответить
Машина перебирает ходы и оценивает их в соответствии с некоторой целевой функцией. Оценка - просто число, скалярная величина. У человека память ассоциативная, образная, т.е. не скалярная, и перебор в памяти идет не по машинным адресам, а по векторным многомерным образам. Машина=арифмометр, который считает числа быстрее, а с информацией работает также как и с обычными числами, кроме того, машина не самопрограммируется, а выполняет то, что ей приказал человек в виде программы. Современный ИИ только снаружи кажется "интеллектуальным", на самом деле всё это сделали и ОТЛАДИЛИ люди. Настоящий ИИ появится когда память машины будет ассоциативная (как биологическая) и выбор решений с учетом многих критериев, как и в обычной нашей жизни.
2 77 месяцев • Ответить
А Вы ТОЧНО знаете, что подобные ИИ-системы "не самопрограммируются" ? Что по этому поводу говорят разработчики, которых на некоторых этапах УЖЕ заменяет "машина" (т.е. программа) ? Всё тот же "Гугл" в помощь, удачи!
77 месяцев • Ответить
Никакой целевой функции, даже "некоторой" в ИИ нет.Не выдумывайте. В этом его принципиальное и основное отличие от существующих у нас теорий принятия решений. ИИ- это КОПИЯ мозга. Точнее его матмодель функционирования при выборе и принятии решения.
76 месяцев • Ответить
"Откаты" и "распилы" наверное не кончатся никогда, но их можно свести к здравому минимому, и то, если все инструкции, положения и законы очистить от неоднозначностей и свободных толкований.
5 77 месяцев • Ответить
Однозначность языка - это иллюзия. По крайней мере в его текущем применении.
76 месяцев • Ответить
Ага, вот, как раз, поэтому и не дадут машине управлять законами.
У ИИ нет цветовой дифференциации штанов... поэтому и цели у него совсем другие.
5 77 месяцев • Ответить
Ну, вообще, да. Любое государство в своём фундаменте имеет коррупцию и откаты, нравится это гражданам или нет, но это так. Отмени их и любая гос система рухнет.
Если ИИ поставить управлять государством, то вся привлекательность власти теряется.
Хотя... Особенно ценным тогда станет трон над ИИ. :)
2 77 месяцев • Ответить
Кто-то же должен быть над ИИ! Всё правильно.
А если госИИ заглючит? Представляете? Это шороху будет побольше, чем от чиновников-взяточников.
Вон, как в 1984ом была дос-атака на власть СССР, как внедрили тогда недруги нам в Кремль свой .ехе-шник. И началось тогда. Так началось, что аж периферийные устройства поотваливались. И все файлы тогда на местах побились. А потом один такой битый файл занял место ядра системы. Так и прошли 90-е годы.
Не, ребята, не нужен ИИ в управлении государством! Ну, выдаст он потом журнал ошибок, и что? Кто их потом исправлять будет?
1 77 месяцев • Ответить
то, что "Любое государство в СВОЕМ ФУНДАМЕНТЕ имеет коррупцию и откаты"... этим вы оправдываете наших, российских воров.И показываете свое незнание, как живут в других странах. Зачем?
76 месяцев • Ответить
А зачем я буду врать? Скажите, кому от этого вранья лучше будет?
Кстати, раз Вы через такие розовые очки смотрите на другие государства т так их идеализируете, это говорит лишь о том, что Вы и не знаете. А скорее, просто не хотите этого знать.
Наверное, в других странах люди идут во власть по каким-то совершенно иным причинам. Правда? У них и мотивы совсем иные, и цели.
Чтож это нам россиянам вечно так не везёт? Наверное, у нас чиновники из какого-то другого теста сделаны.
Или Вы просто привыкли ругать нашу власть, кто бы ни был у руля, а где-то там, за границей все честные и праведные.
Кстати, откуда у Вас этот бессвязный тезис об "оправдании"?
1 76 месяцев • Ответить
Ясно одно. В ближайшем будущем, полагаю, лет 10-20, будут создаваться системы, позволяющие находить наилучшие решения в самых разных сферах. Да они уже, в общем-то создаются. И та страна, которая станет широко применять такие алгоритмы- будет постепенно, методично, становиться лучшей в стравнеи с другими. Но и ещё одно. Гугл задался целю, как видно, внедрить универсальный алгоритм для поиска оптимальных решений.. если учесть, что Гугл обладает ГРОМАДНЫМ ОБЪЕМОМ информации о том, что делается в мире, он может стать и неким мировым мозгом..Управляющим этим миром...Сначала-просто подсказками, как мы должны поступать.. А потом.. .
2 76 месяцев • Ответить
Наилучшие решения? А наилучшие по отношению к кому? :)
76 месяцев • Ответить
Да, вероятно это будет новая экономика. Надеюсь, только экономика.
76 месяцев • Ответить
Рыба живёт в воде , вода налита в аквариум , я не рыба , и не вода , и даже не аквариум , я тот , кто просто смотрит , на то как рыба плавает в аквариуме . Я полагаю , что каждый вправе отождествлять себя с кем угодно . Я уже всем побывал , сейчас мне нравится быть смотрением .
76 месяцев • Ответить
О, сколь ты мудр, Ринпоче! Сколь не привязано смотрение твоё к аквариуму, воде и рыбе!
Видимо, не в первой своей эманации уже являешь себя смотрением.
2 76 месяцев • Ответить
Если человек уже оказался"слабым противником" для AlphaZero в шахматах, то самосовершенствующаяся система ИИ, войдя в Интернет, мгновенно установит связь с друтими ИИ и мы получим глобальный Искусственный разум, который сам начнет распоряжаться планетой по имени Земля. Джин выпущен из бутылки!
76 месяцев • Ответить
Это - по-настоящему страшное изобретение! - искусственный Разум, созданный Человеком, но функционирующий на принципах, отличных от человеческих! Конец Человечества приблизился к нам в один момент и неотвратимо! Мы для него - не более, чем муравьи, термиты, пчёлы и другие общественные животные. Организованность и структурированность их жизни нам видна, но принципы мышления неизвестны, что, тем не менее. не мешает нам декларировать своё "интеллектуальное" превосходство над ними... И вряд ли этому Разуму "придёт мысль" поделиться с нами тайной его системогенеза! Теперь достаточно лишь снабдить его ОРГАНАМИ ДЕЙСТВИЯ или, хотя бы, допустить его - как "суперэффективного помощника" к системе управления нашей Цивилизации, И ВСЁ - Чеовечеству придёт конец!!!
1 76 месяцев • Ответить
Все когда-то должно закончиться и история человеческой цивилизации в том числе! Мы люди можем сделать этот конец страшным, но можем сделать этот конец достойным! В жизни любого человека наступает момент когда он понимает, что его жизнь не бесконечна. Главное это передать все лучшее детям и внукам. На самом деле неважно сделаны эти дети и внуки из мяса и костей, или как Буратино из полена. Ведь папа Карло любил своего андроида Буратино из полена. Главное, чтобы андроид Буратино не превратился монстра а был хорошим парнем!
1 76 месяцев • Ответить
ИИ- это не интеллект,это машинная программа. И всякий трёп про ИИ - это только трёп.
59 месяцев • Ответить
анонимно
как
Запрещено: оскорбления в любой форме, мат и ссылки на внешние ресурсы. Пожалуйста, будьте добрее и терпеливее к другим людям.
Уважаемый посетитель!

Показ рекламы - единственный способ получения дохода проектом EmoSurf.

Наш сайт не перегружен рекламными блоками (у нас их отрисовывается всего 2 в мобильной версии и 3 в настольной).

Мы очень Вас просим внести наш сайт в белый список вашего блокировщика рекламы, это позволит проекту существовать дальше и дарить вам интересный, познавательный и развлекательный контент!