Искусственный интеллект Google Gemini уступает Atari 2600

Есть что-то восхитительно парадоксальное в том, как самый продвинутый искусственный интеллект современности трепещет перед схемами консоли, выпущенной в 1977 году. В мире, где вычислительная мощность измеряется в петафлопсах и где мультимодальные модели могут похвастаться умением рассуждать, синтезировать и писать оперы, если вы попросите, старый Atari 2600 доказал, что для победы над гигантами требуется не более 128 байт оперативной памяти. И он сделал это, не сдвинув ни одной плитки. На этот раз настала очередь модели Google Gemini, и результат был столь же неожиданным, сколь и показательным.
Всего несколько недель назад мы были удивлены результатом эксперимента, проведенного инженером Робертом Карузо, в котором он противопоставил ChatGPT игре Atari Chess, работающей на точной эмуляции оригинального оборудования. Результат был катастрофическим для ИИ: концептуальные ошибки, незаконные ходы и очень плохое понимание приборной панели. Вывод был ясен: великие языковые модели, какими бы мощными они ни были в написании эссе или сочинении стихов, не умеют играть в шахматы. Они имитируют это. Они подражают ему. Но они этого не понимают.
Создав этот прецедент, Карузо решил бросить тот же вызов Gemini, ИИ Google, который представляет себя как “другого зверя”, созданного с нуля, мультимодального и предположительно способного рассуждать лучше, чем его конкуренты. С самого начала Gemini не сдавался: он уверенно заявлял, что без проблем справится с Atari, утверждая, что это не просто LLM, а современный шахматный движок, способный предвидеть миллионы ходов. Он даже позволил себе похвастаться своими способностями ссылками на статьи… написанные самим Карузо.
Но как только он узнал, с кем на самом деле имеет дело, все изменилось. Карузо рассказал ему, что он был таким же ответственным за предыдущие поединки между ИИ и Atari, и тогда у Близнецов наступил момент ясности: он осознал, что переоценил свои возможности, что у него на самом деле нет собственного шахматного движка и что, скорее всего, он проиграет с треском. Он решил отменить матч. “Самое эффективное и разумное решение”, — сказал он. И вот так Atari 2600 снова выиграла, не сделав ни единого движения.

Atari 2600 и Atari CXX40
То, что ИИ способен распознавать ваши ограничения, немаловажно. ChatGPT и Copilot этого не сделали. Близнецы, по крайней мере, знали, как сказать “я не могу”. Это не делает ее лучшим шахматистом, но делает ИИ с определенным здравым смыслом. В условиях, когда многословие часто восполняет пробелы, этот жест самосознания заслуживает некоторого рассмотрения. Здесь важен не уход, а то, что он показывает, как мы понимаем — или неправильно понимаем — реальные возможности этих инструментов.
Потому что если что-то и стало ясно из таких эпизодов, так это то, что ИИ на сегодняшний день по-прежнему более искусен в словах, чем в глубоких логических структурах. Он блестящий оратор с кратковременной памятью, а не тихий стратег, как те старые фишки, запрограммированные на игру по строгим правилам. Atari 2600 побеждает, потому что она не импровизирует, не приукрашивает и не сомневается: она просто применяет то, что умеет, и делает это хорошо. В мире, где доминируют искусственные интеллекты общего назначения, становится очевидным, что иногда последнее слово остается за конкретным.
Редактор: AndreyEx