ChatGPT загуби на шах от близо 50-годишна конзола

ChatGPT допуска достатъчно грешки, за да му се смеят в шахматния клуб на трети клас
(снимка: CC0 Public Domain)

Чатботът с изкуствен интелект ChatGPT, въпреки цялата си изчислителна мощност и възможности, неочаквано загуби на шах от близо 50-годишна игрова конзола, пусната на пазара миналия век – през 1977 г.

Робърт Карузо-младши, инженер в Citrix, реши да противопостави ChatGPT на емблематичната игрова конзола Atari 2600 от 1977 г., подтикнат от самия чатбот. Конзолата използва процесор с тактова честота малко по-висока от 1 MHz.

Карузо обаче не използва оригиналната конзола, а емулатора Stella. В крайна сметка, в играта Atari Chess цялата мощ на изкуствения интелект ChatGPT не му помага да победи древния 1,19 MHz процесор.

Чатботът постоянно се обърква, губи, прави ужасни ходове, иска да рестартира играта и дори обвинява лошата стилизация на шахматните фигури за своите неуспехи.

Въпреки че му е дадена основна подредба на дъската за идентифициране на фигури, ChatGPT бърка топове с офицери, пропуска разклонения на пешки и непрекъснато губи фигури – първо обвинявайки иконите на Atari, че са твърде абстрактни за разпознаване, а след това не се справя дори след преминаване към стандартна шахматна форма.

ChatGPT допуска достатъчно грешки, за да му се смеят в шахматния клуб на трети клас. Междувременно скромният 8-битов процесор на Atari просто си върши работата. Няма езиков модел. Няма фойерверки. Просто груба оценка на дъската и инат от 1977 г.

„В продължение на 90 минути трябваше да спирам изкуствения интелект да прави ужасни ходове и да коригирам осведомеността му за дъската няколко пъти на ход. Той непрекъснато обещаваше, че ще се подобри, „ако просто започнем отначало”. В крайна сметка дори ChatGPT осъзна, че е победен – и се отказа с наведена глава”, споделя Карузо-младши.

Защо ChatGPT изпитва толкова трудности да играе този вид шах, не е напълно ясно, но ни напомня за пореден път, че съвременните големи езикови модели, въпреки всичките си възможности, са много специфични и със сигурност не са всемогъщи софтуерни решения.

Коментар