DeepMind AI реши задача на ниво медалист от олимпиада

AI моделите вече решават успешно задачи от математическа олимпиада
(снимка: CC0 Public Domain)

DeepMind, базираният в Лондон изследователски филиал на Google за изкуствен интелект, представи нови модели AlphaProof и AlphaGeometry 2, които могат да решават сложни математически проблеми, непосилни за сегашните AI модели.

По редица причини, решаването на математически проблеми, които изискват усъвършенствани способности за разсъждение, все още не е във възможностите на повечето AI системи. Факт е, че този тип проблеми изискват формиране и използването на абстракции. Освен това е необходимо сложно йерархично планиране, задаване на подцели, връщане назад и намиране на нови пътища, което е трудно за AI.

И двата нови AI модела на Google имат способността да извършват математически разсъждения за решаване на сложни проблеми. AlphaProof е създаден с помощта на подсилващо обучение, придобивайки способност да доказва математически твърдения на официалния език за програмиране Lean. Използван е предварително обучен езиков модел AlphaZero – алгоритъм за обучение с подсилване, който преди това се е научил да играе шах, шоги и го.

От своя страна, AlphaGeometry 2 е подобрена версия на съществуващата система AlphaGeometry AI, представена през януари и предназначена за решаване на геометрични проблеми, съобщи Гардиън.

Докато AlphaProof е обучен да решава проблеми по широк кръг от математически теми, AlphaGeometry 2 е оптимизиран за задачи, включващи движения на обекти и уравнения, с ъгли, съотношения и разстояния. Тъй като AlphaGeometry 2 е обучен на значително повече синтетични данни от своя предшественик, той може да се справи с много по-сложни геометрични проблеми.

За да тестват възможностите на новите AI системи, изследователите на Google DeepMind им възложиха да решат шест задачи от тазгодишната Международна математическа олимпиада (IMO) и да докажат, че отговорите са правилни. AlphaProof реши две задачи по алгебра и една задача по теория на числата, една от които беше най-трудната на олимпиадата, докато AlphaGeometry 2 реши задача по геометрия. Два проблема в комбинаториката останаха нерешени.

Двама известни математици, Тим Гауърс и Джоузеф Майерс, тестваха решенията, предоставени от системите. Те присъдиха на всеки от четирите верни отговора максималния брой точки (седем от седем), давайки на системите общо 28 точки от максимум 42.

Олимпиец, който отбеляза същия брой точки, щеше да получи сребърен медал и би останал на крачка от златото, което се присъжда на тези математици, които са спечелили 29 точки или повече.

За първи път AI система успя да постигне резултати на ниво медал при решаване на математически задачи на IMO. „Като математик намирам това за много впечатляващо и значителен скок над това, което беше възможно преди”, каза Гауърс по време на пресконференция.

Създаването на AI системи, които могат да решават сложни математически проблеми, може да проправи пътя за вълнуващо сътрудничество между човека и AI, смята Кейти Колинс, изследовател в университета в Кеймбридж.

Това, от своя страна, може да ни помогне да научим повече за това как ние, хората, правим математика. „Все още има много неща, които не знаем за това как хората решават сложни математически задачи”, каза Колинс.

Коментар