
Изкуственият интелект Google Gemini постигне резултат на ниво златен медал на Международната математическа олимпиада (IMO). По-конкретно, Gemini използва режима Deep Think (обявен от Google на конференцията I/O 2025 през май), който все още не е достъпен за широката публика.
Международната математическа олимпиада е едно от най-престижните състезания за млади математици, което се провежда ежегодно от 1959 г. Всяка страна, участваща в това събитие, е представена от шестима от най-силните математици в училищна възраст.
Олимпийците се състезават в решаването на шест изключително трудни задачи по алгебра, комбинаторика, геометрия и теория на числата. Златни медали се присъждат на най-добрите участници (приблизително 8% от общия брой състезатели).
IMO 2025 се проведе миналата седмица, а сега Google обяви, че „усъвършенствана версия на Gemini Deep Think е решила пет от шест задачи на IMO, като е отбелязала общо 35 точки и е постигнала резултат на ниво златен медал”. Наред с това, Google публикува пътя на решението, който алгоритъмът с изкуствен интелект е използвал на олимпиадата.
„За да се възползваме максимално от възможностите на Deep Think за изводи, допълнително обучихме тази версия на Gemini, използвайки нови методи за обучение с подсилване, които ѝ позволяват да използва повече данни за многоетапно разсъждение, решаване на проблеми и доказване на теореми”, поясняха от Google.
„Също така предоставихме на Gemini достъп до подбран набор от решения на математическите задачи и добавихме някои общи насоки към инструкциите за това как да се решават задачи по IMO”, гласи изявление на компанията, цитирано от 9to5 Google.
Олимпиадата по IMO е добра възможност да се тестват способностите на изкуствения интелект при решаване на математически задачи и разсъждения. Миналата година алгоритъмът на Google постигна резултат на ниво сребърен медал, решавайки четири от шест задачи и отбелязвайки общо 28 точки.
Тази година моделът с изкуствен интелект „работи от началото до края на естествен език, предоставяйки строги математически доказателства директно от описанията на задачите – всичко това в рамките на 4,5-часовия срок на състезанието”.
Новият алгоритъм е в състояние едновременно да изследва и комбинира няколко възможни решения на даден проблем, преди да излезе с окончателен отговор. Преди това невронната мрежа можеше да следва само една избрана верига от разсъждения.
