TechNews.bg
Изкуствен интелектНоваторскиНовиниТоп новини

„Мистериозен“ AI модел се оказа дело на Xiaomi

Hunter Alpha има 1 трилион параметъра и поддържа контекстен прозорец до 1 милион токена

(графика: TechNews.bg)

Мистериозен AI модел, за който първоначално се предполагаше, че е новата версия на DeepSeek, се оказа разработка на Xiaomi. Разкритието подчертава нарастващата конкуренция в китайската AI екосистема и ускоряващия се преход към т.нар. агентни системи. Случаят показва и колко чувствителен е пазарът към дори неофициални сигнали за технологичен пробив.

Мощен модел с изкуствен интелект, появил се „анонимно“ в платформа за разработчици миналата седмица, бе идентифициран като разработка на китайския технологичен гигант Xiaomi. Това сложи край на спекулациите, че DeepSeek тества дискретно следващото си поколение системи преди официално представяне.

Бърз преход от чатбот към агентен модел

Интересът не е случаен. Пускането на евтините модели DeepSeek-V3 и R1 миналата година предизвика глобално разпродаване на технологични акции и постави под въпрос необходимостта американските компании да инвестират милиарди в изчислителна инфраструктура за AI.

Оттогава вниманието е насочено към DeepSeek-V4 – следващо поколение модел, който все още не е официално представен.

Мистериозният безплатен модел, наречен Hunter Alpha, се появи на 11 март в AI платформата OpenRouter. Той бе публикуван без информация за разработчика и по-късно бе описан като „стелт модел“. Това засили спекулациите в индустрията.

Екипът за изкуствен интелект MiMo на Xiaomi, ръководен от бившия изследовател в DeepSeek Ло Фули, обяви, че Hunter Alpha е „ранна вътрешна тестова версия“ на модела MiMo-V2-Pro.

Системата е проектирана да служи като „мозък“ за AI агенти. Това са инструменти, които позволяват изпълнение на сложни задачи с минимална човешка намеса – значително отвъд възможностите на класически чатбот.

Ходът на Xiaomi идва в момент, когато рамката с отворен код OpenClaw за AI агенти набира популярност в Китай. Пазарът очевидно се пренарежда. Фокусът се измества от разговорни интерфейси към автономни системи.

„Наричам го тиха засада – не защото сме го планирали, а защото преходът от чат към агентен модел се случи толкова бързо, че дори ние трудно го повярвахме“, коментира Ло Фули с публикация в X. „Хората питат защо се движим толкова бързо. Видях го от първо лице при разработката на DeepSeek R1“.

Тайнственост и мистерия

Hunter Alpha се самоопределя като „китайски AI модел, обучен основно на китайски език“. Системата посочва, че обучителните ѝ данни достигат до май 2025 г. – същата граница, известна и при моделите на DeepSeek.

Запитан за създателя си, моделът отказва да даде конкретен отговор. „Знам само името си, мащаба на параметрите и дължината на контекстния прозорец“, заявява чатботът.

Според профила му, Hunter Alpha разполага с около един трилион параметъра. Това означава изключително голям мащаб на обучение. Моделът поддържа и контекстен прозорец до един милион токена – показател за обема текст, който може да обработва в рамките на една сесия.

„Комбинацията, която изпъква, е именно този контекст от един милион токена, съчетан със способности за разсъждение и свободен достъп“, казва Набил Хауам – инженер, разработващ AI агентни системи. „Повечето модели от този клас идват със сериозна цена при мащабно използване“.

Подобни характеристики съвпадат с очакванията за DeepSeek-V4, за който китайските медии съобщават, че може да бъде представен още през април. Според Умур Йозкул, който провежда независими тестове на AI модели, връзката с DeepSeek е изглеждала логична предвид времето на появата и заявените възможности.

Анонимни дебюти

Анонимните пускания на модели не са изключение. Платформи като OpenRouter позволяват на разработчиците да тестват системи чрез единен интерфейс към десетки AI модели. Това ги превръща в естествена среда за експерименти.

Подобен случай имаше през февруари. Моделът Pony Alpha се появи анонимно, преди китайската компания Zhipu AI да потвърди, че той е част от системата GLM-5 пет дни по-късно.

Профилът на Hunter Alpha съдържа и важно уточнение. Всички заявки и отговори се записват от доставчика и могат да бъдат използвани за подобрение на модела. Това е стандартна практика в индустрията и ключов механизъм за събиране на реална обратна връзка.

Моделът бързо набра популярност след появата си. По данни на MiMo, той е преминал границата от един трилион обработени токени и е оглавил класациите на OpenRouter.

още от категорията

НАП въвежда българския изкуствен интелект на INSAIT

TechNews.bg

AI съкращения: дали „най-ценният актив“ е тъй лесно заменим?

TechNews.bg

Правителствата масово ще внедрят AI агенти в близките години

TechNews.bg

AI агентите усъвършенстват интуицията си с денонощен труд

TechNews.bg

Отново за AI балона: “Много хора забогатяха бързо и предстои рестарт”

TechNews.bg

Защо възходът на AI агентите носи нов риск за информационната сигурност

TechNews.bg

Коментари