Как DeepSeek и следващото поколение AI агенти могат да намалят стойността на езиковите модели
Големи езикови модели като тези, разработени от Microsoft и OpenAI, са на път да се превърнат в стока през тази година на фона на бързия напредък към агенти на изкуствения интелект (AI) от следващо поколение и по-пъргавите им конкуренти с отворен код, смятат високопоставени технологични мениджъри.

Миналата седмица китайската фирма за изкуствен интелект DeepSeek пусна R1 – модел за разсъждаване с отворен код, който твърди, че може да се конкурира с модела o1 на OpenAI както по цена, така и по производителност. Под „отворен код“ се разбира софтуер, чийто изходен код е свободно достъпен в отворената мрежа за възможни модификации и разпространение.
Тази седмица нарастващата осведоменост за новия модел на DeepSeek доведе до сериозен спад в акциите на Nvidia и други технологични гиганти, тъй като инвеститорите се опасяваха от евентуално намаляване на разходите за мощните графични процесори, необходими за обучението и изпълнението на усъвършенствани задачи с изкуствен интелект.
В понеделник Nvidia загуби близо 600 млрд. долара пазарна капитализация – най-големият еднодневен спад за която и да е компания в историята на САЩ.
Междувременно всички ръководители и учени във водещи лаборатории за AI говорят за преминаване от големи езикови модели към така наречените „агенти на AI“, които могат да извършват действия от ваше име.
Моделите на езика (LLM) са основополагащата технология, която стои зад днешните генеративни приложения за AI. Експертите обаче смятат, че тласъкът към агентичните системи за изкуствен интелект – които включват технологията LLM – през тази година ще намали стойността на тези модели.
Комерсиализация на LLM
Очаква се в близко бъдеще LLM да се превърнат в стока, тъй като технологиите стават все по-напреднали, а разходите, свързани с обучението и провеждането им, продължават да намаляват.
Томас Волф, съосновател и главен научен директор на Hugging Face, предполага, че LLM ще станат по-интегрирани в интелигентни системи, свързани със собствените бази данни на компанията.
„Мисля, че хората се отдалечават от тази лудост около модела, разбирайки, че благодарение на отворения код – много от тези модели ще бъдат безплатни и свободно достъпни“, каза Волф пред CNBC. Hugging Face е популярно хранилище за код на проекти за изкуствен интелект с отворен код.
„В интернет революцията преминаваме от изграждане на уебсайтове като основен бизнес към изграждане на компании, които са свързани с интернет – например Airbnb на AI, Stripe на AI“, добави той. „Те не са свързани с модела. Става дума за системата и за това как да направите модела полезен за задачите.“
Появата на модела R1 на DeepSeek миналата седмица се разглежда от някои технологични изпълнителни директори като още един показател, че LLM стават все по-консумативни.
R1 включва някои ключови аспекти, които го отличават от другите модели на пазара. Например моделът включва рамка със „смесена точност“, която използва комбинация от 32-битови числа с плаваща запетая с пълна точност (FP32) и 8-битови числа с плаваща запетая с ниска точност (FP8).
Последната се обработва по-бързо, но може да бъде по-малко точна. Вместо обаче да разчита на едното или другото, DeepSeek използва FP8 за повечето изчисления и преминава към FP32 за определени задачи, при които се изисква по-висока степен на точност.
„Тъй като изкуственият интелект става все по-ефективен и достъпен, използването му ще нарасне рязко, превръщайки го в стока, от която просто не можем да се наситим“, каза Сатя Надела, главен изпълнителен директор на Microsoft.
Междувременно Мат Калкинс, главен изпълнителен директор на американската софтуерна фирма Appian, заяви пред CNBC, че успехът на DeepSeek просто показва, че моделите на изкуствен интелект в бъдеще ще се превърнат в стока.
„Според мен ще станем свидетели на превръщането на AI в стока. Много компании ще постигнат конкурентоспособен AI, а липсата на диференциация ще бъде лоша за първите, които правят големи разходи“, каза Калкинс.
Какво представляват агентите на AI?
През последните две години голяма част от вниманието беше насочено към продукти, задвижвани от LLM, от генеративни чатботове с изкуствен интелект като ChatGPT на OpenAI до инструменти, които могат да създават изображения и видео съдържание.
Генеративните приложения, базирани на LLM, като ChatGPT, разчитат на известна помощ от страна на потребителите, за да им подсказват непрекъснато резултатите, докато за разлика от тях агентите на изкуствен интелект са проектирани да бъдат по-ориентирани към действия.
Ако например искате да си запишете час при лекар, можете да поискате от ChatGPT информация за най-близките практики на общопрактикуващите лекари – подобно на начина, по който правите справки в интернет с помощта на търсачката на Google.
В бъдеще технологичните специалисти прогнозират, че следващото поколение изкуствен интелект ще включва агенти, които ще могат да откриват къде се намира най-близкият ви личен лекар, да предоставят свободни часове за лекаря и да ви записват час – всичко това директно в рамките на една платформа. Очаква се това да промени начина, по който взаимодействаме с интернет.
„През десетилетията, откакто е изобретена мрежата, стандартният интерфейс от уебстраници и менюта не се е променил много“, каза Боби Блумоф, главен технологичен директор на Akamai.
„Живеем в тази тирания на привързаност към екрана и привързаност към уеб страници и менюта, които трябва да помним как да навигираме.“
Преминаване от модели към агенти
Миналата седмица Артур Менш, главен изпълнителен директор на Mistral, заяви, че според него „фокусът трябва да се измести към системи“, които интегрират както езикови модели, така и контекстуални бизнес данни.
„Това е мястото, където се измества“, каза Менш.„Това също така означава, че индустрията, която го приема, ще дестилира своя опит в тези системи – и това е мястото, където това ще бъде необходимо, за да се стимулира стойността на AI в тези индустрии.“
Mistral, която е подкрепена от Microsoft, бързо се превърна в една от най-нашумелите фирми за изкуствен интелект в Европа. Основана само преди две години, тя за последен път бе оценена от инвеститорите на около 6 млрд. долара през юни 2024 г.
Тенденцията за използване на агенти вече е набрала значителна популярност. Миналата седмица OpenAI пусна свой собствен агент, наречен Operator. OpenAI го описва като „агент, който може да отиде в интернет, за да изпълнява задачи вместо вас“, като добавя, че е обучен да взаимодейства с „бутоните, менютата и текстовите полета, които хората използват ежедневно“ в интернет.
Microsoft, който е инвестирал милиарди долари в OpenAI, сам пусна агенти с изкуствен интелект през ноември.
Anthropic, подкрепен от Amazon стартъп за изкуствен интелект, основан от бивши ръководители на изследователската дейност на OpenAI, миналата година представи „използване на компютри“, което е способност, позволяваща на агентите му за изкуствен интелект да използват компютри като хора за изпълнение на сложни задачи.
Дарио Амодей, главен изпълнителен директор на Anthropic, заяви, че „Computer Use“ трябва да се разглежда като предшественик на „по-широка визия“, която интегрира тези агенти с широко използвани приложения.
„Планираме тази година, през 2025 г., да създадем нещо, което наричаме „виртуален сътрудник“ – каза Амодей, описвайки го като „агент, който работи на вашия компютър“.
„Можете да му давате задачи. Можете да кажете: „Напиши тази функция за това приложение“, и то ще напише някакъв код, ще го компилира, ще го провери, ще говори с колегите си в Slack, Google Docs или на друга платформа“, обясни шефът на Anthropic.
Anthropic планира постепенно да изгради части от тази визия през следващата година – като все пак гарантира, че тя е „безопасна и контролируема“, добави Амодей.
Пол О’Съливан, главен технологичен директор на Salesforce за Великобритания и Ирландия, прогнозира, че вербалната комуникация ще придобие все по-голямо значение в новия свят на агентите с изкуствен интелект. Salesforce вероятно е в началото на играта с агенти с AI, тъй като пусна собствената си система Agentforce през септември преди Microsoft, OpenAI или Anthropic.