Microsoft обяви най-новия си езиков модел
Microsoft обяви следващата версия на своя по-лек модел с изкуствен интелект Phi-3 Mini – първият от трите малки модела, които компанията планира да пусне на пазара.
КЛЮЧОВИ ФАКТИ
- Phi-3 Mini е по-малък в сравнение с големите езикови модели като GPT-4.
- Phi-3 Mini вече е достъпен в Azure, Hugging Face и Ollama и ще бъде пуснат в два размера в зависимост от броя на променливите, използвани за обучение на системата. Microsoft планира да пусне Phi-3 Small (7 млрд.) и Phi-3 Medium (14 млрд.).
- Microsoft пусна Phi-2 през декември, който се представи също толкова добре, колкото и по-големите модели като Llama 2. Техногигантът твърди, че Phi-3 се представя по-добре от предишната версия и може да осигури отговори, близки до тези, които може да даде модел, 10 пъти по-голям от него.
ВАЖЕН ЦИТАТ
“Phi-3 просто наученото от предишните итерации. Докато Phi-1 се фокусира върху кодирането, а Phi-2 започна да се учи да разсъждава, Phi-3 е по-добър в кодирането и разсъждаването”, заяви Ерик Бойд, корпоративен вицепрезидент на Microsoft Azure.
КЛЮЧОВА ИСТОРИЯ
Новината от Microsoft идва само седмица, след като от Meta също обявиха пускането на усъвършенстван езиков модел с изкуствен интелект – Llama 3. Компанията на Марк Зукърбърг обяви, че Llama 3 има “значително подобрени възможности”, включително способността да разсъждава – повратна точка в битката за постигането на т. нар. “общ изкуствен интелект”.
По всичко личи, че битката на полето на изкуствения интелект ще става все по-ожесточена. Гигантите от Силициевата долина представят следващите си поколения мощни модели с изкуствен интелект, инвестирайки милиарди долари в технологията, след като OpenAI пусна своя чатбот ChatGPT и предизвика фурор.
В сравнение с по-големите си аналози малките модели с изкуствен интелект често са по-евтини и работят по-добре на персонални устройства като телефони и лаптопи. Microsoft създава екип, фокусиран специално върху по-леки AI модели. Конкурентите на Microsoft също имат свои малки модели на ИИ, повечето от които са насочени към решаването на по-прости задачи като обобщаване на документи или помощ при кодиране.