Как новият AI модел на Китай DeepSeek застраши доминацията на САЩ
Малко известна лаборатория за изкуствен интелект в Китай е предизвикала паника в Силициевата долина след пускането на AI модели, които могат да изпреварят най-добрите в САЩ, въпреки че са изградени по-евтино и с по-слаби чипове, пише CNBC.
КЛЮЧОВИ ФАКТИ
- Лабораторията, наречена DeepSeek, представи безплатен, отворен източник на голям езиков модел в края на декември, за който се твърди, че е изграден за само два месеца и по-малко от 6 милиона долара, използвайки чипове с намалена мощност от Nvidia, наречени H800s.
- Новите разработки предизвикаха тревога относно това дали глобалното лидерство на САЩ в изкуствения интелект се стеснява и поставиха под въпрос огромните разходи на големите технологични гиганти за изграждане на AI модели и центрове за данни.
- В серия от тестове на трети страни моделът на DeepSeek надмина Llama 3.1 на Meta, GPT-4 на OpenAI и Claude Sonnet 3.5 на Anthropic по точност, обхващаща от решаване на сложни проблеми до математика и програмиране.
- В понеделник DeepSeek пусна модел r1, който също надмина последния модел o1 на OpenAI в много от тези тестове.
- DeepSeek също е трябвало да преодолее строгите ограничения на полупроводниците, наложени от американското правителство на Китай, като го лиши от достъп до най-мощните чипове, като H100s на Nvidia.
- Последните постижения показват, че DeepSeek или е намерил начин да заобиколи правилата, или че експортните ограничения не са се оказали толкова ограничителни, колкото Вашингтон е възнамерявал.
ВАЖЕН ЦИТАТ
„Да видиш новия модел на DeepSeek е наистина впечатляващо. Ефективно са създали отворен модел, който прави изчислителен процес в реално време, и е много ефективен по отношение на изчисленията“, заяви изпълнителният директор на Microsoft Сатя Надела на Световния икономически форум в Давос. „Трябва да приемем разработките от Китай много, много сериозно.“
ЗА КАКВО ДА СЛЕДИМ
Малко се знае за лабораторията и нейния основател, Лианг ВенФенг. DeepSeek е създадена от китайски хедж фонд на име High-Flyer Quant, който управлява около 8 милиарда долара активи, според медийните доклади.
Но DeepSeek не е единствената китайска компания, която прави напредък.
Водещият изследовател в областта на AI, Кай-Фу Ли, е заявил, че неговият стартъп 01.ai е обучен с едва 3 милиона долара. Майката на TikTok, компанията ByteDance, в сряда пусна обновление на своя модел, който твърди, че надминава o1 на OpenAI в ключов тест.
„Необходимостта е майка на изобретението“, каза изпълнителният директор на Perplexity, Аравинд Сринивас. „Тъй като трябваше да намерят начини да заобиколят ограниченията, всъщност те изградиха нещо много по-ефективно.“