Nvidia събра AI център за данни в настолна кутия от 1.2 килограма
Nvidia започна доставките на новата си компактна система DGX Spark на 15 октомври 2025 г., предоставяйки възможностите на AI модел с до 200 милиарда параметъра директно на бюрата на технологичните ръководители за цена от 3 999 долара. Устройството е с размери 150 мм на квадрат и тежи 1.2 килограма, но предлага изчислителна мощ, която досега беше запазена за сървъри, монтирани в големи шкафове.

КЛЮЧОВИ ФАКТИ
- DGX Spark предоставя 1 петафлоп изчислителна мощ при FP4 прецизност, еквивалент на 1000 трилиона операции с плаваща запетая в секунда.
- Унифицираната памет е 128 GB и позволява зареждане на големи езикови модели без забавяния от прехвърляне на данни между централен процесор (CPU) и графичен процесор (GPU).
- Системата поддържа 1TB или 4TB NVMe дисково пространство с вградено криптиране и мрежови възможности, включително Wi-Fi 7, 10Gb Ethernet и QSFP56 портове за връзка между две устройства.
- DGX Spark работи с DGX OS – персонализирана Ubuntu Linux дистрибуция с предварително инсталирани CUDA библиотеки и AI рамки като PyTorch и TensorFlow.
ВАЖЕН ЦИТАТ
„DGX Spark предлага междинно решение между локално прототипиране на модели и облачно внедряване, като позволява на организациите да оптимизират AI архитектури преди мащабни производствени изчисления“, казаха от Nvidia.
КЛЮЧОВА ИСТОРИЯ
Организациите, разработващи AI, обикновено разчитат на облачни GPU инстанции или собствени сървърни ферми. DGX Spark предоставя алтернатива, която позволява локално фино настройване на модели и прототипиране, преди те да се преместят в облака или на сървърни клъстери. Това става особено важно, тъй като предприятията преминават от пилотни проекти към реални AI внедрявания, които изискват многократни итерации на разработка.
Суперчипът GB10 Grace Blackwell комбинира 20-ядрен Arm процесор с GPU с архитектура Blackwell, споделяйки 128 GB унифицирана памет. Това елиминира нуждата от прехвърляне на данни между CPU и GPU, което обикновено забавя обработката на големи модели. DGX Spark може да се свързва с второ устройство, за да поддържа разпределено изчисление на модели до 405 милиарда параметъра.
Устройството се използва основно за прототипиране на модели, фино настройване на AI архитектури между 7 и 70 милиарда параметъра, генериране на синтетични данни и локално обучение на компютърно зрение преди edge внедряване. Въпреки компактния си размер, системата се сблъсква с предизвикателства при управление на топлината и изисква оригиналния адаптер за оптимална работа.
ПАЗАРНА ПОЗИЦИЯ
Партньори като Acer, Asus, Dell Technologies, Gigabyte, HP, Lenovo и MSI вече доставят персонализирани версии на DGX Spark. Acer Veriton GN100 следва референтната спецификация при същата цена от 3999 долара и е наличен в Северна Америка, Европа и Австралия. Dell насочва своята версия към edge computing внедрявания с локални изчисления при минимална латентност, например за индустриална автоматизация и отдалечени обекти с ненадеждна облачна връзка.
Алтернативни подходи включват работни станции с няколко потребителски GPU, Mac Studio конфигурации с еквивалентна унифицирана памет или облачни GPU абонаменти. Четири Nvidia RTX 3090 осигуряват повече агрегирана памет и throughput при сходна цена, макар и с по-голям разход на енергия и физически размер. Mac Studio M4 Max предлага 128 GB унифицирана памет и по-добра пропускателна способност, започвайки от 4400 долара.
ЗА БИЗНЕСА
DGX Spark е насочен към междинната зона между AI експериментиране на лаптопно ниво и облачни производствени внедрявания. Инвестицията се оправдава, когато организациите изискват локален достъп до големи модели, имат ограничения за съхранение на данни, или извършват достатъчно inference, за да компенсират разходите за облачни GPU.
Системата служи като платформа за разработка – екипите прототипират и оптимизират модели локално, след което ги внедряват в облак или на сървърни клъстери за production inference. Въпреки някои ограничения, като пропускателната способност на паметта и затворения софтуерен екосистемен модел, DGX Spark демонстрира вертикална интеграция на Nvidia от силициеви чипове до софтуерни платформи и предлага на бизнеса тествана и съвместима платформа за AI разработка.
