Sortie du Nvidia DGX Spark

Nvidia vient d’annoncer la sortie du DGX Spark, une petite bĂȘte prĂ©sentĂ©e comme une alternative locale pour le dĂ©veloppement en Intelligence artificielle. AnnoncĂ© en mars 2025, il a fallu attendre le 15 octobre 2025 pour voir les premiers retours d’utilisateurs.
DGX Spark
De mon cĂŽtĂ©, j’avais fait une prĂ©-rĂ©servation dĂšs mars, et depuis je suis restĂ© Ă  l’affĂ»t de toute information.

MĂȘme si je ne l’ai pas encore entre les mains, j’ai lu et analysĂ© beaucoup d’articles pour savoir ce qu’elle vaut vraiment et pour quel usage elle brille
 ou déçoit.

TLDR;

Le Nvidia DGX Spark n’est pas une machine grand public pour « juste utiliser » des modĂšles d’IA en local : pour de l’infĂ©rence pure, elle est souvent moins rapide et plus chĂšre que des alternatives AMD, Mac ou Nvidia classiques.

En revanche, pour le dĂ©veloppement et l’entraĂźnement de modĂšles IA, c’est une machine taillĂ©e pour les pros : silencieuse, compacte, prĂȘte Ă  l’emploi avec un environnement NVIDIA complet, idĂ©ale pour tester, fine-tuner et travailler localement sur de gros modĂšles.

En rĂ©sumĂ© : pas top pour l’infĂ©rence, excellente pour le dĂ©veloppement IA.

Utilisation pour de l’infĂ©rence

Le DGX Spark n’est pas forcĂ©ment la machine la plus rapide pour de l’infĂ©rence “classique”, comme gĂ©nĂ©rer du texte avec un LLM standard. Mais rĂ©duire cette machine Ă  ce seul usage serait injuste : elle brille dans des scĂ©narios plus complexes.
Pour analyser et comparer les performances, on va parler de deux métriques importantes : Token Generation (TG) et Prefill Prompt (PP).

Token Generation (TG) – vitesse de gĂ©nĂ©ration

La métrique la plus souvent citée pour juger une machine en inférence est la vitesse de génération par token. Sur ce critÚre, le DGX Spark se situe derriÚre certaines machines desktop et cartes graphiques haut de gamme, car la vitesse de sa RAM limite la génération pour des modÚles standards.

Plateforme Vitesse mémoire (GB/s)
Apple M4 120 GB/s
Apple M4 Pro 273 GB/s
AMD Strix Halo 273 GB/s
NVIDIA DGX Spark 273 GB/s
Apple M4 Max 546 GB/s
Mac Ultra (M3 Ultra) 819 GB/s
NVIDIA GeForce RTX 3090 936 GB/s
NVIDIA GeForce RTX 4090 1 008 GB/s
NVIDIA GeForce RTX 5090 1 792 GB/s

Si c’est votre critùre le plus important, il y a beaucoup plus rapide chez Apple !

Prefill Prompt (PP) – performance sur prompts longs

Mais la gĂ©nĂ©ration ne se limite pas Ă  un prompt court. Si vous utilisez des prompts trĂšs longs ou des contextes Ă©tendus, comme dans le RAG, l’analyse de gros blocs de code, ou des scĂ©narios multi-LLM, une autre mĂ©trique devient cruciale : le Prefill Prompt (PP).

Ici, le DGX Spark est trĂšs performant. Son CPU puissant et sa grande RAM permettent de traiter des contextes longs sans ralentissement majeur. C’est d’ailleurs aujourd’hui le point faible des Mac pour des tĂąches d’infĂ©rence.

Scénarios avancés et concurrence

La vraie force du DGX Spark se rĂ©vĂšle lorsqu’on exploite sa mĂ©moire massive de 128 Go et sa compatibilitĂ© CUDA :

  • Charger des modĂšles trĂšs lourds (LLM Ă  plusieurs dizaines de milliards de paramĂštres).
  • Faire tourner plusieurs modĂšles simultanĂ©ment, idĂ©al pour des systĂšmes agentiques oĂč plusieurs LLM communiquent entre eux.
  • Avoir un gros contexte.

Comparé à la concurrence :

  • Nvidia desktop (3090, 4090, 5090) : plus rapide pour un LLM unique, mais moins pratique pour des modĂšles massifs ou multiples.
  • Mac : excellente vitesse sur un LLM classique, mais limitĂ© par la RAM et l’absence de CUDA pour l’entraĂźnement.
  • AMD Strix Halo : bon rapport qualitĂ©/prix pour de l’infĂ©rence simple, mais moins adaptĂ© aux scĂ©narios avancĂ©s. Exemple avec un Framework desktop AMD pour un prix simulĂ© Ă  2 754 € : AMD MAX+ 395, 128 Go de RAM LPDDR5x, 4 To de disque SSD.

En rĂ©sumĂ©, le DGX Spark n’est pas un champion pour l’infĂ©rence classique, mais pour des scĂ©narios avancĂ©s ou multi-modĂšles, c’est une machine extrĂȘmement capable. Son vĂ©ritable frein reste le prix : autour de 4 400 €, il faut ĂȘtre prĂȘt Ă  payer pour cette flexibilitĂ© et cette puissance locale.

L’entraĂźnement et le dĂ©veloppement IA

Si le DGX Spark n’est pas forcĂ©ment le meilleur choix pour de l’infĂ©rence classique, c’est sur l’entraĂźnement et le dĂ©veloppement que cette machine rĂ©vĂšle toute sa valeur. Pour les dĂ©veloppeurs IA, c’est un vĂ©ritable petit laboratoire local.

Points forts hardware

Le DGX Spark a Ă©tĂ© conçu pour ĂȘtre Ă  la fois compact et silencieux. On peut le laisser tourner pendant des heures sans bruit ni surchauffe. Sa mĂ©moire massive de 128 Go et son stockage rapide permettent de charger de trĂšs gros modĂšles et de gĂ©rer plusieurs projets simultanĂ©ment, un vrai avantage par rapport Ă  un desktop classique.

Environnement logiciel prĂȘt Ă  l’emploi

La machine est fournie avec une version customisĂ©e d’Ubuntu, prĂȘte pour le dĂ©veloppement IA : Docker, les bons drivers NVIDIA, CUDA
 tout est dĂ©jĂ  configurĂ©. Plus besoin de passer des heures Ă  installer et tester les bons outils.

CĂŽtĂ© logiciels, vous bĂ©nĂ©ficiez de l’écosystĂšme NVIDIA complet, parfaitement intĂ©grĂ© avec Pytorch. Vous pouvez entraĂźner, fine-tuner ou expĂ©rimenter vos modĂšles locaux comme sur un serveur cloud, mais en restant chez vous. Les tutoriels officiels et guides fournis par Nvidia sont d’excellente qualitĂ© et facilitent la prise en main : build.nvidia.com/spark

CapacitĂ©s pour l’entraĂźnement et le fine-tuning

GrĂące Ă  sa puissance, vous pouvez :

  • EntraĂźner des modĂšles lourds localement, sans dĂ©pendre du cloud.
  • Fine-tuner des LLM sur vos propres donnĂ©es.
  • Faire tourner plusieurs modĂšles simultanĂ©ment pour des projets complexes ou des systĂšmes multi-LLM.

La grande mémoire et le CPU performant permettent de travailler sur des contextes trÚs larges, idéal pour les projets de RAG ou les analyses complexes.

Usage distant et serveur local

Vous pouvez Ă©galement accĂ©der Ă  la machine Ă  distance via Nvidia SYNC, ce qui permet de l’utiliser comme serveur local. Cela facilite le travail collaboratif ou l’accĂšs aux modĂšles depuis plusieurs machines sur le mĂȘme rĂ©seau.

Conclusion

En rĂ©sumĂ©, le DGX Spark est une machine pensĂ©e pour les dĂ©veloppeurs IA et les chercheurs. Compacte, silencieuse et prĂȘte Ă  l’emploi, elle offre une expĂ©rience proche d’un environnement cloud, mais en local, avec la libertĂ© de tester, entraĂźner et fine-tuner des modĂšles de maniĂšre flexible et sĂ©curisĂ©e. Si votre objectif est le dĂ©veloppement IA sĂ©rieux, c’est un excellent choix.
PS: ne pas craquer, ne pas craquer, ...

Mon avis

Le Nvidia DGX Spark n’est pas une machine “grand public” pour de l’infĂ©rence simple : pour gĂ©nĂ©rer du texte avec un LLM classique, elle est souvent moins rapide et plus chĂšre que des alternatives AMD, Mac ou Nvidia desktop.

Mais rĂ©duire le DGX Spark Ă  ce seul usage serait passer Ă  cĂŽtĂ© de sa vraie valeur. Pour l’entraĂźnement et le dĂ©veloppement IA, c’est une machine exceptionnelle : silencieuse, compacte, prĂȘte Ă  l’emploi avec un environnement NVIDIA complet, capable de gĂ©rer de trĂšs gros modĂšles ou plusieurs modĂšles simultanĂ©ment grĂące Ă  ses 128 Go de RAM.

En résumé :

  • Pour de l’infĂ©rence simple : le rapport qualitĂ©/prix est moyen.
  • Pour des scĂ©narios avancĂ©s (multi-LLM, contextes longs, fine-tuning local) : c’est un outil puissant et flexible.

Si vous ĂȘtes dĂ©veloppeur, chercheur ou Ă©tudiant sĂ©rieux en IA et que vous voulez un laboratoire IA local, cette machine fait vraiment envie. Si votre usage se limite Ă  “tester des modĂšles” ou gĂ©nĂ©rer du texte ponctuellement, il existe des alternatives plus rapides et surtout moins coĂ»teuses.

Bref, c’est cher mais ça fait envie !

Références