NVIDIADGX Spark 为桌面端最新开源与前沿AI模型提供强大算力支持

发表于 2 小时前 | 显示全部楼层 |阅读模式
9 0
M33Amqq2bzSSZT2P.jpg




I2Z8EVA82288dO2m.jpg


    开源AI正在加速各行各业的创新,NVIDIADGX Spark将帮助开发者将创新转化为影响力。
    NVIDIA 于1月6日在CES 2026 展示了DGX Spark 桌面级AI超级计算机如何让开发者在本地桌面级系统上使用最新的开源与前沿AI 模型。其中,在DGX Spark 上可运行100B 参数模型。
    基于NVIDIA GraceBlackwell架构打造,配备大容量统一内存和PF 级AI性能,使开发者能够在本地进行开发并轻松扩展到云端。
    在开源AI模型上的性能提升
    得益于模型优化的持续提升以及与开源社区的合作,大量过去只能在数据中心运行的高度优化开源模型,如今可以在DGX Spark的桌面端获得加速。
    DGX Spark 预配置了NVIDIA AI 软件和NVIDIACUDA-X库,为开发者、研究人员和数据科学家提供强大的即插即用优化能力,用于构建、微调和运行AI。
    DGX Spark 为所有开发者在桌面端运行最新AI模型提供基础。这些系统支持直接在桌面上运行最新的框架和开源模型,包括最近发布的NVIDIANemotron 3 模型。
    为DGX Spark提供算力支持的NVIDIA Blackwell架构引入了NVFP4数据格式,可在不损失模型智能的前提下将AI 模型压缩至高可达70%,同时显著提升性能。
    扩展AI与创意工作流
    DGX Spark 专为支持完整的AI开发生命周期而打造,涵盖从原型设计、微调到推理和数据科学的全流程,适用于医疗、机器人、零售、内容创作在内的众多行业场景,满足各行业特定的AI应用需求。
    对于创作者而言,最新的扩散和视频生成模型,如阿里巴巴的Qwen-Image,现已支持NVFP4,可降低显存占用并加速性能。
    CES 现场演示了DGX Spark如何将高负载的视频生成从创作者的笔记本电脑中卸载出来,相比配置的搭载M4 Max 的MacBookPro,实现高达8倍加速,同时释放本地系统资源,以保障创作流不中断。
    开源的RTXRemix MOD 平台将为3D 艺术家和Modder 助力,借助DGX Spark 利用生成式AI 提升创作效率。CES现场展示了一个MOD团队如何将所有资产创建工作转移至DGX Spark上进行,从而让团队成员的PC 能无间断进行MOD开发,并能够实时查看游戏内的修改效果。
    AI 编码助手也在重塑开发者的生产力。在CES 上,NVIDIA展示了一款在DGX Spark 上运行,并由NVIDIA Nsight驱动的本地CUDA编码助手,使开发者在享受AI辅助企业级开发体验的同时,可将源代码安全地存储在本地环境中。
    行业领导者验证本地AI转型的趋势
    随着对安全、高性能边缘AI 需求不断增长,DGXSpark 正在整个行业中获得越来越多的关注与采用。
    软件领导者、开源创新者以及全球工作站合作伙伴正在采用DGXSpark,在无需复杂集中式基础设施的情况下,实现本地推理、智能体工作流以及检索增强生成。
    他们的看法充分表明,DGXSpark 正在帮助实现更快的迭代速度、更强的数据与IP控制能力,并在桌面端带来全新、更具交互性的AI 体验。
    在CES 上,NVIDIA演示了如何利用DGX Spark的强大算力,结合Hugging FaceReachy Mini 机器人,将AI 智能体带入现实世界。
    Hugging Face 产品副总裁Jeff Boudier表示:“开放模型赋予开发者以自己的方式构建AI ,而DGX Spark将这种能力带到桌面端。当它与Reachy Mini结合时,本地AI智能体将具备实体形态并拥有自己的声音。它们可以看到用户、聆听用户,并通过富有表现力的动作做出回应——让强大的AI 变成真正可以互动的存在。”
    Hugging Face 和NVIDIA已发布指南,介绍如何使用DGX Spark 和Reachy Mini构建交互式AI 智能体。
    IBM 数据与AI 平台战略副总裁Ed Anuff 表示:“DGXSpark 将前沿AI 推理带到边缘侧。借助运行在Spark 上的OpenRAG,用户可以获得一个完整、自包含的一体化RAG堆栈,包括抽取、嵌入、检索和推理。”
    JetBrains 首席执行官Kirill Skrygan表示:“对于需要完全掌控安全性、治理和知识产权的组织而言,NVIDIADGX Spark 为JetBrains 的客户带来了PF 级AI性能。无论客户偏好云端、本地部署还是混合部署,JetBrainsAI 都能在他们所选择的环境中提供支持。”
    TRINITY 是一款面向城市出行设计的智能自平衡三轮单座车,CES现场展示了使用DGX Spark 作为AI大脑,对开源、实时视觉语言模型工作负载进行AI 推理。
    will.i.am 表示:“TRINITY代表微出行的未来—— 人类、交通工具与AI agents 无缝协作。以NVIDIA DGX Spark作为其AI 大脑,TRINITY提供具备对话能力、目标跟踪的工作流,改变人们在互联城市中与出行方式的交互方式。这是一台装在轮子上的‘大脑’,从智能体理念出发而设计。”
    加速AI开发者采用
    DGXSpark playbooks可帮助开发者快速启动真实世界的AI 项目。在CES 上,NVIDIA正在扩展这一资源库,新增6 个playbook 并带来4 项重大更新,涵盖最新的NVIDIA Nemotron3 Nano 模型、机器人训练、视觉语言模型、使用两台DGX Spark 系统进行AI模型微调、基因组学以及金融分析等主题。
    NVIDIAAI Enterprise软件支持现已面向来自制造商合作伙伴的DGX Spark 和GB10系统开放。该套件包含用于AI应用开发和模型部署的库、框架和微服务,以及用于GPU 优化的operator和驱动,可实现快速、可靠的AI工程与部署。相关许可证预计将于1 月底推出。
    购买途径
    DGX Spark 以及合作伙伴的GB10系统现已可通过宏碁、华硕、戴尔、技嘉、惠普、联想、微星、新华三、超聚变、紫光晓通、丽台科技、英迈,神州数码购买。
    DGX Spark 的更多详情请查看技术博客文章。
    软件产品信息请查看声明。
    关于NVIDIANVIDIA(NASDAQ: NVDA) 是加速计算领域的全球领导者。
全部评论

暂无评论,期待您打破宁静

您需要登录后才可以回帖 登录 | 立即注册
发表评论
发布 联系QQ