Los agentes personales están experimentando un auge de popularidad, y proyectos de código abierto como OpenClaw y Hermes están siendo rápidamente adoptados por las comunidades de desarrolladores de IA en GitHub. Diseñados para adaptarse a las preferencias y flujos de trabajo individuales, estos agentes pueden interactuar con aplicaciones, generar contenido, automatizar procesos repetitivos y gestionar tareas de varios pasos, todo ello mientras se ejecutan localmente en el dispositivo.
Hoy en NVIDIA GTC Taipei en COMPUTEX, NVIDIA presentó NVIDIA RTX Spark, una nueva clase de PC con Windows diseñadas específicamente para agentes personales, junto con una serie de actualizaciones que amplían los agentes locales a los ecosistemas más amplios de NVIDIA RTX y DGX.
Para ejecutar agentes de forma segura y privada, se requiere hardware a la altura. La potencia de procesamiento de IA de 1 petaflop y los 128 GB de memoria unificada de RTX Spark satisfacen las necesidades de procesamiento de los agentes en el dispositivo, ofreciendo una nueva generación de ordenadores que pasan de ser una herramienta a un compañero de equipo. Diseñado para IA, creación de contenido y videojuegos, RTX Spark incorpora los 30 años de innovación tecnológica de NVIDIA a laptops Windows delgadas con batería de larga duración y ordenadores de sobremesa ultraeficientes.
La asociación de NVIDIA con Windows abarca desde soluciones personales hasta empresariales. También se presentó la NVIDIA RTX Station, la supercomputadora de escritorio con IA definitiva para profesionales, que ofrece una GPU y una CPU de clase centro de datos para inferencia en un sistema de escritorio, equipado con Windows para mayor facilidad de gestión, seguridad y compatibilidad.
Otros anuncios incluyen::
- El NVIDIA OpenShell: El entorno de ejecución llegará a Windows, basado en las nuevas primitivas de seguridad de Microsoft para agentes, lo que proporcionará a los desarrolladores un paquete fácil de implementar para agentes seguros en el dispositivo. Hermes Agent y OpenClaw también integrarán OpenShell y las primitivas de seguridad de Microsoft en sus nuevas aplicaciones para Windows.
- El NVIDIA NemoClaw se está expandiendo a toda la gama de IA local de NVIDIA (GeForce RTX, RTX PRO, RTX y DGX Spark, y RTX y DGX Station) con nuevos instaladores optimizados y compatibilidad con Hermes Agent.
- Rendimiento de inferencia dos veces superior en los mejores modelos agenciales con predicción de múltiples tokens en llama.cpp y vLLM, así como nuevas optimizaciones multi-GPU para llama.cpp y ComfyUI.
- La empresa H Company está lanzando herramientas para el uso de ordenadores, incluidos nuevos modelos y un próximo arnés de agente de escritorio, optimizadas para PC con RTX y DGX.
- Adobe está rediseñando sus aplicaciones Photoshop y Premiere, Blender incorpora NVIDIA DLSS 4.5 Ray Reconstruction, y NVIDIA presentó RTX Video Frame Generation, que llegará a ComfyUI. Todas estas actualizaciones estarán disponibles este otoño con RTX Spark.
- La actualización NVIDIA Broadcast 2.2 incluye optimizaciones para la función Studio Voice y compatibilidad con Elgato Stream Deck. NVIDIA Project G-Assist también añade integración con Stream Deck.
IA local con agentes: Personal, privada y rápida en PCs con Windows RTX.
La adopción generalizada de agentes se ha visto limitada por la imposibilidad de ejecutarlos de forma segura y privada en los ordenadores principales de los usuarios.
NVIDIA y Microsoft se han asociado para abordar este desafío mediante el desarrollo de una plataforma Windows robusta y segura para agentes instalados en los dispositivos.
La colaboración parte de una base sólida —nuevas funciones básicas de seguridad de Windows y el entorno de ejecución NVIDIA OpenShell— para garantizar que los agentes se ejecuten de forma segura y bajo el control total del usuario.
Las nuevas primitivas de Windows ofrecen capacidades de identidad, contención, políticas y seguridad integral para crear y ejecutar agentes de forma nativa. NVIDIA OpenShell proporciona capacidades de políticas adicionales para que el usuario defina qué pueden y qué no pueden hacer los agentes, la capacidad de enrutar de forma inteligente las consultas a modelos locales según las políticas de privacidad del usuario y la capacidad de ocultar información personal en las consultas enviadas a modelos en la nube.
Esta sólida capa de seguridad y privacidad está siendo adoptada por desarrolladores líderes de agentes, como Hermes Agent y OpenClaw, en sus nuevas aplicaciones para Windows. Estas nuevas aplicaciones facilitarán y garantizarán la seguridad del acceso de los usuarios a potentes agentes en sus dispositivos, capaces de ejecutar tareas en aplicaciones de Windows, analizar flujos de trabajo entre aplicaciones, generar imágenes y vídeos, programar complementos y aplicaciones, y realizar búsquedas semánticas en archivos locales.
Para que los agentes funcionen en dispositivos locales se requiere tanto una seguridad robusta como un hardware de alto rendimiento. RTX Spark ofrece hasta 1 petaflop de capacidad de procesamiento de IA y 128 GB de memoria unificada para satisfacer las necesidades de procesamiento de los agentes en los dispositivos.
NVIDIA también está acelerando el desarrollo del ecosistema de modelos abiertos locales en el que se basan estos agentes.
NVIDIA colaboró con la comunidad llama.cpp para habilitar funciones y optimizaciones como la predicción de múltiples tokens (MTP), una técnica de decodificación especulativa en la que un modelo preliminar más pequeño propone varios tokens a la vez, que el modelo objetivo verifica en una sola pasada. Esto, junto con otras optimizaciones como el lanzamiento programático dependiente, ofrece un rendimiento dos veces superior en Qwen 3.6 y 3.5 27B, y un aumento de rendimiento de 1.6 veces en Qwen 3.6 y 3.5 35B. Estas actualizaciones están disponibles a través de la interfaz web de llama.cpp y LM Studio.
Mejoras de rendimiento mostradas con las últimas optimizaciones de NVIDIA para llama.cpp: Qwen3.6-27B ofrece hasta 2 veces más rendimiento y Qwen3.6-35B hasta 1.6 veces más en GeForce RTX 5090, acelerando las cargas de trabajo de IA agente local a través de la colaboración de la comunidad de código abierto.
Para los entusiastas de la IA que utilizan configuraciones multi-GPU, NVIDIA colaboró con la comunidad de código abierto para mejorar dos de las herramientas de IA locales más populares:
- cpp añade paralelismo tensorial para obtener hasta 2 veces más memoria y 1.8 veces más capacidad de cálculo en dos GPU equivalentes.
- ComfyUI incorpora un nuevo método de guiado sin clasificadores que ofrece un rendimiento hasta dos veces superior en dos GPU equivalentes, además de la opción de dividir las cadenas de modelos entre las GPU para aprovechar la memoria combinada.
Muestra las mejoras en el rendimiento de la generación de tokens para la técnica Tensor Parallel Multi-GPU en comparación con el procesamiento paralelo en pipeline y la inferencia de una sola GPU en llama.cpp.
Muestra las mejoras en el rendimiento del tiempo de generación para las técnicas multi-GPU en ComfyUI.
NVIDIA también está ampliando las capacidades de los agentes con H Company. El sistema de H Company para el uso de PCs permite a los agentes navegar por un PC viendo la pantalla y utilizando el ratón y el teclado como un usuario, incluso en aplicaciones sin interfaz de programación de aplicaciones (API). Próximamente estará disponible para los PC RTX y DGX con soporte para modelos locales.
NVIDIA ha colaborado con H Company para cuantificar sus modelos de vanguardia para el uso de Holo Computer, así como para acelerar su integración, logrando una aceleración de 2x en las GPU de NVIDIA y una reducción del consumo de memoria del 35%. Los modelos ya están disponibles para su descarga y la aplicación Holo Desktop estará disponible próximamente.
Optimizaciones de agentes para Linux
Para los desarrolladores que necesitan agentes locales siempre accesibles, NVIDIA DGX Spark es la PC de IA de agente personal más potente para desarrolladores que necesitan un entorno Linux, ya que combina una gran capacidad de memoria, un procesamiento rápido y compatibilidad con el ecosistema NVIDIA CUDA.
La versión de DGX Spark OS de este mes ofrece la experiencia de configuración más sencilla gracias a un instalador de NemoClaw optimizado, junto con una inferencia más rápida en los principales modelos de agentes.
NemoClaw ya está disponible para todos los PC con NVIDIA RTX y DGX en Linux y el Subsistema de Windows para Linux. Implemente agentes locales de forma segura en Linux con nuevos instaladores optimizados, que ofrecen aislamiento automático y compatibilidad con Hermes Agent.
NVIDIA ha colaborado con vLLM para optimizar la inferencia para agentes, con optimizaciones en vLLM y nuevos puntos de control NVFP4 optimizados para Qwen 3.6 35B. Las actualizaciones ofrecen un rendimiento 2.6 veces superior en DGX Spark en comparación con los puntos de control NVFP4 disponibles anteriormente de Unsloth, e incluyen mejoras en el kernel, así como precisión mixta y compatibilidad con CUDA Graph para MTP.
Lee el blog de vLLM para obtener una guía completa sobre cómo implementar modelos NVFP4 de mezcla de expertos en DGX Spark, desde el ajuste unificado de la memoria hasta una configuración de referencia funcional de NVIDIA Nemotron 3 Super.
Ofreciendo experiencias creativas impactantes con Adobe
NVIDIA se ha asociado con Adobe para rediseñar Adobe Premiere y Photoshop para RTX Spark. Generative Fill en Photoshop, con tecnología Firefly, y Generative Extend en Premiere son solo algunas de las cientos de herramientas aceleradas que ofrecen potencia creativa, precisión y control. RTX Spark lleva estas capacidades aún más lejos, ofreciendo IA, edición, coloración y efectos hasta dos veces más rápidos en todos los flujos de trabajo creativos.
Adobe Premiere incorporará un nuevo flujo de trabajo de vídeo que aprovecha la memoria unificada de RTX Spark, la GPU Blackwell y el software TensorRT, ofreciendo un rendimiento en tiempo real para la edición y la corrección de color, un rendimiento de IA acelerado por GPU y una renderización más eficiente de líneas de tiempo complejas. Además, Adobe Substance 3D Painter y Stager se ejecutarán de forma nativa en RTX Spark para lograr flujos de trabajo de texturizado 3D y creación de escenas más fluidos y con mayor capacidad de respuesta.
El motor Photoshop de próxima generación de Adobe estará optimizado para la composición acelerada por GPU, lo que permitirá filtros en tiempo real, alto rango dinámico y pinceladas modernas y naturales. El flujo de trabajo nativo de IA está diseñado para aprovechar toda la potencia de RTX Spark, incluido TensorRT.
Adobe ampliará aún más las funcionalidades de Premiere y Photoshop para permitir a los usuarios crear, editar y diseñar con agentes de Windows, proporcionando a los creadores un compañero de colaboración para acelerar sus flujos de trabajo.
Se espera que las actualizaciones de las aplicaciones creativas de Adobe, como Premiere, Photoshop y Substance, comiencen a implementarse junto con la disponibilidad de RTX Spark.
Nuevas herramientas y actualizaciones de aplicaciones para creadores
Las nuevas actualizaciones de la plataforma NVIDIA y las optimizaciones de las aplicaciones de sus socios se están implementando en todo el ecosistema RTX; algunas ya están disponibles y otras llegarán con RTX Spark este otoño.
NVIDIA Broadcast 2.2 lanza Studio Voice, una función de IA que mejora el sonido de cualquier micrófono hasta obtener calidad de estudio, fuera de la fase beta a partir de hoy. Studio Voice ahora funciona en GPU GeForce RTX 3060 y superiores con un rendimiento mejorado. La aplicación también incorpora integración con Elgato Stream Deck y atajos de teclado configurables.
El proyecto G-Assist también añade compatibilidad con Stream Deck a través del servidor Elgato MCP, lo que permite a los usuarios habilitar las funciones de asistente de IA para su configuración de transmisión.
Además, Blender Cycles integra DLSS 4.5 Ray Reconstruction como un nuevo reductor de ruido, convirtiendo la ventana gráfica de path-tracing en un visor interactivo en tiempo real. Esto permite a los artistas 3D navegar por una escena mientras visualizan una calidad de renderizado casi final, transformando el flujo de trabajo de iluminación y desarrollo visual. La actualización se lanzará con Blender 5.3 este otoño, junto con RTX Spark.
https://www.youtube.com/watch?v=XYvUsBFkJMA
Junto con RTX Spark, RTX Video Frame Generation es un nuevo efecto de IA que duplica o cuadruplica la velocidad de fotogramas de vídeo en tiempo real, ideal para mejorar las salidas de 15-20 fotogramas por segundo (fps) que suelen generar los modelos de IA. Se presenta como un paquete Python y un nodo ComfyUI, lo que permite a los artistas de IA generar vídeos más rápido a bajas velocidades de fotogramas y luego interpolarlos para lograr una reproducción fluida.
#ICYMI: Lo último de RTX AI Garage
🪐 Lee el artículo completo NVIDIA RTX Spark para obtener más detalles sobre el superchip, el trabajo de NVIDIA con Windows en agentes y las computadoras portátiles y de escritorio pequeñas de los socios.
💻Las laptops para creadores ASUS ProArt ahora vienen con la tarjeta gráfica FLUX.2 Klein 4B de Black Forest Labs. Un modelo de imagen optimizado, preinstalado a través de la aplicación MuseTree, con el formato NVFP4 y el kit de desarrollo de software NVIDIA TensorRT para RTX. Los creadores obtienen una aceleración de hasta 2.5 veces y una reducción de memoria del 560%, con una experiencia de uso inmediata que permite generar imágenes localmente desde el primer momento, sin necesidad de descargar modelos ni configurar ComfyUI.
🎬 El kit de desarrollo de software NVIDIA AI for Media presenta actualizaciones., incluyendo nuevos microservicios LipSync de NVIDIA NIM optimizados para francés, alemán y español. El microservicio Active Speaker Detection de NIM también añade compatibilidad con múltiples cámaras con correlación de hablantes entre vídeos.
🤖 Consulta la última publicación del blog de RTX AI Garage sobre Hermes Agent y una IA de autoaprendizaje en PCs RTX y DGX Spark.










