Intel anunció recientemente el lanzamiento de las herramientas Intel oneAPI 2023, que estarán disponibles en Intel Developer Cloud y se podrán implementar a través de los canales de distribución tradicionales. Serán compatibles con los próximos procesadores Intel Xeon Scalable de 4ª generación, Intel Xeon CPU Max Series y las GPU Intel Data Center, incluidas Flex Series y la nueva Max Series.
Las nuevas herramientas oneAPI 2023 brindan mejoras de rendimiento y productividad, así como soporte para los nuevos plug-ins Codeplay que hacen que programar código SYCL para arquitecturas de GPU que no sean de Intel sea más fácil que nunca. Al estar basados en estándares, garantizan más libertad de elección de hardware y facilidad para desarrollar aplicaciones de alto rendimiento que se ejecutan en sistemas multiarquitectura.
«Estamos viendo resultados iniciales alentadores en términos de rendimiento en nuestros sistemas de desarrollo utilizando los aceleradores de GPU Intel Max Series, aplicaciones creadas con compiladores y bibliotecas oneAPI de Intel. Para las ciencias computacionales, valoramos los beneficios de la portabilidad de código proporcionada por los estándares de programación de múltiples proveedores y arquitecturas, como SYCL y Python AI (por ejemplo, PyTorch), acelerados por las bibliotecas de Intel. Esperamos con ansias los primeros descubrimientos científicos en exaescala el próximo año, utilizando estas tecnologías en el sistema Aurora», dijo Timothy Williams, vicedirector de la División de Ciencias Computacionales de Argonne.
Las herramientas oneAPI 2023 de Intel incluyen un conjunto integral de los últimos compiladores y bibliotecas, capacidades de análisis, portabilidad, estructuras optimizadas de inteligencia artificial (IA) y aprendizaje automático para desarrollar aplicaciones de arquitectura múltiple de alto rendimiento para CPUs, GPUs y FPGAs. Estas herramientas brindan a los desarrolladores la capacidad de cumplir rápidamente con los objetivos de rendimiento y tiempo, utilizando una única base de código, reservando más tiempo para la innovación.
Con estas nuevas herramientas oneAPI, los desarrolladores podrán aprovechar las funciones avanzadas del siguiente hardware de Intel:
- Procesadores Intel Xeon Scalable de 4ª generación y Xeon CPU Max Series con Intel Advanced Matrix Extensions (Intel AMX), Intel Quick Assist Technology (Intel QAT), Intel AVX-512, bfloat16 y más.
- GPUs Intel para centros de datos, incluida Flex Series con codificador AV1 en hardware y GPUs Max Series con flexibilidad de tipos de datos, Intel® Xe Matrix Extensions (Intel XMX), motor vectorial, Intel Xe Link y otras funciones.
Ejemplos de benchmark:
- La inferencia de aprendizaje profundo MLPerf DeepCAM y el rendimiento en el entrenamiento con Xeon CPU Max han mostrado un aumento de rendimiento de 3,6 veces sobre Nvidia a 2,4 y AMD como referencia 1.0 utilizando Intel AMX con la biblioteca de red neural profunda Intel® oneAPI (oneDNN).
- Las cargas de trabajo LAMMPS (simulador atómico/molecular masivo paralelo a gran escala) que se ejecutan en Xeon CPU Max con núcleos descargados en seis GPUs de Max Series y optimizadas con las herramientas oneAPI han dado como resultado un aumento de rendimiento de hasta 16 veces con respecto al Intel Xeon de 3ª generación o AMD Milan.
Rendimiento de software avanzado:
- Intel Fortran Compiler cumple totalmente con los estándares del lenguaje hasta Fortran 2018 y amplía el soporte de descarga de GPU OpenMP, lo que acelera el desarrollo de aplicaciones que siguen estos estándares.
- Intel® oneAPI Math Kernel Library (oneMKL) con capacidad ampliada de descarga OpenMP que mejora la portabilidad.
- Biblioteca de red neural profunda Intel oneAPI (oneDNN) habilita las capacidades avanzadas de aprendizaje profundo de los procesadores Intel Xeon de 4ª generación y Xeon CPU Max Series, incluidos Intel® AMX, Intel AVX-512, VNNI y bfloat16.
Para aumentar la productividad de los desarrolladores, una mejor compatibilidad con SYCL y las herramientas robustas de análisis y migración de código facilitan el desarrollo para sistemas de varias arquitecturas.
- Compilador Intel oneAPI DPC++/C++ con nuevos plug-ins de Codeplay Software para GPUs Nvidia y AMD simplifica la programación SYCL, y amplía la portabilidad entre estas arquitecturas de procesador. Ofrece un entorno unificado de compilación con herramientas integradas que garantizan la productividad multiplataforma. Como parte de la solución, Intel y Codeplay ofrecerán soporte prioritario comercial, comenzando con el plug-in oneAPI para GPUs Nvidia.
- La migración del código CUDA a SYCL ahora es más fácil con más de 100 APIs CUDA añadidas a la herramienta de compatibilidad Intel DPC++, basada en SYCLomatic de código abierto.
- Los usuarios pueden identificar los desequilibrios de MPI a escala con Intel VTune Profiler.
- Intel Advisor brinda un análisis roofline automatizado en la GPU Intel Data Center Max Series para identificar y priorizar embotellamiento de memoria, caché o de procesamiento y sus causas, con insights para optimizar los costos de reutilización asociados con la transferencia de datos en la descarga entre la CPU y la GPU.
Dado que el 48 % de los desarrolladores trabajan con sistemas heterogéneos que utilizan más de un tipo de procesador2, es necesario contar con una programación multiarquitectura más eficiente para satisfacer el alcance y la escala cada vez mayor de las cargas de trabajo del mundo real. El uso del modelo de programación unificado y abierto de oneAPI con las herramientas de arquitectura múltiple basadas en estándares de Intel, brinda libertad de elección para hardware, rendimiento, productividad y portabilidad de código para CPU y aceleradores. La programación que utiliza modelos propietarios como CUDA carece de capacidades de portabilidad a otro hardware, lo que crea una práctica de desarrollo en silos que deja a las organizaciones en un ecosistema cerrado.
La adopción continua del ecosistema oneAPI está progresando con el establecimiento de nuevos Centros de Excelencia. Uno de ellos, el Open Zettascale Lab de la Universidad de Cambridge, se centra en transferir para oneAPI códigos candidatos con importantes ganancias en exaescala, incluidos CASTEP, FEniCS y AREPO. El centro ofrece cursos y talleres con expertos que orientan sobre metodologías y herramientas oneAPI para compilar, portar código y optimizar el rendimiento. En total, ya son 30 Centros de Excelencia oneAPI.
Más contexto: Codeplay anuncia oneAPI para GPUs Nvidia y AMD | Detalles sobre las herramientas Intel oneAPI 2023 | Presentación de las herramientas oneAPI 2023 (Blog)| Intel oneAPI 2023 Release Preview (Webinar) | oneAPI y Codeplay