Por Justin Cook Arquitecto de la Nube Senior en Eviden
AWS Parallel Cluster Service (AWS PCS) es un servicio gestionado que simplifica la creación y administración de clústeres de cómputo de alto desempeño (HPC) en la nube. Diseñado para investigadores, científicos e ingenieros, este servicio permite ejecutar simulaciones a gran escala sin preocuparse por la complejidad de la infraestructura subyacente.
¿Qué es AWS PCS?
AWS PCS utiliza el planificador Slurm, ampliamente conocido en entornos HPC, para administrar recursos de cómputo, red y almacenamiento. Esto facilita a los usuarios enfocarse en sus proyectos y no en la gestión técnica.
Elementos Clave del Servicio:
Clúster: Gestiona recursos para ejecutar trabajos HPC. Utiliza Slurm como programador y configura instancias EC2 para procesar trabajos.
Grupos de Nodos de Cómputo: Conjuntos de instancias EC2 con configuraciones específicas, como tipo de instancia, AMI, opciones de compra (Spot o bajo demanda) y más.
Colas: Los trabajos son enviados a colas que distribuyen las tareas a los nodos de cómputo correspondientes.
Administración Flexible: Puedes acceder al clúster a través de la consola de AWS, CLI, SDK o SSH, facilitando la interacción con los recursos sin complicaciones.
Disponibilidad Regional y Costos
AWS PCS está disponible en varias regiones como EE.UU. Este, Asia Pacífico y Europa. Los precios varían según los recursos utilizados. Más información sobre costos está disponible en la página oficial de AWS.

Guía Práctica para Comenzar con AWS PCS
1. Configuración Inicial
Para empezar, debes:
Crear una Amazon VPC y un sistema de almacenamiento compartido (Amazon EFS).
Preparar tu cuenta con los artefactos necesarios para la región donde usarás AWS PCS.
2. Creación del Clúster
Accede a la consola de AWS PCS y selecciona "Crear clúster". Define:
Nombre del clúster.
Tamaño del controlador Slurm (Small, Medium o Large).
Configuración de red, incluyendo VPC y subred.
Puedes ajustar parámetros adicionales, como el tiempo de inactividad de nodos y configuraciones avanzadas de Slurm.
3. Configuración de Grupos de Nodos de Cómputo
Crea grupos de nodos para ejecutar trabajos o para acceso de usuarios. Define:
Tipo de instancia EC2 (ejemplo: hpc7a.48xlarge para trabajos intensivos).
Límite de escalado de instancias.
Opciones de compra y configuración personalizada.
4. Creación de Colas y Ejecución de Trabajos
Configura colas asociadas a los grupos de nodos de cómputo. Los trabajos enviados a estas colas serán programados y ejecutados según la capacidad disponible.
Ejemplo: Utiliza Slurm para preparar y enviar scripts de trabajo, monitoriza con squeue y revisa los resultados en archivos de salida.
Visualización y Limpieza de Recursos
Para visualizar resultados, AWS ofrece opciones como escritorios remotos NICE DCV. Una vez finalizado el uso del clúster, elimina los recursos para evitar cargos innecesarios.
Cuando Se Quiere Tratarlo
AWS PCS democratiza el acceso al cómputo de alto desempeño, brindando herramientas robustas y flexibles para proyectos que requieren gran capacidad de procesamiento. Desde simulaciones científicas hasta análisis de big data, este servicio está diseñado para impulsar la innovación y la investigación en diversos campos.
¡Descubre cómo AWS PCS puede transformar y AUGMENTAR tus capacidades de HPC hoy!
Aprender mas aqui y contactarme si quieres aprender más
Comentarios