Google Cloud dévoile ses TPU Ironwood et de nouvelles instances Axion

Récemment, lors de l’événement .Next à Las Vegas, Google Cloud a annoncé le lancement de ses nouvelles unités de traitement tensoriel (TPU) de septième génération, nommées Ironwood. Ces TPU promettent un gain significatif en performance, notamment pour les tâches liées à l’intelligence artificielle, comme l’entraînement de modèles de langage massif (LLM) et l’inférence.

Les TPU Ironwood seront disponibles dans quelques semaines et permettront aux entreprises de bénéficier d’une puissance de calcul inédite. Par exemple, les pods Ironwood pourront accueillir jusqu’à 9 126 puces, atteignant une capacité de calcul de 45,2 exaflops (en précision FP8). Chaque TPU sera capable de traiter jusqu’à 4,16 Tflops. Cette avancée est également permise grâce à une améliorante bande passante de 7,2 To/s et une technologie d’interconnexion inter-puces qui optimise le transfert de données à 1,2 To/s.

En plus de ces TPU, Google Cloud a également élargi son offre avec des instances basées sur ses puces Axion, qui reposent sur l’architecture Arm. Ces nouvelles instances, comme les N4A et l’infrastructure bare metal C4A, visent à répondre à des exigences variées des entreprises, allant des applications conteneurisées aux bases de données. Les nouvelles instances N4A, par exemple, peuvent gérer jusqu’à 64 processeurs virtuels et 512 Go de mémoire DDR5, tandis que la série C4A Metal peut accueillir jusqu’à 96 vCPU et 768 Go de mémoire.

Ces annonces illustrent la volonté de Google Cloud de rivaliser avec d’autres acteurs majeurs du cloud, tels qu’AWS et Microsoft, qui ont récemment développé leurs propres solutions matérielles pour l’IA. Avec ces avancées technologiques, Google se positionne pour offrir un paysage cloud performant et adapté aux besoins croissants en capacités de calcul.

Pour plus de détails, retrouvez l’article d’origine sur le site du Monde Informatique ici.