Lors de son événement I/O, Google a fait plusieurs annonces majeures centrées sur l’intelligence artificielle, dont une focalisation sur la prochaine génération de ses processeurs maison, les TPU (Tensor Processing Unit). La sixième génération, nommée Trillium, sera lancée dans le courant de l’année au sein de l’infrastructure de Google Cloud. Sundar Pichai, CEO d’Alphabet, a souligné lors de la conférence de presse que Google est un pionnier dans le domaine des GPU depuis plus de dix ans, suggérant ainsi qu’il existe des alternatives à la domination de Nvidia sur le marché des accélérateurs IA à base de GPU.
La nouvelle génération de TPU, Trillium, promet une performance de calcul multipliée par 4,7 par rapport à la génération précédente (TPU v5e). Google a augmenté les MXU (Matrix Multiply Unit) et doublé la bande passante de la mémoire pour atteindre ces performances. De plus, Trillium intègre la troisième génération de SparseCore, un accélérateur spécialisé dans le traitement des embeddings volumineux utilisés dans les workload de classement et de recommandation avancés. Cette intégration permettra d’entraîner les modèles plus rapidement, avec une faible latence et à moindre coût.
Google met également l’accent sur la maîtrise de la consommation énergétique des TPU, étant donné la demande croissante en calculs d’apprentissage automatique. Sundar Pichai a souligné que la demande de calcul en apprentissage automatique a été multipliée par un million au cours des six dernières années. Google promet que les prochains TPU seront 67 % plus économes en énergie que les puces de cinquième génération.
Les détails techniques et les consommations énergétiques réelles seront dévoilés lors du lancement officiel. Google Cloud prévoit également de lancer des instances avec sa puce ARM Axion, offrant ainsi une gamme étendue de solutions d’IA pour ses clients.