مدیرعامل گوگل، سوندار پیچای، در یک نشست خبری پیش از کنفرانس گفت: «گوگل برای این لحظه ساخته شده است. ما بیش از یک دهه است که در زمینه پردازنده های گرافیکی پیشگام بوده ایم.»
معرفی نسل بعدی TPUها به نوعی یک سنت در I/O است، حتی اگر این تراشه ها تنها در اواخر سال عرضه شوند. با این حال، طبق گفته پیچای، زمانی که آنها عرضه شوند، نسبت به نسل پنجم، شاهد افزایش 4.7 برابری عملکرد محاسباتی در هر تراشه خواهیم بود.
گوگل تا حدودی به این امر با گسترش واحدهای ضرب ماتریس (MXU) تراشه و افزایش سرعت کلاک کلی دست یافته است. علاوه بر این، گوگل همچنین پهنای باند حافظه را برای تراشه های تریلیوم دو برابر کرد.
با این حال، شاید مهمتر از آن این باشد که Trillium از نسل سوم SparseCore استفاده می کند که گوگل آن را به عنوان “یک شتاب دهنده تخصصی برای پردازش ٍEmbed های فوق العاده بزرگ رایج در کارهای رتبه بندی و توصیه پیشرفته” توصیف می کند.
این شرکت معتقد است که این امر به TPUهای Trillium اجازه می دهد تا مدل ها را سریعتر آموزش دهند و آنها را با تأخیر کمتری ارائه دهند.
پیچای همچنین تراشه های جدید را به عنوان «پربازده ترین» TPUهای گوگل تا به امروز توصیف کرد، چیزی که با افزایش تصاعدی تقاضا برای تراشه های هوش مصنوعی به ویژه اهمیت دارد.
او گفت:تقاضای صنعت برای محاسبات یادگیری ماشین در شش سال گذشته 1 میلیون برابر شده است، تقریباً هر سال ده برابر می شود.» این اتفاق بدون سرمایه گذاری برای کاهش نیاز برق این تراشه ها پایدار نیست. گوگل قول می دهد که TPUهای جدید 67 درصد نسبت به تراشه های نسل پنجم انرژی کمتری مصرف کنند.
TPUهای گوگل اخیراً در چندین نسخه عرضه می شدند. تاکنون، گوگل جزئیات بیشتری در مورد تراشه های جدید یا هزینه استفاده از آنها در Google Cloud ارائه نکرده است.
در اوایل امسال، گوگل همچنین اعلام کرد که یکی از اولین ارائه دهندگان ابر خواهد بود که دسترسی به پردازنده های بلکول نسل بعدی انویدیا را ارائه می دهد. با این حال، این به معنای آن است که توسعه دهندگان باید تا اوایل سال 2025 منتظر بمانند تا به این تراشه ها دسترسی پیدا کنند.
پیچای گفت: «ما همچنان به سرمایهگذاری در زیرساخت برای پیشبرد پیشرفتهای هوش مصنوعی خود ادامه خواهیم داد و به نوآوری ادامه خواهیم داد.»