ก้าวสู่ยุค AI อัจฉริยะ! Google เปิดตัวชิป TPU Gen 8 แยก 2 รุ่นเฉพาะทาง "เทรน-ประมวลผล" ขั้นเทพ

ก้าวสู่ยุค AI อัจฉริยะ! Google เปิดตัวชิป TPU Gen 8 แยก 2 รุ่นเฉพาะทาง "เทรน-ประมวลผล" ขั้นเทพ


Google ประกาศเปิดตัวสถาปัตยกรรมชิปประมวลผล AI รุ่นที่ 8 (Eighth-generation TPU) เพื่อรองรับยุคที่ AI มีความซับซ้อนและล้ำหน้าขึ้นไปอีกขั้น เช่น Agentic AI (AI ที่คิดและทำตามเป้าหมายได้เอง) และ World models (การจำลองสถานการณ์อนาคต)

เนื่องจากการสร้าง AI ในยุคนี้มีความต้องการที่ต่างกันในแต่ละขั้นตอน Google จึงฉีกกฎเดิมด้วยการออกแบบชิปแยกเป็น 2 รุ่นเฉพาะทาง ได้แก่ TPU 8t และ TPU 8i พร้อมทั้งเสริมทัพด้วยซีพียู Arm-based Axion เพื่อลดปัญหาความล่าช้าในการจัดการข้อมูล

TPU 8t: ขุมพลังแห่งการเทรนโมเดล (The Pre-training Powerhouse) รุ่นนี้ถูกสร้างมาเพื่อรับมือกับการฝึกสอน (Pre-training) โมเดล AI ขนาดมหึมา โดยมีจุดเด่นที่น่าสนใจคือ:

  • สเกลใหญ่จุใจ: รองรับการขยายเครือข่ายเชื่อมต่อชิปได้มากกว่า 1 ล้านตัวในการเทรนเพียงคลัสเตอร์เดียว
  • เครือข่ายความเร็วสูง: ใช้เครือข่ายใหม่ที่ชื่อว่า "Virgo Network" ซึ่งเพิ่มแบนด์วิดท์รับส่งข้อมูลได้สูงสุดถึง 4 เท่า
  • เข้าถึงข้อมูลไวกว่าเดิม 10 เท่า: ด้วยเทคโนโลยีการอ่านข้อมูลแบบยิงตรง (TPUDirect Storage) ทำให้ไม่ต้องรอส่งผ่านคอขวดแบบเดิมๆ
  • ความคุ้มค่า: ให้ประสิทธิภาพต่อราคา (Performance-per-dollar) ดีกว่าชิปรุ่นที่ 7 (Ironwood) ถึง 2.7 เท่า

TPU 8i: ผู้เชี่ยวชาญด้านการตอบสนองไว (The Sampling and Serving Specialist) รุ่นนี้เน้นการนำ AI ไปใช้งานจริง (Serving) และประมวลผลหาคำตอบที่ต้องใช้ตรรกะซับซ้อนพร้อมๆ กันหลายล้านคำสั่ง โดยมีไม้เด็ดคือ:

  • ความจำใหญ่ คิดได้ลื่นไหล: เพิ่มหน่วยความจำบนชิป (SRAM) มากขึ้นถึง 3 เท่า ช่วยลดเวลาสูญเปล่าของระบบลงได้อย่างมาก
  • เครือข่ายลดทางอ้อม: ใช้สถาปัตยกรรมเครือข่ายแบบใหม่ชื่อ "Boardfly" ที่ช่วยลดจำนวนทางผ่านของข้อมูล (Hops) ลงถึง 56% ทำให้รับส่งข้อมูลระหว่างชิปได้เร็วกว่าเครือข่ายแบบ 3D Torus เดิม
  • คุ้มค่าต่อการใช้งาน: เพิ่มประสิทธิภาพต่อราคาได้ถึง 80% โดยเฉพาะในงานที่ต้องการความหน่วงต่ำๆ (Low-latency)

บทสรุป การแยกชิปเป็น 2 รุ่นของ Google ในครั้งนี้ เป็นการแก้ปัญหาคอขวดที่ตรงจุด นอกจากความแรงที่เพิ่มขึ้นแล้ว ชิปทั้ง 2 รุ่นยัง ประหยัดพลังงานขึ้นถึง 2 เท่า (Performance-per-watt) ถือเป็นการวางโครงสร้างพื้นฐานสำคัญที่พร้อมขับเคลื่อนนวัตกรรม AI แห่งอนาคตได้อย่างยั่งยืนและมีประสิทธิภาพสูงสุด

ที่มาข้อมูล

ความคิดเห็น