ลาก่อนการพิมพ์ทีละคำ! ทำความรู้จัก 'DiffusionGemma' โมเดล AI แนวใหม่จาก Google ที่สร้างข้อความได้รวดเร็วขึ้นถึง 4 เท่า
ลาก่อนการพิมพ์ทีละคำ! ทำความรู้จัก 'DiffusionGemma' โมเดล AI แนวใหม่จาก Google ที่สร้างข้อความได้รวดเร็วขึ้นถึง 4 เท่า
Google ได้เปิดตัวโมเดล AI น้องใหม่ในระดับทดลองที่มีชื่อว่า "DiffusionGemma" ซึ่งพลิกโฉมวงการ AI ด้วยการใช้เทคนิค Text Diffusion ในการสร้างข้อความ ทำให้สามารถทำงานได้เร็วกว่าเดิมถึง 4 เท่าเมื่อใช้งานบนการ์ดจอ (GPU) โดยเปิดให้ใช้งานฟรีแบบ Open-source ภายใต้ลิขสิทธิ์ Apache 2.0
จาก "เครื่องพิมพ์ดีด" สู่ "แท่นพิมพ์" หากเปรียบเทียบให้เห็นภาพ โมเดลภาษาทั่วไปที่เราใช้กันอยู่ทุกวันนี้ทำงานเหมือน "เครื่องพิมพ์ดีด" ที่ต้องค่อยๆ พิมพ์ออกมาทีละคำจากซ้ายไปขวา ซึ่งเมื่อนำมารันบนคอมพิวเตอร์ส่วนตัว (Local) จะทำให้การ์ดจอทำงานได้ไม่เต็มที่เพราะต้องเสียเวลารอคำต่อไป แต่ DiffusionGemma เปลี่ยนแนวทางใหม่โดยทำงานเหมือน "แท่นพิมพ์" ที่สามารถสร้างข้อความความยาว 256 โทเค็น (ประมาณ 1 ย่อหน้า) ออกมาได้พร้อมกันในรวดเดียว
โดยมันใช้หลักการทำงานคล้ายกับ AI สร้างภาพ (Image Generators) คือเริ่มต้นจากข้อความที่สุ่มขึ้นมามั่วๆ เหมือนภาพซ่าๆ แล้วค่อยๆ ขัดเกลาและแก้ไขคำต่างๆ จนกลายเป็นข้อความที่สมบูรณ์
จุดเด่นที่น่าสนใจของ DiffusionGemma
- ความเร็วทะลุขีดจำกัด: สามารถประมวลผลได้มากกว่า 1,000 โทเค็นต่อวินาทีบนการ์ดจอระดับองค์กร (NVIDIA H100) และมากกว่า 700 โทเค็นต่อวินาทีบนการ์ดจอทั่วไปอย่าง NVIDIA GeForce RTX 5090
- เป็นมิตรกับคอมพิวเตอร์ทั่วไป: ตัวโมเดลมีขนาด 26B (Mixture of Experts) แต่ดึงมาใช้งานจริงขณะประมวลผลเพียง 3.8B พารามิเตอร์ ทำให้สามารถรันบนคอมพิวเตอร์ทั่วไปที่มี VRAM เพียง 18GB ได้อย่างสบายๆ
- เก่งงานที่ซับซ้อนและการแก้ไข: เนื่องจากโมเดลสามารถมองเห็นโครงสร้างข้อความทั้งหมดได้พร้อมกัน (Bi-directional attention) จึงเก่งมากในเรื่องการแก้ไขข้อความ แทรกโค้ด หรือแม้กระทั่งการแก้เกมปริศนาอย่าง "ซูโดกุ" (Sudoku) ที่ AI แบบพิมพ์ทีละคำมักจะทำไม่ค่อยได้
- มีระบบแก้ไขตัวเอง: สามารถตรวจสอบและแก้ไขข้อผิดพลาดของข้อความทั้งก้อนได้ในทันที
ข้อควรรู้ก่อนใช้งาน แม้ DiffusionGemma จะเร็วแบบก้าวกระโดด แต่ทางผู้พัฒนาได้ระบุว่า หากคุณต้องการผลลัพธ์ที่มี "คุณภาพและความแม่นยำสูงสุด" โมเดลรุ่นมาตรฐานอย่าง Gemma 4 ยังคงเป็นตัวเลือกที่ดีกว่า โมเดล DiffusionGemma นี้จึงถูกออกแบบมาเพื่อนักวิจัยและนักพัฒนาที่ต้องการนำไปใช้กับงานบนคอมพิวเตอร์แบบออฟไลน์ที่เน้น "ความเร็วแบบเรียลไทม์" และการทำงานแบบโต้ตอบเป็นหลัก
สำหรับนักพัฒนาที่สนใจสร้างสรรค์แอปพลิเคชัน AI ที่รวดเร็วทันใจ สามารถดาวน์โหลดโมเดล DiffusionGemma ไปทดลองใช้งานได้แล้ววันนี้บน Hugging Face



ความคิดเห็น
แสดงความคิดเห็น