บทความนี้อิงตามการสนทนาจาก Lex Fridman Podcast: ฟังตอนนี้ได้ที่นี่

ในการสนทนาครั้งนี้ Lex Fridman ได้พูดคุยกับ Dylan Patel และ Nathan Lambert เกี่ยวกับพัฒนาการล่าสุดในด้าน AI โดยเน้นที่ DeepSeek ความทะเยอทะยานด้าน AI ของจีน บทบาทของ NVIDIA ในการแข่งขัน AI ระดับโลก และอนาคตของเมกะคลัสเตอร์ AI การสนทนาครอบคลุมถึงความก้าวหน้าในด้านประสิทธิภาพของ AI การต่อสู้ทางภูมิรัฐศาสตร์เพื่อครองความเหนือกว่าของเซมิคอนดักเตอร์ และผู้เล่นหลักที่มีอิทธิพลต่ออนาคตของปัญญาประดิษฐ์

ปัญญาประดิษฐ์กำลังพัฒนาด้วยความเร็วสูง แต่ไม่ใช่ในรูปแบบที่คนส่วนใหญ่คาดหวัง 

พาดหัวข่าวต่างพากันพูดถึงโมเดลที่ใหญ่กว่า พารามิเตอร์ที่มากขึ้น และความสามารถใหม่ ๆ ที่น่าทึ่ง แต่เบื้องหลังกระแสฮือฮาเหล่านี้ กำลังมีการปฏิวัติที่เงียบกว่าเกิดขึ้น นั่นคือการทำให้ AI มีประสิทธิภาพมากขึ้น คุ้มทุนมากขึ้น และมีกลยุทธ์ทางภูมิรัฐศาสตร์มากขึ้น 

หากคุณสังเกตดีๆ คุณจะสังเกตเห็นสิ่งที่ยิ่งใหญ่ นั่นคือวงการ AI ของจีนกำลังเติบโตอย่างรวดเร็วในแบบที่ไม่มีใครคาดคิด

โมเดล AI ที่ชาญฉลาดยิ่งขึ้น: แนวทางการผสมผสานของผู้เชี่ยวชาญ

ไม่ใช่ความลับที่โมเดลภาษาขนาดใหญ่ (LLM) ต้องใช้พลังประมวลผลมหาศาล การฝึกโมเดลหนึ่งตั้งแต่เริ่มต้นอาจมีค่าใช้จ่ายหลายร้อยล้านดอลลาร์ และการดำเนินการล่ะ นั่นเป็นหลุมค่าใช้จ่ายที่ไม่มีวันหมดสิ้นอีกหลุมหนึ่ง อนาคตของ AI จะไม่ได้ขึ้นอยู่กับว่าใครมีอัลกอริทึมที่ดีที่สุดเท่านั้น แต่จะถูกกำหนดโดยว่าใครคิดวิธีสร้างโมเดล AI ที่มีประสิทธิภาพได้อย่างไร ปราศจาก ค่าใช้จ่ายด้านเซิร์ฟเวอร์คิดเป็น GDP ของประเทศ และนั่นคือจุดที่การเปลี่ยนแปลงครั้งใหญ่กำลังเกิดขึ้น

แทนที่จะเพิ่มขนาดของโมเดลขึ้นอย่างไม่มีที่สิ้นสุด วิศวกรกำลังพัฒนาความชาญฉลาดมากขึ้นเกี่ยวกับวิธีทำงานจริงของระบบเหล่านี้

 เข้า ส่วนผสมของผู้เชี่ยวชาญ แบบจำลอง 

ลองนึกภาพว่าคุณกำลังรวบรวมคณะผู้เชี่ยวชาญ แต่แทนที่จะให้ผู้เชี่ยวชาญทุกคนทำงานในทุกคำถาม คุณกลับเปิดใช้งานเฉพาะผู้ที่มีความเหมาะสมที่สุดสำหรับงานนั้นๆ เท่านั้น นั่นคือวิธีการทำงานของโมเดลใหม่เหล่านี้ แทนที่จะมีเครือข่ายประสาทขนาดยักษ์ที่ประมวลผลทุกคำขออย่างเต็มกำลัง โมเดลย่อยของ "ผู้เชี่ยวชาญ" เพียงไม่กี่ตัวเท่านั้นที่เปิดใช้งานในเวลาที่กำหนด ผลลัพธ์ก็คือ ประสิทธิภาพที่เพิ่มขึ้นอย่างมหาศาล ทั้งการคำนวณและการใช้พลังงาน โดยไม่ต้องเสียสละความชาญฉลาด

นี่ไม่ใช่แค่เพียงทฤษฎี

 โมเดล AI ล่าสุดบางรุ่นที่ออกมาจากจีนพิสูจน์ให้เห็นว่าวิธีการนี้ใช้ได้ผลกับการใช้งานจริง โดยการปรับแต่งวิธีการจัดสรรการคำนวณอย่างละเอียด ทำให้ได้ประสิทธิภาพที่เทียบเคียงได้กับโมเดลที่ดีที่สุดในโลกตะวันตก แต่มีค่าใช้จ่ายเพียงเศษเสี้ยวเดียวเท่านั้น

ความก้าวหน้าในการเพิ่มประสิทธิภาพระดับต่ำ

ซึ่งนำเราไปสู่การเปลี่ยนแปลงครั้งใหญ่ครั้งต่อไป: การเพิ่มประสิทธิภาพระดับต่ำ.

 บริษัท AI ส่วนใหญ่พึ่งพาเฟรมเวิร์กซอฟต์แวร์ที่มีอยู่ เช่น CUDA ซึ่งพัฒนาโดย NVIDIA เพื่อฝึกอบรมโมเดลของตน แต่เฟรมเวิร์กเหล่านี้ไม่ได้ออกแบบมาเพื่อประสิทธิภาพสูงสุด แต่ถูกสร้างขึ้นมาเพื่อการใช้งานทั่วไป บริษัทที่ประสบความสำเร็จอย่างแท้จริงในขณะนี้คือบริษัทที่ประสบความสำเร็จ การออกแบบใหม่ วิธีที่ AI ใช้ฮาร์ดแวร์ 

พวกเขาไม่ได้ใช้แค่ GPU เท่านั้น แต่พวกเขากำลังดึงประสิทธิภาพทุกหยดออกมา โดยเขียนกฎการเขียนโปรแกรม GPU ใหม่เพื่อให้การคำนวณเร็วขึ้น เบาลง และถูกกว่าอย่างเห็นได้ชัด

การแข่งขันเพื่อพลังการประมวลผล

และเมื่อเป็นเรื่องของฮาร์ดแวร์ ขนาดก็เป็นสิ่งสำคัญ

 ผู้เล่นรายใหญ่บางรายในด้าน AI ดำเนินการคลัสเตอร์การคำนวณขนาดใหญ่ ซึ่งโดยพื้นฐานแล้วคือฟาร์มเซิร์ฟเวอร์ขนาดยักษ์ที่มี GPU มากถึงหลายหมื่นตัว สำหรับบริบท Meta มีคลัสเตอร์การฝึกอบรมที่เทียบเท่า GPU H100 ประมาณ 60,000 ถึง 100,000 ตัว โมเดล AI ใหม่ล่าสุดของจีนกำลังได้รับการฝึกฝนบนคลัสเตอร์ที่มี GPU ประมาณ 50,000 ตัว ซึ่งถือว่ามีกำลังเพียงพอที่จะตามทัน GPU ที่ดีที่สุดในโลก 

ขนาดของการลงทุนเหล่านี้แสดงให้เห็นว่า AI ไม่ได้เป็นเพียงการแข่งขันทางอุตสาหกรรมเทคโนโลยีอีกต่อไป แต่กลายเป็นประเด็นสำคัญระดับชาติไปแล้ว

กระดานหมากรุกภูมิรัฐศาสตร์ของ AI

แน่นอนว่าภูมิทัศน์ของ AI ไม่ใช่แค่เรื่องของใครสามารถฝึกโมเดลได้เร็วที่สุดเท่านั้น แต่ยังเป็นเรื่องของใครที่สามารถ ได้จริง ฮาร์ดแวร์ที่จำเป็น และนั่นคือจุดที่ภูมิรัฐศาสตร์เข้ามามีบทบาท 

สหรัฐฯ ได้ใช้มาตรการควบคุมการส่งออกชิป AI ระดับไฮเอนด์ที่เข้มงวดยิ่งขึ้น โดยจำกัดการขายชิปเหล่านี้ไปยังจีน NVIDIA ได้ตอบโต้ด้วยการผลิต GPU เวอร์ชันลดขนาดสำหรับตลาดจีนโดยเฉพาะ 

ซึ่งหมายความว่าแม้ว่าบริษัท AI ของจีนจะยังสามารถฝึกโมเดลขนาดใหญ่ได้ แต่พวกเขาก็ถูกบังคับให้ทำเช่นนั้นด้วยฮาร์ดแวร์ที่มีประสิทธิภาพน้อยกว่าเล็กน้อย แต่สิ่งที่น่าสนใจก็คือ ข้อจำกัดเหล่านี้กำลังผลักดันให้บริษัท AI ของจีนต้องเอาคืน มากกว่า มีประสิทธิภาพ แทนที่จะใช้กำลังเข้าต่อสู้เพื่อก้าวขึ้นสู่จุดสูงสุดด้วยการประมวลผลที่ไม่จำกัด พวกเขากลับถูกบังคับให้คิดค้นนวัตกรรมใหม่ๆ 

พวกเขากำลังปรับปรุงซอฟต์แวร์ พิจารณาสถาปัตยกรรมใหม่ และค้นหาวิธีในการดึงประสิทธิภาพที่เพิ่มขึ้นซึ่งบริษัทในตะวันตกยังไม่ได้พิจารณาด้วยซ้ำ ข้อจำกัดเหล่านี้กลับทำให้พวกเขากลายเป็นคู่แข่งที่แข็งแกร่งขึ้นอย่างน่าประหลาดใจ

เรากำลังเข้าใกล้ AGI หรือไม่?

และยังมีคำถามภาพรวมที่เกิดขึ้นรอบตัวเราอีกว่า เราใกล้เคียงกับปัญญาประดิษฐ์ทั่วไป (AGI) แค่ไหน 

บางคนแย้งว่าโมเดลในปัจจุบันได้แสดงให้เห็นบางอย่างแล้ว ความสามารถของ AI ในยุคใหม่ที่สามารถปรับตัวให้เข้ากับงานต่างๆ ได้หลากหลาย เช่น การใช้เหตุผล การแก้ปัญหา และความคิดสร้างสรรค์ แสดงให้เห็นว่าเราอาจก้าวไปไกลกว่าที่ผู้คนคาดไว้ในการก้าวไปสู่ AGI 

ด้วยพลังการผลิตของจีน ทำให้จีนอยู่ในตำแหน่งที่โดดเด่นในการเร่งความก้าวหน้า ในขณะที่สหรัฐอเมริกาและยุโรปครองตลาดซอฟต์แวร์ AI จีนกลับเป็นกระดูกสันหลังของฮาร์ดแวร์ AI จีนควบคุมห่วงโซ่อุปทานเซมิคอนดักเตอร์ของโลกเป็นส่วนใหญ่ ทำให้จีนมีความได้เปรียบในการผลิตชิปจำนวนมากที่จำเป็นสำหรับการฝึกและปรับใช้ระบบ AI ในระดับขนาดใหญ่

ไต้หวัน: ศูนย์กลางของจักรวาล AI

สิ่งนี้พาเราไปสู่ไต้หวัน ฮีโร่ที่ไม่มีใครรู้จักของการแข่งขัน AI ระดับโลก บริษัท Taiwan Semiconductor Manufacturing Company (TSMC) ผลิตชิป AI ที่ทันสมัยที่สุดในโลก โมเดล AI แทบทุกโมเดล ไม่ว่าจะเป็น GPT ของ OpenAI, Gemini ของ Google หรือระบบการเรียนรู้เชิงลึกล่าสุดของจีน ล้วนอาศัยชิปที่ผลิตโดย TSMC

 หากมีสิ่งใดมาขัดขวางห่วงโซ่อุปทานของ TSMC ผลกระทบจะตามมาอย่างกว้างขวาง ทั้งหมด อุตสาหกรรมตั้งแต่สมาร์ทโฟนไปจนถึงซูเปอร์คอมพิวเตอร์ AI ไม่ใช่แค่เรื่องของการพัฒนาโค้ดอีกต่อไป แต่เป็นเรื่องของห่วงโซ่อุปทานระดับโลก พันธมิตรเชิงกลยุทธ์ และเสถียรภาพทางภูมิรัฐศาสตร์

อนาคตของ AI: ประสิทธิภาพชนะ

แล้วทั้งหมดนี้เราจะเหลืออะไรล่ะ? 

AI กำลังเปลี่ยนจากการแข่งขันแบบใช้กำลังเพื่อตัดสินว่าใครมีโมเดลที่ใหญ่ที่สุด ไปสู่เกมที่เน้นกลยุทธ์มากขึ้นในด้านประสิทธิภาพ ความเชี่ยวชาญด้านฮาร์ดแวร์ และการวางตำแหน่งทางภูมิรัฐศาสตร์ บริษัท (และประเทศต่างๆ) ที่คิดหาวิธีเพิ่มประสิทธิภาพ ปรับขนาด และนำ AI มาใช้ได้อย่างมีประสิทธิภาพจะเป็นผู้ครองอนาคต และหากคุณไม่ได้ใส่ใจกับการเปลี่ยนแปลงเหล่านี้ คุณก็กำลังพลาดเรื่องราวที่แท้จริงของ AI ที่กำลังมุ่งหน้าไป

นี่ไม่ใช่แค่เรื่องของเดโม่สุดหวือหวาหรือคะแนนเกณฑ์มาตรฐานที่ทำลายสถิติเท่านั้น

 มันเกี่ยวกับใคร จริงๆ แล้ว ผู้ชนะการแข่งขัน AI ในระยะยาวคือใครก็ตามที่สร้างโมเดลที่ไม่เพียงแต่ทรงพลังแต่ยังใช้งานได้จริง ปรับขนาดได้ และยั่งยืน และการแข่งขันนั้นล่ะ? นับวันยิ่งน่าสนใจมากขึ้น

โพสโดย ลีโอ เจียง
โพสก่อนหน้า
คุณอาจชอบเช่นกัน

ฝากความคิดเห็นของคุณ:

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *