Touchapon Kraisingkorn
2
นาที อ่าน
June 12, 2024

LLMs vs. SLMs: เลือกโมเดลที่เหมาะสมให้ Generative AI

แบบจำลองภาษา (Language Models) ได้เปลี่ยนแปลงวงการประมวลผลภาษาธรรมชาติ (Natural Language Processing หรือ NLP) ไปโดยสิ้นเชิง โมเดลนี้ทำให้คอมพิวเตอร์สามารถเข้าใจ สร้าง แล้วก็จัดการภาษาของมนุษย์ได้อย่างแม่นยำเหลือเชื่อ แบบจำลองพวกนี้ถูกเทรนด้วยข้อมูลเยอะแยะมากมาย กลายเป็นส่วนสำคัญมากๆ ของแอปพลิเคชันต่างๆ ตั้งแต่แชทบอท ผู้ช่วยเสมือน ไปจนถึงการวิเคราะห์ความรู้สึกและการสรุปข้อความ

ในขณะเดียวกัน แบบจำลองภาษาพวกนี้ก็ไม่ได้ถูกสร้างมาเหมือนกันซะทีเดียว บทความนี้จะพาเราไปดูความแตกต่างที่สำคัญระหว่างแบบจำลองภาษาขนาดใหญ่ (Large Language Models หรือ LLMs) กับแบบจำลองภาษาขนาดเล็ก (Small Language Models หรือ SLMs) ว่ามีข้อดีข้อเสียยังไงบ้าง รวมถึงคำแนะนำเชิงกลยุทธ์ในการเลือกแบบจำลองที่เหมาะสมที่สุดสำหรับความต้องการเฉพาะของแต่ละบุคคล

Large Language Models (LLMs)

แบบจำลองภาษาขนาดใหญ่ (LLMs) มีลักษณะเด่นคือใช้ชุดข้อมูลขนาดใหญ่มหาศาลและมีพารามิเตอร์จำนวนมาก แบบจำลองเหล่านี้ออกแบบมาเพื่อรองรับการใช้งานได้หลากหลายวัตถุประสงค์ ทำให้มีความยืดหยุ่นสูงในการประยุกต์ใช้กับแอปพลิเคชั่นที่หลากหลาย ด้วยความเข้าใจภาษาอย่างถ่องแท้ LLMs จึงโดดเด่นในงานที่ซับซ้อน เช่น การวิเคราะห์ความรู้สึก การตอบคำถาม และการสรุปข้อความ 

อย่างไรก็ตาม ความสามารถรอบด้านนี้ก็มีต้นทุนสูง LLMs ต้องการใช้ทรัพยากรเป็นจำนวนมาก ทั้งพลังการประมวลผลและหน่วยความจำ ซึ่งอาจทำให้ต้นทุนการดำเนินงานสูงขึ้น แต่ถึงจะมีข้อจำกัด ความแม่นยำและประสิทธิภาพของ LLMs ก็ไม่มีใครเทียบได้ จึงเป็นมาตรฐานสำหรับงาน NLP หลายประเภท

ตัวอย่างของแบบจำลองภาษาขนาดใหญ่ LLMs

โลโก้ Google Gemini, Claude3, GPT-4o
ตัวอย่างโมเดล LLMs

Claude 3: พัฒนาโดย Anthropic, Claude 3 ขึ้นชื่อเรื่องความสามารถในการสนทนาขั้นสูงและความเข้าใจในคำถามที่ซับซ้อน

GPT-4o: เวอร์ชั่นล่าสุดโดย OpenAI ให้ประสิทธิภาพและความแม่นยำที่เหนือกว่ารุ่นที่ผ่านมา เหมาะสำหรับใช้งานในแอปพลิเคชั่นที่หลากหลาย

Google Gemini: แบบจำลองโดย Google มีความโดดเด่นในด้านการทำความเข้าใจและสร้างภาษา มีประสิทธิภาพโดดเด่นในงาน NLP ที่หลากหลาย

Small Language Models (SLMs)

ในทางกลับกัน แบบจำลองภาษาขนาดเล็กมีพารามิเตอร์จำนวนจำกัด แบบจำลองเหล่านี้มักถูกปรับแต่งมาสำหรับกรณีการใช้งานเฉพาะทาง ซึ่งอาจทำให้มีประสิทธิภาพเหนือกว่าแบบจำลองขนาดใหญ่ เนื่องจากผ่านการฝึกฝนที่เน้นเฉพาะโดเมนหรืองานเฉพาะ

SLMs มีความคุ้มค่ามากกว่าและใช้ทรัพยากรการประมวลผลน้อยกว่า ทำให้เป็นที่เข้าถึงได้ง่ายสำหรับองค์กรที่มีงบประมาณจำกัดหรือมีโครงสร้างพื้นฐานไม่มาก แม้ว่า SLMs อาจจะไม่เทียบเท่ากับความแม่นยำและความสามารถรอบด้านของ LLMs ในงานทั่วไป แต่ก็มีประสิทธิภาพสูงในสถานการณ์ที่ต้องการประสิทธิภาพเฉพาะทางและการใช้งานอย่างรวดเร็ว

ตัวอย่างของแบบจำลองภาษาขนาดเล็ก SLMs

โลโก้ Google Gemma, Phi-3, Mistral 7B
ตัวอย่างของ SLMs

Phi-3: พัฒนาโดย Microsoft, Phi-3 ได้รับการปรับแต่งให้เหมาะสมกับงานเฉพาะ มีพารามิเตอร์ประมาณ 3-8 พันล้านตัว

Google Gemma: แบบจำลองขนาดเล็กกว่าโดย Google ออกแบบมาเพื่อประสิทธิภาพที่มีประสิทธิภาพในแอปพลิเคชั่นเฉพาะทาง

Mistral 7B: ขึ้นชื่อเรื่องสถาปัตยกรรมที่เบาและกะทัดรัด Mistral 7B ให้ประสิทธิภาพที่ดีด้วยพารามิเตอร์ที่น้อยกว่า เหมาะอย่างยิ่งสำหรับการประมวลผลแบบ edge computing

ความแตกต่างหลักระหว่าง LLMs และ SLMs

การใช้ทรัพยากร: LLMs ต้องการทรัพยากรการประมวลผลและหน่วยความจำเป็นอย่างมาก ในขณะที่ SLMs ใช้ทรัพยากรอย่างประหยัดกว่า

ความแม่นยำและประสิทธิภาพ: โดยทั่วไปแล้ว LLMs ให้ความแม่นยำและประสิทธิภาพที่เหนือกว่าในงานที่หลากหลาย ในขณะที่ SLMs โดดเด่นในแอปพลิเคชั่นเฉพาะทาง

ความเชี่ยวชาญเฉพาะด้าน: SLMs มักเหมาะสมกว่าสำหรับงานเฉพาะโดเมนหรือเฉพาะกรณีการใช้งาน เนื่องจากผ่านการฝึกฝนเฉพาะทางและปรับแต่งได้ง่าย ในขณะที่ LLMs ให้โซลูชั่นที่ใช้ได้กว้างขวางกว่า

คำแนะนำเชิงกลยุทธ์ในการใช้แบบจำลองภาษา

การทดสอบเบื้องต้นกับ LLMs

เป็นการแนะนำว่าควรเริ่มจาก LLMs เมื่อออกแบบและพัฒนาแอปพลิเคชั่น AI เชิงสร้างสรรค์ วิธีนี้จะช่วยให้พัฒนากรณีการใช้งานได้อย่างรวดเร็ว ทดสอบกับผู้ใช้ได้โดยไม่ต้องเสียเวลากับการออกแบบพรอมต์หรือปรับแต่งมากนัก นอกจากนี้ LLMs แต่ละตัวก็มีจุดแข็งจุดอ่อนแตกต่างกัน ดังนั้นจึงควรทำการทดสอบและวัดผลก่อนที่จะเลือกใช้

การปรับแต่งและเปลี่ยนผ่าน

เมื่อระบบใช้งานได้แล้ว ให้พิจารณาปรับปรุงประสิทธิภาพโดยเปลี่ยนบางส่วนที่ใช้ LLMs เป็น SLMs แทน วิธีนี้จะช่วยเพิ่มประสิทธิภาพโดยไม่ต้องเสียสละประสิทธิภาพมากนัก แต่ก็มีความเป็นไปได้สูงที่ SLMs จะไม่สามารถทดแทน LLMs ได้โดยตรงในฟังก์ชันหรือส่วนประกอบที่ใช้ LLMs ในตอนแรก คุณอาจจำเป็นต้องทำการปรับแต่งเพิ่มเติมหรือใช้การทำงานแบบ Agentic Workflow (เช่น Chain-of-thought, Reflection เป็นต้น) เพื่อยกระดับประสิทธิภาพของ SLMs ให้ทัดเทียมกับกรณีการใช้งานเฉพาะของคุณ

Cloud กับ Edge AI

ประเมินว่ากรณีการใช้งานของคุณต้องการ AI ที่ใช้งาน ณ ขอบเครือข่าย (Edge) ที่มี latency ต่ำมากหรือไม่ หากใช่ SLMs อาจเหมาะสมกว่าเนื่องจากใช้ทรัพยากรน้อยกว่าและใช้งานได้เร็วกว่า ทำให้เหมาะอย่างยิ่งสำหรับสภาพแวดล้อมการประมวลผลแบบ edge computing

ตารางแสดงข้อมูลศักยภาพการทำงานของ LLMs และ SLMs
ตารางแสดงความสามารถของ LLMs และ SLMs

บทสรุป

การเลือกใช้ระหว่างแบบจำลองภาษาขนาดใหญ่หรือเล็กนั้นขึ้นอยู่กับปัจจัยต่างๆ รวมถึงงานเฉพาะที่เราต้องการทำ ความพร้อมของข้อมูล ทรัพยากรการประมวลผล และการชั่งน้ำหนักระหว่างความแม่นยำกับประสิทธิภาพ ในขณะที่ LLMs ให้ความแม่นยำและความสามารถที่หาได้ยาก SLMs ก็ให้โซลูชั่นที่คุ้มค่าและเฉพาะทาง

การเริ่มต้นด้วย LLMs เพื่อสร้างต้นแบบที่รวดเร็วและค่อยๆ ปรับแต่งด้วย SLMs องค์กรจะสามารถบรรลุแนวทางที่สมดุลและตอบสนองความต้องการเฉพาะได้ การประเมินปัจจัยเหล่านี้และการเลือกให้เข้ากับวัตถุประสงค์เฉพาะของคุณอาจซับซ้อน การปรึกษากับผู้เชี่ยวชาญจะช่วยแนะนำผ่านกระบวนการเพื่อให้บรรลุได้

ทาง Amity Solutions ก็มีบริการ generative AI ที่ช่วยเพิ่มประสิทธิภาพการดำเนินงานเช่นกัน ปรึกษาผู้เชี่ยวชาญของเราได้ที่นี่