LLM และ AI Agent
คือโมเดลภาษาขนาดใหญ่มีความเข้าใจภาษามนุษย์เป็นอย่างดี เช่น Gemini, GPT, CLAUDE เป็นต้น โดยหลักการทำงานของมันก็คือการเดาคำถัดไปที่ใกล้เคียง ตาม prompt ที่ผู้ใช้ป้อนเข้าไป
ตัวอย่างเช่น เมื่อป้อนประโยค:
"ท่าน กำลัง เข้า สู่ บริการ รับ ฝาก หัว ____"
LLM จะเดาคำถัดไป:
- ใจ 98.5%
- ขโมย 1.0%
- มัน 0.3%

ข้อจำกัดของ LLM
Section titled “ข้อจำกัดของ LLM”- เป็น passive: มันจะทำงานก็ต่อเมื่อผู้ใช้ป้อนคำถามไป AI ก็ตอบ
- LLM เป็นเหมือนสมองแต่ไม่มีแขนขา สามารถคิดได้แต่ลงมือไม่ได้ เช่น LLM สามารถบอกวิธีการสั่งซื้อของ Online จากเว็บ Amazon ได้แต่ไม่สามารถกดสั่งซื้อแทนผู้ใช้งานได้
ด้วยข้อจำกัดนี่เองจึงเกิดแนวคิดที่เรียกว่า AI Agent เพื่อมาแก้ไขข้อกำจัดเหล่านี้
AI Agent คืออะไร
Section titled “AI Agent คืออะไร”พอผู้พัฒนาเริ่มรู้สึกว่า LLM (สมอง) มันฉลาดมากพอแล้ว แต่อยากให้มันทำได้มากกว่าแค่ตอบคำถาม จึงได้เริ่มพัฒนาระบบที่ทำให้ AI สามารถใช้เครื่องมือได้ จนกลายเป็น AI Agent ในที่สุด
ยกตัวอย่างถ้าเราอยากให้ LLM มันสามารถค้นหา Google ได้ เราก็แค่บอก AI ว่าเรามีเครื่องมือ google ให้ใช้สำหรับค้นหาข้อมูลนะ LLM ก็จะเริ่มมีแขนมีขา สามารถค้นหา Google แทนเราได้
อีกกรณีหนึ่ง เนื่องจาก LLM พื้นฐานมันเป็นการเดาคำไปเรื่อย บางที่ถ้าถามปัญหาทางคณิตศาสตร์ ถ้าโจทย์ที่มันซ้ำๆ เดิมๆ มันก็มักจะตอบถูก แต่ถ้าโจทย์ที่มันผลิกแพลงมาหน่อยมันก็อาจจะเริ่มมั่ว เราจึงแก้ปัญหานี้ด้วยการให้มันใช้เครื่องมือเครื่องคิดเลขได้ ผลลัพธ์หลังจากที่มันได้ใช้เครื่องมือมันจะถูกต้องมากขึ้น
ส่วนประกอบสำคัญของ AI Agent
Section titled “ส่วนประกอบสำคัญของ AI Agent”การที่ LLM จะอัปเกรดเป็น Agent ได้ จะต้องมีองค์ประกอบ 4 ส่วนหลักๆ (อ้างอิงตามสถาปัตยกรรมของ AI Agent ยุคปัจจุบัน) ดังนี้:
1. Core Brain (LLM)
Section titled “1. Core Brain (LLM)”สมองส่วนกลางที่ใช้คิด วิเคราะห์ และทำความเข้าใจคำสั่ง
2. Planning (การวางแผน)
Section titled “2. Planning (การวางแผน)”Agent สามารถย่อยเป้าหมายใหญ่ให้กลายเป็น Task ย่อยๆ เองได้ เช่น ถ้าเราสั่งว่า “ช่วยหาโน้ตบุ๊กงบ 30,000 บาทที่เหมาะกับการเล่นเกมให้หน่อย” มันจะคิดเองว่า:
- Step 1: ต้องไปหาเช็คสเปกขั้นต่ำของเกมยุคนี้
- Step 2: ไปค้นหาร้านค้าออนไลน์ในไทย
- Step 3: เปรียบเทียบราคาและคะแนนรีวิว
3. Memory (ความจำ)
Section titled “3. Memory (ความจำ)”- Short-term memory: จำบริบทที่กำลังคุยหรือทำอยู่ในงานนั้นๆ
- Long-term memory: สามารถบันทึกข้อมูลเก็บไว้ในฐานข้อมูล (เช่น Vector Database) เพื่อดึงมาใช้ในอนาคตได้ ทำให้มันรู้จักพฤติกรรมหรือความชอบของเราในระยะยาว
4. Tools (เครื่องมือ/แขนขา)
Section titled “4. Tools (เครื่องมือ/แขนขา)”นี่คือจุดเปลี่ยนสำคัญ! Agent จะได้รับอนุญาตให้ใช้เครื่องมือภายนอกได้ เช่น:
- Web Browser: เพื่อไปเสิร์ชหาข้อมูลล่าสุดบน Google (แก้ปัญหา LLM ข้อมูลเก่า)
- Calculator: เพื่อคำนวณเลขยากๆ ได้แม่นยำ
- API/Code Execution: เพื่อสั่งรันโค้ด, ส่งอีเมล, ดึงข้อมูลสภาพอากาศ หรือต่อเข้ากับซอฟต์แวร์อื่นๆ (เช่น Notion, Slack, Jira)