LLM และ AI Agent

LLM

คือโมเดลภาษาขนาดใหญ่มีความเข้าใจภาษามนุษย์เป็นอย่างดี เช่น Gemini, GPT, CLAUDE เป็นต้น โดยหลักการทำงานของมันก็คือการเดาคำถัดไปที่ใกล้เคียง ตาม prompt ที่ผู้ใช้ป้อนเข้าไป

ตัวอย่างเช่น เมื่อป้อนประโยค: "ท่าน กำลัง เข้า สู่ บริการ รับ ฝาก หัว ____"

LLM จะเดาคำถัดไป:

ใจ 98.5%
ขโมย 1.0%
มัน 0.3%

token prediction

ข้อจำกัดของ LLM

เป็น passive: มันจะทำงานก็ต่อเมื่อผู้ใช้ป้อนคำถามไป AI ก็ตอบ
LLM เป็นเหมือนสมองแต่ไม่มีแขนขา สามารถคิดได้แต่ลงมือไม่ได้ เช่น LLM สามารถบอกวิธีการสั่งซื้อของ Online จากเว็บ Amazon ได้แต่ไม่สามารถกดสั่งซื้อแทนผู้ใช้งานได้

ด้วยข้อจำกัดนี่เองจึงเกิดแนวคิดที่เรียกว่า AI Agent เพื่อมาแก้ไขข้อกำจัดเหล่านี้

AI Agent คืออะไร

พอผู้พัฒนาเริ่มรู้สึกว่า LLM (สมอง) มันฉลาดมากพอแล้ว แต่อยากให้มันทำได้มากกว่าแค่ตอบคำถาม จึงได้เริ่มพัฒนาระบบที่ทำให้ AI สามารถใช้เครื่องมือได้ จนกลายเป็น AI Agent ในที่สุด

ยกตัวอย่างถ้าเราอยากให้ LLM มันสามารถค้นหา Google ได้ เราก็แค่บอก AI ว่าเรามีเครื่องมือ google ให้ใช้สำหรับค้นหาข้อมูลนะ LLM ก็จะเริ่มมีแขนมีขา สามารถค้นหา Google แทนเราได้

อีกกรณีหนึ่ง เนื่องจาก LLM พื้นฐานมันเป็นการเดาคำไปเรื่อย บางที่ถ้าถามปัญหาทางคณิตศาสตร์ ถ้าโจทย์ที่มันซ้ำๆ เดิมๆ มันก็มักจะตอบถูก แต่ถ้าโจทย์ที่มันผลิกแพลงมาหน่อยมันก็อาจจะเริ่มมั่ว เราจึงแก้ปัญหานี้ด้วยการให้มันใช้เครื่องมือเครื่องคิดเลขได้ ผลลัพธ์หลังจากที่มันได้ใช้เครื่องมือมันจะถูกต้องมากขึ้น

ส่วนประกอบสำคัญของ AI Agent

การที่ LLM จะอัปเกรดเป็น Agent ได้ จะต้องมีองค์ประกอบ 4 ส่วนหลักๆ (อ้างอิงตามสถาปัตยกรรมของ AI Agent ยุคปัจจุบัน) ดังนี้:

1. Core Brain (LLM)

สมองส่วนกลางที่ใช้คิด วิเคราะห์ และทำความเข้าใจคำสั่ง

2. Planning (การวางแผน)

Agent สามารถย่อยเป้าหมายใหญ่ให้กลายเป็น Task ย่อยๆ เองได้ เช่น ถ้าเราสั่งว่า “ช่วยหาโน้ตบุ๊กงบ 30,000 บาทที่เหมาะกับการเล่นเกมให้หน่อย” มันจะคิดเองว่า:

Step 1: ต้องไปหาเช็คสเปกขั้นต่ำของเกมยุคนี้
Step 2: ไปค้นหาร้านค้าออนไลน์ในไทย
Step 3: เปรียบเทียบราคาและคะแนนรีวิว

3. Memory (ความจำ)

Short-term memory: จำบริบทที่กำลังคุยหรือทำอยู่ในงานนั้นๆ
Long-term memory: สามารถบันทึกข้อมูลเก็บไว้ในฐานข้อมูล (เช่น Vector Database) เพื่อดึงมาใช้ในอนาคตได้ ทำให้มันรู้จักพฤติกรรมหรือความชอบของเราในระยะยาว

4. Tools (เครื่องมือ/แขนขา)

นี่คือจุดเปลี่ยนสำคัญ! Agent จะได้รับอนุญาตให้ใช้เครื่องมือภายนอกได้ เช่น:

Web Browser: เพื่อไปเสิร์ชหาข้อมูลล่าสุดบน Google (แก้ปัญหา LLM ข้อมูลเก่า)
Calculator: เพื่อคำนวณเลขยากๆ ได้แม่นยำ
API/Code Execution: เพื่อสั่งรันโค้ด, ส่งอีเมล, ดึงข้อมูลสภาพอากาศ หรือต่อเข้ากับซอฟต์แวร์อื่นๆ (เช่น Notion, Slack, Jira)

Opencode คือเครื่องมือที่จะเปลี่ยนวิธีทำงานของคุณไปตลอดกาล!

ความเข้าใจพื้นฐานเกี่ยวกับ LLM และ AI Agent

ข้อ 1 / 40%

LLM ย่อมาจากอะไร?

Large Language ModelLong Language MemoryLocal Learning MachineLarge Learning Model