Skip to content

LLM และ AI Agent

คือโมเดลภาษาขนาดใหญ่มีความเข้าใจภาษามนุษย์เป็นอย่างดี เช่น Gemini, GPT, CLAUDE เป็นต้น โดยหลักการทำงานของมันก็คือการเดาคำถัดไปที่ใกล้เคียง ตาม prompt ที่ผู้ใช้ป้อนเข้าไป

ตัวอย่างเช่น เมื่อป้อนประโยค: "ท่าน กำลัง เข้า สู่ บริการ รับ ฝาก หัว ____"

LLM จะเดาคำถัดไป:

  • ใจ 98.5%
  • ขโมย 1.0%
  • มัน 0.3%

token prediction

  • เป็น passive: มันจะทำงานก็ต่อเมื่อผู้ใช้ป้อนคำถามไป AI ก็ตอบ
  • LLM เป็นเหมือนสมองแต่ไม่มีแขนขา สามารถคิดได้แต่ลงมือไม่ได้ เช่น LLM สามารถบอกวิธีการสั่งซื้อของ Online จากเว็บ Amazon ได้แต่ไม่สามารถกดสั่งซื้อแทนผู้ใช้งานได้

ด้วยข้อจำกัดนี่เองจึงเกิดแนวคิดที่เรียกว่า AI Agent เพื่อมาแก้ไขข้อกำจัดเหล่านี้

พอผู้พัฒนาเริ่มรู้สึกว่า LLM (สมอง) มันฉลาดมากพอแล้ว แต่อยากให้มันทำได้มากกว่าแค่ตอบคำถาม จึงได้เริ่มพัฒนาระบบที่ทำให้ AI สามารถใช้เครื่องมือได้ จนกลายเป็น AI Agent ในที่สุด

ยกตัวอย่างถ้าเราอยากให้ LLM มันสามารถค้นหา Google ได้ เราก็แค่บอก AI ว่าเรามีเครื่องมือ google ให้ใช้สำหรับค้นหาข้อมูลนะ LLM ก็จะเริ่มมีแขนมีขา สามารถค้นหา Google แทนเราได้

อีกกรณีหนึ่ง เนื่องจาก LLM พื้นฐานมันเป็นการเดาคำไปเรื่อย บางที่ถ้าถามปัญหาทางคณิตศาสตร์ ถ้าโจทย์ที่มันซ้ำๆ เดิมๆ มันก็มักจะตอบถูก แต่ถ้าโจทย์ที่มันผลิกแพลงมาหน่อยมันก็อาจจะเริ่มมั่ว เราจึงแก้ปัญหานี้ด้วยการให้มันใช้เครื่องมือเครื่องคิดเลขได้ ผลลัพธ์หลังจากที่มันได้ใช้เครื่องมือมันจะถูกต้องมากขึ้น

ส่วนประกอบสำคัญของ AI Agent

Section titled “ส่วนประกอบสำคัญของ AI Agent”

การที่ LLM จะอัปเกรดเป็น Agent ได้ จะต้องมีองค์ประกอบ 4 ส่วนหลักๆ (อ้างอิงตามสถาปัตยกรรมของ AI Agent ยุคปัจจุบัน) ดังนี้:

สมองส่วนกลางที่ใช้คิด วิเคราะห์ และทำความเข้าใจคำสั่ง

Agent สามารถย่อยเป้าหมายใหญ่ให้กลายเป็น Task ย่อยๆ เองได้ เช่น ถ้าเราสั่งว่า “ช่วยหาโน้ตบุ๊กงบ 30,000 บาทที่เหมาะกับการเล่นเกมให้หน่อย” มันจะคิดเองว่า:

  • Step 1: ต้องไปหาเช็คสเปกขั้นต่ำของเกมยุคนี้
  • Step 2: ไปค้นหาร้านค้าออนไลน์ในไทย
  • Step 3: เปรียบเทียบราคาและคะแนนรีวิว
  • Short-term memory: จำบริบทที่กำลังคุยหรือทำอยู่ในงานนั้นๆ
  • Long-term memory: สามารถบันทึกข้อมูลเก็บไว้ในฐานข้อมูล (เช่น Vector Database) เพื่อดึงมาใช้ในอนาคตได้ ทำให้มันรู้จักพฤติกรรมหรือความชอบของเราในระยะยาว

4. Tools (เครื่องมือ/แขนขา)

Section titled “4. Tools (เครื่องมือ/แขนขา)”

นี่คือจุดเปลี่ยนสำคัญ! Agent จะได้รับอนุญาตให้ใช้เครื่องมือภายนอกได้ เช่น:

  • Web Browser: เพื่อไปเสิร์ชหาข้อมูลล่าสุดบน Google (แก้ปัญหา LLM ข้อมูลเก่า)
  • Calculator: เพื่อคำนวณเลขยากๆ ได้แม่นยำ
  • API/Code Execution: เพื่อสั่งรันโค้ด, ส่งอีเมล, ดึงข้อมูลสภาพอากาศ หรือต่อเข้ากับซอฟต์แวร์อื่นๆ (เช่น Notion, Slack, Jira)
Avatar blackCat
Opencode คือเครื่องมือที่จะเปลี่ยนวิธีทำงานของคุณไปตลอดกาล!

ความเข้าใจพื้นฐานเกี่ยวกับ LLM และ AI Agent

ข้อ 1 / 40%

LLM ย่อมาจากอะไร?