Vai trò của LLMs trong AI agentic: Từ những người nhận hướng dẫn trở thành những nhà tư duy tự chủ

Vai trò của LLMs trong AI agentic là phục vụ như một ‘động cơ lý luận’ trung tâm hoặc lõi nhận thức chỉ đạo hành động của hệ thống tự chủ. Sự tích hợp các mô hình ngôn ngữ lớn này là bước nhảy công nghệ chính đã biến đổi các đại lý AI từ các bot đơn giản dựa trên quy tắc thành các hệ thống tinh vi có thể hiểu mục tiêu, thực hiện các kế hoạch phức tạp, và thực thi chúng trong thế giới thực.
Hiểu được lý do tại sao các đại lý AI sử dụng LLMs là điều cần thiết cho bất kỳ nhà lãnh đạo kinh doanh, lập trình viên, hoặc người đam mê AI nào. LLM là thành phần cho phép một đại lý vượt ra khỏi việc theo dõi các hướng dẫn cứng nhắc để thể hiện khả năng xử lý ngôn ngữ và phán đoán AI tự chủ thực sự. Hướng dẫn này cung cấp một phân tích thực tế về các nhiệm vụ chính của LLM, các khung hỗ trợ hành động của nó, và các ý nghĩa kinh doanh quan trọng của công nghệ mạnh mẽ này.
Các Điểm Chính
- LLM hoạt động như ‘bộ não’ của đại lý. LLMs trong AI agentic là thành phần cốt lõi cho phép một đại lý hiểu các mục tiêu phức tạp, lập kế hoạch và đưa ra quyết định.
- Một LLM thực hiện ba nhiệm vụ quan trọng. Nó phân tích các mục tiêu cấp cao thành các bước, lý luận về chiến lược tốt nhất cho mỗi bước, và chọn ‘công cụ’ phần mềm phù hợp để hành động.
- Các khung như ReAct kết nối suy luận với hành động. Chúng tạo ra một vòng lặp nơi tác nhân ‘suy luận’ về việc phải làm gì, ‘hành động’ bằng cách sử dụng một công cụ, và sau đó sử dụng kết quả để thông báo cho suy nghĩ tiếp theo.
- Những rủi ro chính là sự ảo giác và chi phí. Một quá trình suy luận có lỗi (ảo giác) có thể dẫn đến hành động gây hại, trong khi chi phí cao của các cuộc gọi API cho các nhiệm vụ phức tạp có thể là một ràng buộc lớn cho doanh nghiệp.
- Tương lai là ‘hỗn hợp của các chuyên gia.’ Thay vì một LLM khổng lồ, các hệ thống tác nhân trong tương lai có thể sử dụng nhiều LLM nhỏ, chuyên biệt hơn để hợp tác giải quyết vấn đề một cách hiệu quả hơn.
Vai trò của Mô Hình Ngôn Ngữ Lớn (LLM) trong Tác Nhân AI là gì?
Một LLM hoạt động như bộ xử lý trung tâm của tác nhân. Nó là thành phần chịu trách nhiệm cho việc suy luận, lập kế hoạch và ra quyết định.
Tại sao điều này là một đột phá quan trọng cho AI Tác Nhân?
Sự tích hợp của LLMs trong AI agentic là một đột phá lớn vì nó giải quyết vấn đề ‘khởi động lạnh’ cho AI tác nhân mục đích chung. Nó đã cung cấp cho họ một nền tảng kiến thức thế giới khổng lồ, có sẵn và một khả năng suy luận dựa trên ngôn ngữ tinh vi. Điều này cho phép các tác nhân hiểu và xử lý một loạt các nhiệm vụ mà không cần phải được lập trình rõ ràng cho từng cái, tăng tốc đáng kể sự phát triển của hệ thống tác nhân LLM thông minh.
Trước khi có LLMs, các Tác Nhân AI đã đưa ra quyết định như thế nào?
Trước khi xuất hiện các mô hình ngôn ngữ mạnh mẽ cho các tác nhân, việc tạo ra một hệ thống tự động là một quá trình dễ tổn thương hơn nhiều và tốn nhiều công sức lao động.
Thời Đại của Các Hệ Thống Dựa Trên Quy Tắc Dễ Tổn Thương
Các agent phản xạ ban đầu dựa vào các ‘cây quyết định’ phức tạp, được lập trình bằng tay và các tập hợp quy tắc ‘nếu-thì’ khổng lồ. Các nhà phát triển phải dự đoán trước từng kịch bản có thể mà agent có thể gặp và viết quy tắc cụ thể cho nó. Cách tiếp cận này cực kỳ không linh hoạt; nếu agent đối mặt với tình huống không có trong sách quy tắc của nó, nó sẽ hoàn toàn thất bại. Điều này giới hạn ứng dụng của các agent ban đầu vào các môi trường rất ổn định và dễ dự đoán.
Ba Công Việc Cốt Lõi của LLM trong AI Hiện Đại Tự Chủ
Trong một hệ thống agent hiện đại, LLM thực hiện ba công việc nhận thức khác biệt nhưng có mối liên kết cho phép hành động tự chủ.
Phân Rã Mục Tiêu (Hiểu ‘Cái Gì’)
Công việc đầu tiên của LLM là diễn giải một mục tiêu cấp cao được diễn tả bằng ngôn ngữ tự nhiên và chia nhỏ thành một chuỗi logic gồm các bước cụ thể và khả thi.
- Cách hoạt động: Một agent có thể được giao mục tiêu trừu tượng, ‘Lên kế hoạch chiến dịch marketing cho sản phẩm mới của chúng ta.’ LLM sử dụng khả năng suy luận của mình để phân rã điều này thành một kế hoạch có cấu trúc, như là:
- Nghiên cứu đối tượng mục tiêu trên mạng xã hội.
- Viết ba phiên bản khác biệt của nội dung quảng cáo.
- Xây dựng lệnh để phân bổ ngân sách quảng cáo.
- Lên lịch chiến dịch để bắt đầu vào một ngày cụ thể.
Suy Nghĩ Chiến Lược (Tìm ra ‘Cách Làm’)
Đối với mỗi bước trong kế hoạch, LLMs trong AI agentic phải xác định cách tốt nhất để hoàn thành nó.
- Cách hoạt động: LLM sử dụng kiến thức nội bộ và các khung như ‘Chuỗi Suy Nghĩ’ để suy luận về cách tiếp cận hiệu quả nhất. Quá trình xử lý ngôn ngữ của agent này bao gồm khả năng tự điều chỉnh; nếu cố gắng đầu tiên để hoàn thành một bước thất bại, LLM có thể phân tích sự thất bại và xây dựng một cách tiếp cận mới, thay thế.
Lựa Chọn Công Cụ và Hành Động (Thực Thi Kế Hoạch)
Đây là nơi mà suy luận được chuyển thành hành động.
- Cách hoạt động: LLM xác định xem cần sử dụng ‘công cụ’ nào cụ thể (chẳng hạn như tìm kiếm trên web, tra cứu CRM hoặc gọi API) cho từng bước trong kế hoạch của mình. Sau đó, nó tạo ra lệnh chính xác, có thể đọc được bởi máy để thực hiện công cụ đó. Ví dụ, để tìm email của khách hàng, LLM sẽ tạo ra cú pháp gọi API chính xác: getCustomer(customerId=’12345′).email.
Điều này hoạt động thế nào trong thực tế? (Khung ReAct)
Khung ReAct (Lý luận + Hành động) là một phương pháp phổ biến mà rõ ràng thể hiện các tác nhân AI nghĩ như thế nào. Nó tạo ra một vòng lặp mạnh mẽ kết hợp giữa lý luận của LLM và việc sử dụng các công cụ trong thế giới thực.
Ví dụ kinh doanh thực tế
Hãy tưởng tượng một tác nhân được giao mục tiêu: ‘Tìm 3 đối thủ cạnh tranh trực tiếp hàng đầu cho phần mềm CRM mới của chúng tôi và tóm tắt các tính năng chính của họ.’
- Lý do: LLM đầu tiên lý giải, ‘Tôi không biết câu trả lời. Tôi cần tìm kiếm trên internet để xác định đối thủ cạnh tranh.’
- Hành động: Nó chọn công cụ web_search và tạo ra truy vấn: ‘phần mềm CRM được đánh giá cao nhất cho các doanh nghiệp nhỏ.’
- Quan sát: Tác nhân nhận được kết quả tìm kiếm, liệt kê một số công ty như Salesforce, HubSpot và Zoho.
- Lý do: LLM xử lý thông tin mới này và lý giải, ‘Tôi đã xác định được các đối thủ cạnh tranh. Bây giờ tôi cần tìm các tính năng cụ thể cho từng đối thủ. Tôi sẽ bắt đầu với HubSpot.’
- Hành động: Nó thực hiện một tìm kiếm mới: ‘các tính năng của HubSpot CRM.’
- Quan sát: Nó nhận được danh sách tính năng từ trang web của HubSpot.
- Tác nhân tiếp tục vòng lặp ‘Lý do-Hành động-Quan sát’ này cho đến khi thu thập đủ tất cả thông tin cần thiết, tại thời điểm đó bước lý luận cuối cùng là tổng hợp dữ liệu thành một bản tóm tắt.
Nếu không có các LLMs trong AI agentic, những nhiệm vụ đó sẽ không thể hoàn thành hoặc thậm chí được xác định hoặc hiểu rõ.
Một tác nhân được hỗ trợ bởi LLM thúc đẩy ROI cho doanh nghiệp như thế nào?

Giá trị kinh doanh của LLMs trong AI agentic đến từ khả năng tự động hóa các công việc phức tạp và quý báu hơn.
Giá trị của việc tự động hóa các quy trình công việc phức tạp
Việc tích hợp LLMs trong AI agentic vào các quy trình công việc cho phép các doanh nghiệp vượt ra ngoài việc tự động hóa các nhiệm vụ đơn lẻ, lặp đi lặp lại để tự động hóa toàn bộ các quy trình từ đầu đến cuối. Khả năng xử lý các quy trình công việc nhiều bước, linh hoạt là một yếu tố chính trong việc thúc đẩy hiệu quả và có thể giảm chi phí và cung cấp ROI rõ ràng.
Giá trị của một tác nhân ‘Đa năng’
Vì các LLM có một nền tảng kiến thức rộng lớn và đã tồn tại trước đó, các tác nhân được điều khiển bởi chúng có thể áp dụng vào nhiều vấn đề kinh doanh khác nhau mà không cần phải xây dựng từ đầu mỗi lần. Một khuôn khổ tác nhân duy nhất được thiết kế tốt có thể được giao nhiệm vụ với các mục tiêu từ nghiên cứu thị trường đến hỗ trợ IT, giảm đáng kể rào cản để bắt đầu tự động hóa AI tinh vi.
Những rủi ro và hạn chế chính của LLMs trong AI agentic là gì?
Mặc dù mạnh mẽ, việc sử dụng LLMs trong AI agentic giới thiệu các loại rủi ro và hạn chế thực tế mới cần được quản lý cẩn thận.
Rủi ro ‘Ảo tưởng’: Khi suy luận của tác nhân bị sai lệch
Có xu hướng ‘ảo tưởng’ của một LLM hoặc tạo ra thông tin không chính xác là một vấn đề nổi tiếng.
- Trong một chatbot độc lập, ảo tưởng dẫn đến văn bản sai lệch.
- Trong một hệ thống chủ động, ảo giác có thể khiến tác nhân lập kế hoạch dựa trên các giả định sai lầm, dẫn đến việc thực hiện các hành động sai lệch hoặc có thể gây hại trong thế giới thực. Điều này làm cho việc kiểm tra kỹ lưỡng và giám sát con người trở nên thiết yếu.
Giới Hạn Chi Phí: Tại Sao Mỗi Suy Nghĩ Đều Có Giá Trị
Mỗi bước suy luận mà một tác nhân thực hiện đòi hỏi một cuộc gọi API tới LLM, có chi phí tiền tệ trực tiếp. Nhiệm vụ phức tạp yêu cầu tác nhân phải ‘suy nghĩ’ qua nhiều bước có thể nhanh chóng trở nên đắt đỏ không thể thực hiện ở quy mô lớn. Các doanh nghiệp phải cân nhắc cẩn thận Chi Phí Sở Hữu Toàn Bộ (TCO), bao gồm các chi phí hoạt động liên tục này. Mặc dù vai trò của Mô Hình Ngôn Ngữ Lớn (LLM) trong tác nhân AI là rõ ràng và chắc chắn hữu ích trong một số bối cảnh nhất định, nhưng cũng có các loại tác nhân đơn giản hơn đòi hỏi ít sức mạnh tính toán hơn. Hãy đánh giá mục tiêu của bạn trước khi thiết kế chiến lược AI của bạn.
Thách Thức Quản Trị: Làm Thế Nào Để Bạn Kiểm Soát Một Hệ Thống Xác Suất?
Khác với phần mềm truyền thống, mang tính quyết định, đầu ra của LLM không phải lúc nào cũng có thể được dự đoán chính xác 100%. Tính chất xác suất này tạo ra một thách thức quản trị lớn. Theo một báo cáo của McKinsey năm 2024, trong khi 78% nhà lãnh đạo thấy rủi ro an ninh mới từ GenAI, chỉ 21% tổ chức của họ đã thiết lập các chính sách chính thức để quản lý việc sử dụng của nó. Khoảng cách quản trị này là một nguồn gốc lớn của rủi ro doanh nghiệp, đòi hỏi xem xét, lập kế hoạch và chiến lược cẩn thận.
Tương Lai Của LLMs trong AI agentic Sẽ Như Thế Nào?
Vai trò của LLMs trong AI agentic vẫn đang phát triển nhanh chóng, với hai xu hướng chính định hình tương lai.
Xu Hướng Hướng Tới ‘Hỗn Hợp Chuyên Gia’
Thay vì dựa vào một Mô hình ngôn ngữ lớn (LLM) duy nhất và đa dụng, các hệ thống đa tác nhân trong tương lai có khả năng sẽ sử dụng ‘hỗn hợp các chuyên gia.’ Điều này bao gồm một đội ngũ các LLM nhỏ hơn, chuyên sâu hợp tác để giải quyết một vấn đề. Ví dụ, một LLM chuyên ‘lập kế hoạch’ có thể xây dựng chiến lược tổng thể, trong khi một LLM chuyên về ‘viết sáng tạo’ phác thảo bài quảng cáo, và một LLM chuyên ‘phân tích dữ liệu’ diễn giải kết quả, tạo ra một hệ thống hiệu quả và mạnh mẽ hơn.
Sự Trỗi Dậy của LLM Trên Thiết Bị
Việc phát triển các LLM nhỏ hơn và hiệu quả hơn, có thể chạy trực tiếp trên các thiết bị như điện thoại và máy tính xách tay, sẽ là một động lực lớn cho các trợ lý cá nhân. Điều này sẽ cho phép các tác nhân chạy bởi LLM nhanh hơn, riêng tư hơn (vì dữ liệu không cần rời khỏi thiết bị) và có thể hoạt động mà không cần kết nối internet, dẫn đến các trợ lý số đáp ứng nhanh và thực sự cá nhân.
Kết Luận
Cuộc thảo luận về LLMs trong AI agentic, các mô hình AI mạnh mẽ và các tác nhân AI thực sự làm công việc thực tế không còn là một trừu tượng tương lai nữa; nó là một thực tế hoạt động hiện tại.
Bên cạnh khả năng kỹ thuật, một yếu tố thúc đẩy sự chấp nhận khác là tính dễ tiếp cận. Rào cản để tạo ra các quy trình công việc tác nhân tinh vi đã được phá vỡ. Với các mô hình ngôn ngữ mạnh mẽ và các nền tảng không mã, khả năng xây dựng một tự động hóa chạy bởi AI có thể vận hành một chức năng kinh doanh quan trọng hiện nay thuộc về bất cứ nhà sáng lập quyết tâm hay nhóm nhỏ nào.
Chúng ta đang chứng kiến sự biến động nhanh chóng của những gì gần đây còn đắt đỏ và rất chuyên sâu. Tiến trình này đã nâng cao LLMs trong AI agentic từ một điều mới lạ thành một nguồn ứng dụng thực tế, có khả năng mở rộng mà cung cấp giá trị cho các công ty ở mọi quy mô.
Mặc dù ROI rõ ràng có thể vẫn đang xuất hiện từ chu kỳ thổi phồng hiện tại, nhưng quỹ đạo của công nghệ này là không thể phủ nhận. Các công ty sẽ dẫn đầu trong thập kỷ tới không chờ đợi một lộ trình không có rủi ro. Họ là những người đang hành động ngay bây giờ, tính toán tiềm năng, thử nghiệm với các trường hợp sử dụng cụ thể, và áp dụng các khả năng chủ động ở nơi giá trị là rõ ràng. Công nghệ đã sẵn sàng. Đã đến lúc xây dựng ngay bây giờ.