Các luồng công việc có tính tác nhân: Khái niệm chính, Lợi ích, và Thông tin thực tiễn

Một luồng công việc có tính tác nhân là một quy trình nơi các hệ thống AI, được gọi là tác nhân, thực hiện độc lập các nhiệm vụ bằng cách hiểu ngữ cảnh, đưa ra quyết định và hành động. Những tác nhân AI này sử dụng các công cụ như mô hình ngôn ngữ lớn, bộ nhớ, và lý luận để vận hành với sự can thiệp tối thiểu từ con người. Mục tiêu là tự động hóa các luồng công việc phức tạp bằng cách cho phép AI suy nghĩ, học hỏi, và hành động qua các bước.
Khác với các luồng công việc truyền thống, vốn theo các chuỗi cố định, định trước không có khả năng thích ứng hoặc tự động, các luồng công việc có tính tác nhân tích hợp các tác nhân AI có khả năng đưa ra quyết định động và lý luận dựa trên dữ liệu thời gian thực.
Điểm mấu chốt
- Các luồng công việc có tính tác nhân cho phép các tác nhân AI thực hiện tự động các nhiệm vụ đa bước phức tạp với ít sự can thiệp của con người.
- Các tác nhân AI sử dụng các mô hình ngôn ngữ lớn, bộ nhớ, và công cụ bên ngoài để nhận thức, lý luận, và hành động một cách linh hoạt.
- Các luồng công việc có tính tác nhân cải thiện hiệu quả, độ chính xác và khả năng mở rộng trong các ngành công nghiệp như y tế, tài chính, tiếp thị và hỗ trợ khách hàng.
- Giám sát của con người vẫn là cần thiết cho các quyết định quan trọng, xử lý lỗi và quản lý đạo đức trong các luồng công việc có tính tác nhân.
- Hạ tầng mạnh mẽ, giám sát liên tục, và biện pháp an toàn rõ ràng là rất quan trọng để đảm bảo triển khai luồng công việc có tính tác nhân một cách đáng tin cậy và an toàn trong các chức năng kinh doanh.
Các thành phần cốt lõi của luồng công việc tác nhân bao gồm các đại lý AI, kỹ thuật gợi ý, mô hình ngôn ngữ lớn và các công cụ bên ngoài được kết nối qua API.
Các luồng công việc tác nhân do AI điều khiển tận dụng các đại lý thông minh để tự động hóa và tối ưu hóa quy trình trong nhiều ngành công nghiệp khác nhau, chẳng hạn như giáo dục, chăm sóc sức khỏe, tài chính, bán hàng, tiếp thị và hỗ trợ khách hàng. Các đại lý thông minh này là trung tâm của các luồng công việc tác nhân, có khả năng học hỏi từ dữ liệu, thích ứng với các nhiệm vụ phức tạp và phối hợp hành động để cải thiện hiệu quả và độ chính xác.
Luồng công việc AI tác nhân là gì
Luồng công việc AI tác nhân được thiết kế để tự động hóa các luồng công việc phức tạp, ngoài các nhiệm vụ thường xuyên như nhập dữ liệu, xử lý hóa đơn, yêu cầu hỗ trợ khách hàng.
Các luồng công việc phức tạp hơn sử dụng các mô hình ngôn ngữ lớn (LLMs) để phân tích dữ liệu, nhận diện các mẫu, và đưa ra các quyết định trong thời gian thực. Những luồng công việc tự động này còn được cải tiến bởi việc sử dụng công cụ AI, dữ liệu lịch sử và khả năng suy luận để hoàn thành các nhiệm vụ phức tạp vốn dĩ vượt xa chỉ các nhiệm vụ lặp lại.
Khả năng của AI đang tăng trưởng theo cấp số nhân dẫn đến nhiều nhiệm vụ phức tạp hơn được tự động hóa và được giải quyết thành công bởi luồng công việc tác nhân.
Lợi ích của luồng công việc AI tác nhân bao gồm cải thiện độ chính xác, giảm chi phí, và nâng cao trải nghiệm khách hàng, cũng như tinh giản hoạt động và giải phóng đại lý con người để tập trung vào các vấn đề phức tạp hơn.
Lợi ích và ứng dụng của luồng công việc tác nhân do AI điều khiển
Lợi ích của luồng công việc tác nhân bao gồm nâng cao hiệu quả hoạt động, tăng khả năng mở rộng quy mô và nâng cao khả năng ra quyết định.
Các quy trình công việc theo hướng đại diện có thể được áp dụng cho các quy trình phức tạp trong nhiều ngành công nghiệp khác nhau, bao gồm chăm sóc sức khỏe, tài chính, tiếp thị, bán hàng và dịch vụ khách hàng. Chúng có thể tự động hóa quy trình nhiều bước và giải quyết các vấn đề phức tạp trên các lĩnh vực, cho phép các tổ chức quản lý các quy trình yêu cầu nhiều giai đoạn và suy luận nâng cao. Dưới đây là một số ví dụ:
- Tuân thủ Tự động: Các tác nhân AI có thể quét các bản cập nhật quy định và hoạt động nội bộ để đảm bảo tuân thủ, giảm rủi ro và hình phạt.
- Chuỗi Cung Ứng Động: Các tác nhân thông minh phân tích dữ liệu thực tế để điều chỉnh tồn kho, chuyển hướng lô hàng và quản lý nhà cung cấp, phản ứng với thay đổi thị trường.
- Học Tập Cá Nhân Hóa: Trong giáo dục, các tác nhân AI có thể tùy chỉnh lộ trình học tập theo hiệu suất và sở thích của từng học sinh, học tập hiệu quả hơn.
- Bảo Trì Dự Báo: Các tác nhân theo dõi hiệu suất thiết bị để dự đoán sự cố, lên kế hoạch bảo trì để giảm thời gian ngưng hoạt động và kéo dài tuổi thọ máy móc.
- Hỗ Trợ Khách Hàng: Các tác nhân AI với NLP có thể xử lý các yêu cầu khách hàng phức tạp, cung cấp phản hồi chính xác và theo ngữ cảnh, cải thiện sự hài lòng của khách hàng.
- Phát Hiện Gian Lận: Bằng cách phân tích mẫu giao dịch theo thời gian thực, các quy trình công việc đại diện có thể phát hiện và gắn cờ các gian lận tiềm ẩn, tăng cường bảo mật.
- Xử Lý Tài Liệu Thông Minh: Các tác nhân AI có thể thực hiện trích xuất dữ liệu cơ bản, diễn giải và xử lý thông tin từ các tài liệu không cấu trúc, tự động hóa các quy trình như xử lý hóa đơn và quản lý hợp đồng.
- Tiếp Thị Thích Ứng: Các tác nhân phân tích hành vi tiêu dùng và xu hướng thị trường để điều chỉnh các chiến dịch tiếp thị, tối ưu hóa sự tương tác và chuyển đổi.
- Hỗ Trợ Quyết Định Thời Gian Thực: Trong các môi trường nhịp độ nhanh, các tác nhân AI cung cấp cho người ra quyết định những thông tin chi tiết và khuyến nghị kịp thời, cải thiện chất lượng và tốc độ quyết định.
- Quản lý dữ liệu chăm sóc sức khỏe: Các quy trình làm việc theo đại lý có thể quản lý và phân tích dữ liệu bệnh nhân, hỗ trợ chẩn đoán, lập kế hoạch điều trị và giám sát, cải thiện kết quả sức khỏe.
- Tuyển dụng và Nhân sự: tuyển dụng nhân sự, sàng lọc hồ sơ, quy trình tuyển dụng và hướng dẫn nhân viên, tất cả được thực hiện bởi đại lý AI.
Xây dựng Đại lý AI

- Xây dựng các đại lý AI yêu cầu hiểu sâu về hệ thống AI, bao gồm cả điểm mạnh và hạn chế của chúng.
- Các đại lý AI có thể được thiết kế để thực hiện các tác vụ cụ thể, chẳng hạn như trích xuất dữ liệu, tạo mã và ra quyết định tự động. Việc thực thi tác vụ hiệu quả thường yêu cầu sử dụng công cụ và tích hợp với các công cụ bên ngoài như API và cơ sở dữ liệu, cho phép đại lý tương tác với dữ liệu thời gian thực và mở rộng khả năng của họ vượt quá kiến thức tĩnh.
- Quy trình làm việc theo đại lý hiệu quả phụ thuộc vào khả năng của đại lý AI trong việc cộng tác hiệu quả và thích ứng linh hoạt với các điều kiện thay đổi.
- Các đại lý AI có thể được đào tạo bằng nhiều kỹ thuật khác nhau, bao gồm học máy và học sâu.
Triển khai và Thực tiễn Tốt nhất trong Quy trình làm việc AI
- Thực tiễn tốt nhất để triển khai quy trình làm việc theo đại lý bao gồm bắt đầu từ quy mô nhỏ, kiểm tra kỹ và liên tục giám sát và đánh giá hiệu suất.
- Việc kết hợp học tập liên tục và sử dụng tiêu chí được xác định trước là cần thiết cho việc triển khai hiệu quả. Kỹ thuật nhắc nhở bao gồm việc tạo cấu trúc đầu vào để hướng dẫn các đại lý AI thực hiện nhiệm vụ một cách chính xác và hiệu quả.
- Quy trình làm việc theo đại lý nên được thiết kế để thích ứng linh hoạt với các điều kiện thay đổi và giảm thiểu sự cần thiết nhập liệu từ con người.
- Việc triển khai hiệu quả các quy trình tác nhân đòi hỏi sự hiểu biết sâu sắc về các thành phần chính, bao gồm các tác nhân AI, LLM và sự hợp tác đa tác nhân.
- Cải tiến liên tục và cải thiện lặp đi lặp lại là chìa khóa, vì chúng cho phép các quy trình tác nhân tự đánh giá và nâng cao kết quả của họ theo thời gian để đạt độ chính xác và hiệu suất cao hơn.
Quy trình Tác nhân là gì và tại sao nó khác với Tự động hóa Truyền thống?
Một quy trình tác nhân bao gồm một hoặc nhiều tác nhân AI (chương trình phần mềm tự chủ) có thể tự lập kế hoạch, đưa ra quyết định và thực hiện nhiệm vụ để đạt được mục tiêu cụ thể. Không giống như tự động hóa truyền thống, thường tuân theo các quy tắc và trình tự cứng nhắc đã được lập trình sẵn (‘nếu X, thì làm Y’), các quy trình tác nhân là động và thích ứng. Tránh sự phấn khích quá mức và truyền thuyết về các tác nhân AI bằng cách biết những điểm khác biệt rõ ràng.
Những khác biệt chính là:
- Tự chủ & Quyết định: Tự động hóa truyền thống thực hiện các bước xác định trước. Các tác nhân AI trong một quy trình tác nhân không chỉ làm theo một kịch bản; họ đang giải quyết vấn đề.
- Khả năng thích ứng & Học hỏi: Tự động hóa truyền thống thường bị phá vỡ khi gặp phải đầu vào không mong đợi hoặc thay đổi trong môi trường.
- Định hướng mục tiêu vs. Định hướng nhiệm vụ: Tự động hóa truyền thống định hướng theo nhiệm vụ (ví dụ: ‘gửi email này khi biểu mẫu này được điền’). Các quy trình tác nhân sử dụng ra quyết định dựa trên AI (ví dụ: ‘quản lý câu hỏi hỗ trợ khách hàng cho sản phẩm mới X,’ có thể bao gồm hiểu câu hỏi, tìm kiếm trong cơ sở kiến thức, soạn thảo phản hồi, hoặc nâng cao lên con người).
- Khả năng xử lý phức tạp: Các quy trình tác nhân được thiết kế để xử lý các quá trình phức tạp hơn, nhiều bước có thể liên quan đến sự mơ hồ, yêu cầu lý luận hoặc tương tác với nhiều hệ thống hoặc nguồn dữ liệu theo những cách mà khó để mã hoá cứng.
Khía cạnh | Tự động hóa truyền thống | Quy trình làm việc dại diện |
---|---|---|
Tự chủ & Quyết định | Thực hiện các bước được xác định trước dựa trên quy tắc tĩnh. | Các đại lý AI tự động lập kế hoạch, quyết định và hành động để đạt được mục tiêu. |
Khả năng thích nghi & Học hỏi | Cứng nhắc; khó khăn với các đầu vào hoặc thay đổi bất ngờ. | Liên tục học hỏi và điều chỉnh sử dụng dữ liệu thời gian thực và phản hồi. |
Định hướng Mục tiêu so với Nhiệm vụ | Định hướng nhiệm vụ (ví dụ: ‘gửi email này khi biểu mẫu này được điền’). | Định hướng mục tiêu (ví dụ: ‘quản lý các thắc mắc hỗ trợ khách hàng cho sản phẩm mới X’). |
Xử lý Độ phức tạp | Giới hạn ở các nhiệm vụ đơn giản, lặp đi lặp lại. | Xử lý quy trình phức tạp, nhiều bước liên quan đến sự mơ hồ và lý luận. |
Xử lý Dữ liệu | Chủ yếu là dữ liệu có cấu trúc; hạn chế xử lý dữ liệu không có cấu trúc. | Xử lý cả dữ liệu có cấu trúc và không có cấu trúc (ví dụ: văn bản, hình ảnh, dữ liệu cảm biến). |
Can thiệp của Con người | Yêu cầu giám sát của con người cho các trường hợp ngoại lệ và cập nhật. | Đầu vào của con người tối thiểu; đại lý tự điều chỉnh và chỉ tăng cường khi cần thiết. |
Khả năng mở rộng & Linh hoạt | Mở rộng yêu cầu điều chỉnh thủ công và lập trình lại. | Dễ dàng mở rộng và thích ứng với nhiệm vụ hoặc môi trường mới mà không cần lập trình lại rộng rãi. |
Hợp tác | Hoạt động trong cô lập; hạn chế tương tác với các hệ thống hoặc đại lý khác. | Cho phép hợp tác đa đại lý và tích hợp với các hệ thống và công cụ khác nhau. |
Cải thiện Liên tục | Hiệu suất tĩnh; cải tiến yêu cầu cập nhật thủ công. | Liên tục cải thiện thông qua học hỏi lặp đi lặp lại và vòng phản hồi. |
Trường hợp Sử dụng | Phù hợp cho các nhiệm vụ dự đoán, dựa trên quy tắc (ví dụ: nhập dữ liệu, xử lý biểu mẫu cơ bản). | Lý tưởng cho các nhiệm vụ động, phức tạp (ví dụ: dịch vụ khách hàng thích ứng, lập kế hoạch chiến lược). |
Quy trình làm việc dại diện thực sự hoạt động như thế nào?
Các quy trình công việc có tính đại lý hoạt động thông qua một quá trình tuần hoàn, thường liên quan đến nhận thức, lý luận (hoặc ra quyết định), và hành động, tất cả đều được dẫn dắt bởi một mục tiêu tổng thể.
- Xác định Mục tiêu: Quy trình công việc bắt đầu với một mục tiêu hoặc mục đích rõ ràng mà tác nhân AI (hoặc nhóm các tác nhân) phải đạt được (ví dụ: ‘tóm tắt tin tức hàng ngày liên quan đến ngành công nghệ,’ ‘đặt vé máy bay dưới $500 cho thứ Ba tới,’ ‘chẩn đoán và giải quyết các lỗi mạng phổ biến’).
- Nhận thức & Thu thập Thông tin: Tác nhân thu thập thông tin liên quan từ môi trường của mình. Điều này có thể bao gồm đọc dữ liệu từ cơ sở dữ liệu, APIs, đầu vào của người dùng, cảm biến, hoặc thậm chí xử lý văn bản và hình ảnh không cấu trúc.
- Lý luận & Lập kế hoạch: Dựa trên thông tin đã thu thập và mục tiêu của mình, tác nhân sử dụng logic nội bộ của mình (có thể là do Mô hình Ngôn ngữ Lớn, hệ thống dựa trên nguyên tắc, thuật toán lập kế hoạch, hoặc sự kết hợp) để phân tích tình hình, phân chia mục tiêu thành các nhiệm vụ nhỏ hơn và quyết định chuỗi hành động.
- Thực hiện Hành động: Tác nhân thực hiện các hành động đã chọn. Điều này có thể nghĩa là gọi một API, thực thi một đoạn mã, gửi một tin nhắn, cập nhật cơ sở dữ liệu, hoặc tạo một báo cáo.
- Giám sát & Phản hồi: Tác nhân (hoặc một hệ thống giám sát) theo dõi kết quả của các hành động của nó và trạng thái của môi trường. Phản hồi này rất quan trọng.
- Thích nghi & Lặp lại: Dựa trên phản hồi, tác nhân đánh giá liệu nó có tiến gần hơn đến mục tiêu hay không. Nếu không, hoặc nếu có lỗi xảy ra, nó có thể lập kế hoạch lại, thử một hành động khác, hoặc yêu cầu thêm thông tin. Vòng lặp của nhận thức, lý luận, hành động và phản hồi này tiếp tục cho đến khi đạt được mục tiêu hoặc một điều kiện dừng được định sẵn được gặp.
- Học hỏi (Tùy chọn nhưng Mạnh mẽ): Một số quy trình công việc tác nhân nâng cao tích hợp học máy, cho phép các tác nhân học hỏi từ các tương tác và kết quả trước đó để cải thiện quá trình ra quyết định và hiệu quả theo thời gian.
Thành phần chính của quy trình công việc Agentic
Một hệ thống AI tích hợp nhiều Tác nhân AI với các thành phần chính, bao gồm ghi nhớ, nhận thức và suy luận, để hỗ trợ quy trình công việc tác nhân.
- Các Tác nhân AI: Một tác nhân AI là một thực thể thông minh có khả năng thực hiện hành động tự động có thể phân tích dữ liệu, hiểu bối cảnh, lập kế hoạch nhiệm vụ và thực hiện nhiệm vụ một cách độc lập.
- Môi trường: Bối cảnh hoặc lĩnh vực mà tác nhân hoạt động. Điều này bao gồm tất cả các hệ thống ngoại vi, nguồn dữ liệu, API, công cụ và thậm chí các tác nhân khác mà tác nhân chính có thể tương tác hoặc nhận thức.
- Các mô hình ngôn ngữ lớn (LLMs): là bộ não của quy trình công việc tác nhân, cho phép các tác nhân AI hiểu và tạo ra các đầu vào và đầu ra giống con người.
- Trí nhớ: một yếu tố quan trọng trong quy trình công việc tác nhân, cho phép hệ thống nắm bắt, lưu trữ và sử dụng thông tin ngữ cảnh qua nhiều lần tương tác với người dùng để cải thiện hiệu suất và cá nhân hóa.
- Trí nhớ ngắn hạn (Bộ nhớ làm việc/Cửa sổ ngữ cảnh): Giữ thông tin liên quan đến nhiệm vụ hiện tại, tương tác gần đây và ngữ cảnh ngay lập tức.
- Trí nhớ dài hạn (Cơ sở kiến thức): Lưu trữ thông tin học được, trải nghiệm quá khứ, chiến lược thành công (và không thành công), sở thích của người dùng hoặc kiến thức chuyên môn về lĩnh vực cụ thể.
- Lời nhắc: được sử dụng để đặt mục tiêu cho quy trình công việc ai tác nhân của bạn bằng ngôn ngữ đơn giản. Các tác nhân AI sẽ hiểu mục tiêu và bắt đầu lập kế hoạch về cách đạt được nó.
- Cơ sở kiến thức: được sử dụng để cung cấp bối cảnh rộng hơn cho các tác nhân AI hoạt động chính xác hơn. (ví dụ: bạn có thể cung cấp sổ tay thương hiệu của công ty, SOP và các tài liệu nội bộ khác, để các tác nhân AI có thể giao tiếp và hành động phù hợp với thương hiệu của bạn).
- Cảm biến (Mô-đun Nhận thức): Cơ chế cho phép tác nhân thu thập thông tin về môi trường của nó và trạng thái của chính nó. Điều này có thể là các API để truy xuất dữ liệu, mã để đọc tập tin, hoặc các mô-đun để xử lý ngôn ngữ tự nhiên hoặc đầu vào hình ảnh.
- Cơ cấu chấp hành (Mô-đun Hành động): Cơ chế cho phép tác nhân thực hiện các hành động và ảnh hưởng đến môi trường. Ví dụ bao gồm API để gửi dữ liệu, công cụ để thực thi mã, hoặc các mô-đun để tạo văn bản hoặc giọng nói.
- Hàm Mục tiêu/ Mục tiêu: Một định nghĩa rõ ràng về những gì tác nhân cố gắng đạt được. Điều này định hướng quá trình lập kế hoạch và đưa ra quyết định của tác nhân, cho phép nó đánh giá sự thành công của hành động của mình.
- Mô-đun Giao tiếp: Nếu có nhiều tác nhân tham gia, thành phần này tạo điều kiện tương tác và trao đổi thông tin giữa chúng.
Làm thế nào để các tác nhân cảm nhận, quyết định và hành động trong một quy trình làm việc?
- Cảm nhận:
- Tiếp nhận Dữ liệu: Các tác nhân ‘cảm nhận’ bằng cách tiếp nhận dữ liệu từ nhiều nguồn khác nhau. Điều này có thể là dữ liệu có cấu trúc (như mục nhập cơ sở dữ liệu hoặc JSON từ một API), dữ liệu không có cấu trúc (như văn bản từ email, tài liệu, hoặc tin nhắn trò chuyện của người dùng), hoặc thậm chí là dữ liệu cảm biến trong môi trường vật lý.
- Xử lý Thông tin: Dữ liệu thô thường được xử lý để trích xuất thông tin có ý nghĩa. Đối với các tác nhân dựa trên LLM, điều này có thể bao gồm nhúng văn bản vào các biểu diễn vector hoặc phân tích thông tin thành định dạng mà LLM có thể hiểu.
- Sự nhận thức trạng thái: Các tác nhân duy trì sự hiểu biết về trạng thái hiện tại của môi trường và nhiệm vụ hiện tại dựa trên thông tin mà họ nhận thức.
- Quyết định:
- Đánh giá Mục tiêu: Tác nhân liên tục đánh giá trạng thái hiện tại của mình so với mục tiêu chung của nó.
- Lập Kế hoạch & Lý luận: Dựa trên sự nhận thức của nó, kiến thức/ trí nhớ nội bộ của nó và mục tiêu của nó, động cơ ra quyết định của tác nhân lập kế hoạch cho các bước tiếp theo.
- Đối với các tác nhân dựa trên LLM, điều này có thể bao gồm việc tạo ra một kế hoạch hành động, chọn các công cụ phù hợp để sử dụng (ví dụ: ‘Tôi cần tìm kiếm thông tin trên web cho nội dung này, sau đó tóm tắt nó’), hoặc lập luận thông qua một vấn đề từng bước một.
- Đối với các tác nhân dựa trên quy tắc, điều này bao gồm việc đối sánh điều kiện hiện tại với các quy tắc đã được định nghĩa trước.
- Lựa chọn hành động: Tác nhân chọn hành động phù hợp nhất từ các khả năng sẵn có của mình để tiến gần hơn đến mục tiêu. Điều này có thể bao gồm việc chọn công cụ nào để sử dụng, các tham số nào cần truyền vào API, hoặc phản hồi nào cần tạo ra.
- Thực hiện:
- Sử dụng Công cụ: Các tác nhân thường có một bộ ‘công cụ’ mà họ có thể sử dụng. Các công cụ này thực chất là các chức năng hoặc API cho phép tác nhân tương tác với thế giới bên ngoài (ví dụ: công cụ tìm kiếm web, công cụ truy vấn cơ sở dữ liệu, công cụ gửi email, công cụ thực thi mã).
- Thực thi: Tác nhân kích hoạt công cụ đã chọn hoặc thực hiện chức năng đã chọn với các tham số cần thiết.
- Tạo đầu ra: Các hành động có thể dẫn đến việc tạo văn bản (như tóm tắt hoặc email), thực hiện thay đổi hệ thống (như cập nhật thông tin trong CRM), hoặc kích hoạt một quy trình khác.
- Tương tác với môi trường: Hành động trực tiếp ảnh hưởng đến môi trường, dẫn đến một trạng thái mới mà tác nhân sẽ nhận thức trong chu kỳ tiếp theo.
Bộ nhớ đóng vai trò gì trong sự tự chủ của tác nhân?
Bộ nhớ là nền tảng cho sự tự chủ của tác nhân, cho phép nó hoạt động hiệu quả và học hỏi theo thời gian mà không cần con người can thiệp liên tục.
- Hiểu biết ngữ cảnh (Bộ nhớ ngắn hạn):
- Tính gắn kết của tác vụ: Bộ nhớ ngắn hạn (thường giống như cửa sổ ngữ cảnh của LLM) cho phép tác nhân theo dõi các bước ngay lập tức trong một tác vụ nhiều bước, lịch sử hội thoại, hoặc thông tin vừa thu thập được. Nếu không có điều này, tác nhân sẽ xử lý mỗi tương tác hoặc bước như thể nó là lần đầu tiên, thiếu sự liên kết.
- Quyết định Ngay tức khắc Đã Thông báo: Nó cung cấp ngữ cảnh cần thiết để đưa ra các quyết định phù hợp trong thời điểm hiện tại.
- Học hỏi và Thích ứng (Trí nhớ Dài hạn):
- Lưu trữ Kinh nghiệm: Trí nhớ dài hạn cho phép các tác nhân lưu trữ kết quả của các hành động trước đây, các chiến lược thành công, những lần thử thất bại và phản hồi từ người dùng.
- Cải thiện Hiệu suất: Bằng cách truy cập vào những kinh nghiệm lưu trữ này, các tác nhân có thể tránh lặp lại sai lầm, tinh chỉnh chiến lược của mình và dần trở nên hiệu quả hơn theo thời gian. Đây là nền tảng của việc học hỏi và thích ứng thực sự.
- Cá nhân hóa: Đối với các tác nhân hướng đến người dùng, trí nhớ dài hạn có thể lưu trữ sở thích, tương tác trước đây và nhu cầu cụ thể của người dùng, giúp cung cấp sự trợ giúp cá nhân hóa và phù hợp hơn.
- Sự Tích lũy Kiến thức: Các tác nhân có thể xây dựng một cơ sở kiến thức kiên định về lĩnh vực hoạt động của mình, giảm thiểu nhu cầu phải tính toán lại thông tin lặp lại nhiều lần.
- Nhất quán và Đáng tin cậy:
- Trí nhớ giúp một tác nhân duy trì sự nhất quán trong hành vi và phản ứng của nó, vì có thể tham chiếu đến các quyết định trước đây hoặc các giao thức đã được thiết lập.
- Giảm Can thiệp của Con người:
- Khả năng học hỏi từ trí nhớ và thích ứng có nghĩa là tác nhân có thể xử lý nhiều tình huống và vấn đề mới mà không cần cập nhật thủ công các quy tắc cho mỗi tình huống mới, qua đó tăng cường tự quản của nó.
Nếu không có trí nhớ mạnh mẽ, một tác nhân sẽ luôn phản ứng và bị hạn chế trong khả năng thực hiện các nhiệm vụ phức tạp hoặc cải tiến. Trí nhớ biến nó từ một người thực thi đơn giản thành một thực thể học hỏi thông minh hơn.
Điều gì làm một Quy trình Tác nhân Tin cậy và An toàn?

Đảm bảo quy trình tác nhân trở nên tin cậy và an toàn là vô cùng quan trọng, đặc biệt khi chúng có được nhiều tự chủ hơn và xử lý các nhiệm vụ quan trọng. Các yếu tố chính bao gồm:
- Giải thích & Minh bạch: Người dùng và nhà phát triển cần hiểu tại sao một tác nhân đã đưa ra quyết định cụ thể hoặc thực hiện một hành động cụ thể. Điều này bao gồm việc ghi lại, lưu vết lý do rõ ràng và khả năng kiểm tra quá trình ra quyết định của tác nhân.
- ‘Con người trong vòng lặp’ (HITL): Đối với các quyết định quan trọng hoặc tình huống mơ hồ, luồng công việc nên cho phép con người xem xét và phê duyệt trước khi thực hiện hành động. Điều này đảm bảo con người có thể ghi đè hoặc hướng dẫn tác nhân khi cần thiết.
- Quản lý lỗi & Dự phòng mạnh mẽ: Hệ thống phải được thiết kế để xử lý lỗi, đầu vào không mong muốn hoặc các tình huống mà tác nhân không thể đạt được mục tiêu của mình một cách nhẹ nhàng. Điều này bao gồm các cơ chế dự phòng, cảnh báo con người và ngăn chặn các lỗi dây chuyền.
- Ranh giới và Hạn chế rõ ràng (Đường rào): Định rõ những gì một tác nhân có thể và không thể làm. Điều này bao gồm hạn chế truy cập vào các công cụ, dữ liệu hoặc chức năng nhất định, và đặt ra các giới hạn hoạt động.
- Bảo mật & Kiểm soát truy cập: Bảo vệ tác nhân khỏi các cuộc tấn công độc hại và đảm bảo tác nhân chỉ có các quyền cần thiết (nguyên tắc ít đặc quyền nhất) để tương tác với các hệ thống và dữ liệu khác.
- Kiểm tra & Xác nhận: Thử nghiệm nghiêm ngặt trong các môi trường mô phỏng và kiểm soát trước khi triển khai để xác định các chế độ lỗi tiềm năng, định kiến hoặc hậu quả không mong muốn.
- Giám sát & Cảnh báo: Giám sát liên tục hành vi, hiệu suất và tiêu thụ tài nguyên của tác nhân, với các cảnh báo cho các hoạt động khác thường hoặc có thể gây hại.
- Phát hiện & Giảm thiểu thiên vị: Nếu các tác nhân được đào tạo trên dữ liệu, đảm bảo rằng dữ liệu và các quá trình ra quyết định của tác nhân được kiểm tra và giảm thiểu các thiên vị có hại.
- Khả năng dự đoán (trong giới hạn): Mặc dù có thể thích ứng, hành vi của một đại lý nên có thể dự đoán được trong một giới hạn nếu đưa ra một tập hợp các đầu vào và mục tiêu, đảm bảo nó phù hợp với kết quả dự kiến.
- Khả năng kiểm toán: Lưu giữ chi tiết nhật ký các hành động của đại lý, quyết định và dữ liệu đã truy cập để xem xét sau này, kiểm tra tuân thủ và phân tích sự cố.
Tại sao khả năng giải thích lại quan trọng trong các hệ thống đại lý AI
Khả năng giải thích, khả năng hiểu và diễn giải cách thức và lý do một đại lý AI đi đến một quyết định hay kết quả cụ thể, là rất quan trọng trong các hệ thống đại lý vì nhiều lý do:
- Xây dựng niềm tin: Người dùng có xu hướng tin cậy và áp dụng các hệ thống mà họ có thể hiểu được quá trình ra quyết định. Nếu một đại lý thực hiện một hành động bất ngờ, một lời giải thích có thể làm sáng tỏ lý do của nó, xây dựng lòng tin thay vì nghi ngờ.
- Phân tích lỗi và gỡ lỗi: Khi một đại lý hoạt động bất ngờ hoặc mắc lỗi, khả năng giải thích là cần thiết để các nhà phát triển chẩn đoán nguyên nhân gốc rễ.
- Trách nhiệm và Trách nhiệm pháp lý: Trong những tình huống mà hành động của một đại lý có hậu quả đáng kể (ví dụ, giao dịch tài chính, đề xuất y tế), việc biết cách một quyết định được đưa ra là rất quan trọng để gán trách nhiệm.
- Đảm bảo sự công bằng và xác định thiên vị: Khả năng giải thích có thể giúp phát hiện xem một đại lý có đang ra quyết định dựa trên dữ liệu thiên lệch hoặc logic sai lệch hay không.
- Tuân thủ quy định và Kiểm toán: Nhiều ngành công nghiệp (như tài chính và chăm sóc sức khỏe) có các quy định yêu cầu sự minh bạch trong quá trình ra quyết định. AI có thể giải thích là cần thiết để đáp ứng các tiêu chuẩn tuân thủ này và tạo điều kiện thuận lợi cho các cuộc kiểm toán.
- Cải tiến và Tinh chỉnh Hệ thống: Bằng cách hiểu cách một đại lý lập luận, các nhà phát triển có thể xác định các lĩnh vực cần cải thiện, tinh chỉnh logic của nó và nâng cao hiệu suất cũng như độ tin cậy của nó.
- Quản lý An toàn và Rủi ro: Hiểu tại sao một tác nhân có thể đang hướng tới một hành động không mong muốn hoặc không an toàn cho phép can thiệp và triển khai các biện pháp bảo vệ tốt hơn.
Không có tính giải thích, các hệ thống tác nhân trở thành ‘hộp đen,’ khiến chúng khó quản lý, tin tưởng hoặc cải thiện, đặc biệt khi sự phức tạp và tự chủ của chúng tăng lên.
Các thực hành tốt nhất để ngăn chặn tự động hóa không kiểm soát
Tự động hóa không kiểm soát, khi một tác nhân AI hoặc hệ thống tự động hành xử không ổn định, thực hiện các hành động không mong muốn hoặc tiêu thụ quá nhiều tài nguyên, có thể gây ra hậu quả nghiêm trọng. Các thực hành tốt nhất để ngăn chặn điều này bao gồm:
- Triển khai ‘Công tắc Ngắt’ hoặc Bộ Ngắt Mạch: Thiết kế một cách ngay lập tức để dừng tác nhân hoặc quy trình công việc nếu nó bắt đầu hành xử bất thường. Điều này nên dễ dàng tiếp cận và kích hoạt nhanh chóng.
- Giới hạn Tốc độ và Điều tiết: Giới hạn số lượng hành động mà tác nhân có thể thực hiện hoặc số lần gọi API mà nó có thể thực hiện trong một khoảng thời gian nhất định. Điều này ngăn nó dồn dập hệ thống hoặc nhanh chóng gây ra vấn đề rộng rãi.
- Triển khai Từng Bước và Phát Hành Giai Đoạn: Triển khai các tác nhân mới hoặc cập nhật đáng kể từng giai đoạn. Bắt đầu với phạm vi hạn chế hoặc một môi trường thử nghiệm để giám sát hành vi trước khi phát hành rộng rãi hơn.
- Hạn ngạch Tài nguyên Nghiêm ngặt: Thực thi giới hạn nghiêm ngặt về sử dụng CPU, bộ nhớ, băng thông mạng và dung lượng lưu trữ mà tác nhân có thể tiêu thụ.
- Giám sát Toàn diện và Cảnh báo Thời gian Thực: Liên tục giám sát các chỉ số hiệu suất chính (KPIs), tỷ lệ lỗi, tiêu thụ tài nguyên và các hành vi cụ thể của tác nhân. Thiết lập thông báo cho các bất thường hoặc khi vi phạm các ngưỡng đã định trước.
- Con Người Trong Vòng Lặp cho Các Hoạt động Quan Trọng: Yêu cầu sự chấp thuận của con người cho các hành động có nguy cơ cao, thay đổi quy mô lớn hoặc các hoạt động khó đảo ngược. Tác nhân có thể đề xuất một hành động, nhưng con người phải xác nhận nó.
- Thiết kế hành động idempotent (nếu có thể): Thiết kế các hành động sao cho việc thực hiện nhiều lần vẫn có hiệu quả giống như thực hiện một lần. Điều này có thể giảm thiểu các vấn đề nếu một tác nhân vô tình thực hiện lại một hành động.
- Kiểm toán thường xuyên và đánh giá hành vi: Định kỳ xem xét các nhật ký của tác nhân, đường dẫn quyết định và kết quả để đảm bảo chúng hoạt động như dự định và phát hiện bất kỳ hành vi lệch lạc nào.
- Mô phỏng và ‘Red Teaming’: Trước khi triển khai, thử nghiệm tác nhân trong các môi trường mô phỏng dưới nhiều điều kiện căng thẳng khác nhau. Thực hiện các bài tập ‘red teaming’ nơi một nhóm riêng biệt cố gắng tìm cách làm cho tác nhân thất bại hoặc cư xử không như mong đợi.
Ngăn chặn tự động hóa vượt khỏi tầm kiểm soát là xây dựng các lớp an toàn và kiểm soát, đảm bảo kể cả khi một cơ chế thất bại, các cơ chế khác có thể bắt giữ hoặc giảm nhẹ vấn đề.
Các ví dụ về luồng công việc Agentic trong các ngành công nghiệp khác nhau

Luồng công việc Agentic không chỉ là lý thuyết; chúng đang bắt đầu mang lại lợi ích cụ thể cho nhiều ngành.
Cách luồng công việc Agentic cải thiện hiệu suất tiếp thị
- Cá nhân hóa nội dung và phân phối:
- Một tác nhân AI có thể theo dõi hành vi thực tế của người dùng trên một trang web, lịch sử mua hàng trước đó của họ, và thậm chí cả các xu hướng xã hội liên quan.
- Thay vì một gợi ý nội dung chung chung, tác nhân có thể động thái lắp ráp và đề xuất một phối hợp duy nhất các bài viết, trang sản phẩm hoặc video được cá nhân hóa cho sở thích hiện tại của cá nhân và giai đoạn trong hành trình khách hàng.
- Ví dụ về luồng công việc: Một ‘Tác Nhân Cá Nhân Hóa Nội Dung’ có thể:
- Nhận thức: Theo dõi nhấp chuột của người dùng, số lượt xem trang, truy vấn tìm kiếm trên trang và dữ liệu CRM.
- Quyết định: Dựa vào dữ liệu này và một mục tiêu (ví dụ, ‘tăng cường sự tham gia’ hoặc ‘thúc đẩy chuyển đổi cho sản phẩm Z’), xác định các phần nội dung liên quan nhất từ một kho lưu trữ lớn. Nó cũng có thể quyết định kênh tốt nhất (email, bật lên trên trang, thông báo ứng dụng) và thời điểm.
- Hành động: Kích hoạt việc giao nội dung cá nhân hoá qua kênh được lựa chọn.
- Quản lý Chiến dịch Quảng cáo Động:
- Một ‘Đại lý Tối ưu hoá Quảng cáo’ có thể giám sát hiệu suất của nhiều nội dung quảng cáo trên các nền tảng khác nhau (Google, Facebook, LinkedIn).
- Nó có thể tự động điều chỉnh giá thầu, phân bổ lại ngân sách cho các quảng cáo hoặc đối tượng hiệu quả hơn, tạm dừng các nội dung kém hiệu quả và thậm chí thực hiện thử nghiệm A/B các biến thể của nội dung quảng cáo mới do một đại lý AI chuyên biệt khác tạo ra.
Sử dụng AI thực tế trong hỗ trợ khách hàng
Hỗ trợ khách hàng là một lĩnh vực lý tưởng cho các quy trình công việc có yếu tố tác nhân, nhằm cung cấp sự trợ giúp nhanh chóng, chính xác và cá nhân hóa hơn.
- Phân loại và Chuyển hướng Thông minh:
- Một ‘Đại lý Xử lý Thắc mắc’ có thể phân tích các câu hỏi của khách hàng đến (từ chat, email, hoặc vé hỗ trợ) bằng cách sử dụng Xử lý Ngôn ngữ Tự nhiên (NLP).
- Nó có thể hiểu được ý định, mức độ khẩn cấp và danh mục của vấn đề.
- Thay vì chỉ định tuyến đơn giản bằng từ khóa, nó có thể thực hiện các quyết định phức tạp hơn để chuyển câu hỏi đến đại lý con người tốt nhất với chuyên môn phù hợp hoặc thậm chí cố gắng giải quyết tự động nếu đó là vấn đề phổ biến, đã biết.
- Giải quyết Tự động Các Vấn đề Thông thường:
- Một ‘Đại lý Giải quyết’ có thể truy cập các cơ sở dữ liệu kiến thức, câu hỏi thường gặp và dữ liệu vé trước đây.
- Đối với các câu hỏi thường gặp hoặc các nhiệm vụ khắc phục sự cố đơn giản (ví dụ, ‘làm thế nào để tôi đặt lại mật khẩu?’, ‘đơn hàng của tôi ở đâu?’), đại lý có thể hướng dẫn người dùng qua các bước hoặc trực tiếp cung cấp thông tin, giải phóng các đại lý con người cho các trường hợp phức tạp.
- Ví dụ về Quy trình làm việc:
- Nhận thức: Khách hàng hỏi, ‘Wi-Fi của tôi không hoạt động.’
- Quyết định: Đại lý truy cập vào cơ sở dữ liệu kiến thức, xác định các bước khắc phục sự cố Wi-Fi phổ biến. Nó lên kế hoạch một trình tự: ‘Hỏi về đèn trên router,’ ‘Gợi ý khởi động lại,’ ‘Kiểm tra kết nối cáp.’
- Hành động: Nó tương tác với khách hàng: ‘Đèn trên bộ định tuyến của bạn có nhấp nháy theo một cách cụ thể nào không?’ Dựa trên câu trả lời, nó tiến hành bước khắc phục sự cố tiếp theo.
Quy trình làm việc với nhiều tác nhân là gì và tại sao chúng mạnh mẽ?
Một quy trình làm việc nhiều tác nhân (hoặc hệ thống nhiều tác nhân – MAS) là một hệ thống trong đó hai hoặc nhiều tác nhân AI chuyên môn hóa tương tác và điều phối hành động của họ để đạt được một mục tiêu chung hoặc một tập mục tiêu liên quan mà một tác nhân đơn lẻ có thể gặp khó khăn.
Chúng mạnh mẽ vì:
- Chuyên môn hóa và Tính module: Mỗi tác nhân có thể là chuyên gia trong một lĩnh vực hoặc nhiệm vụ cụ thể. Điều này làm cho hệ thống dễ thiết kế, phát triển, kiểm tra và bảo trì hơn.
- Khả năng mở rộng và Song song: Nhiệm vụ có thể được phân phối giữa nhiều tác nhân để xử lý song song, dẫn đến hoàn thiện nhiệm vụ tổng thể nhanh hơn và khả năng mở rộng tốt hơn.
- Khả năng chịu lỗi và Độ bền: Nếu một tác nhân gặp sự cố, các tác nhân khác có thể tiếp quản các nhiệm vụ của nó hoặc tìm cách giải quyết thất bại, làm cho hệ thống bền vững hơn so với một hệ thống đơn khối.
- Quản lý Độ phức tạp: Các vấn đề lớn, phức tạp có thể được chia thành các vấn đề con nhỏ hơn, dễ quản lý hơn, mỗi vấn đề được giao cho một tác nhân cụ thể.
- Thông tin phân tán và Khả năng: Các tác nhân có thể ở nhiều vị trí khác nhau, tiếp cận các nguồn thông tin khác nhau hoặc sở hữu công cụ độc đáo, cho phép hệ thống tận dụng một phạm vi tài nguyên rộng hơn.
- Hành vi Tự phát: Tương tác của nhiều tác nhân đơn giản đôi khi có thể dẫn đến hành vi tập thể tinh vi và thông minh vượt trội hơn tổng thể các phần của nó.
Con người đóng vai trò gì trong quy trình làm việc với đại lý?
Ngay cả với các tác nhân AI tự động cao, con người vẫn đóng các vai trò không thể thiếu. Mục tiêu thường là tăng cường, không phải thay thế hoàn toàn, dẫn đến một quan hệ đối tác hợp tác giữa con người và AI.
Con người nên giám sát, phê duyệt hay chỉ quan sát các tác nhân AI?
Mức độ tham gia của con người phụ thuộc vào nhiều yếu tố, bao gồm:
- Tính quan trọng của nhiệm vụ: Các quyết định có tính chất quan trọng (ví dụ: giao dịch tài chính lớn, chẩn đoán y tế, thay đổi hệ thống quan trọng) thường yêu cầu sự phê duyệt trực tiếp từ con người hoặc ít nhất là sự giám sát chặt chẽ.
- Độ chín muồi và độ tin cậy của tác nhân: Một tác nhân mới hoặc ít được chứng minh có thể yêu cầu giám sát chặt chẽ hơn so với một tác nhân đã có lịch sử hoạt động đáng tin cậy dài.
- Nguy cơ sai sót và hậu quả: Nếu một sai sót có thể dẫn đến những hậu quả tiêu cực lớn (mất mát tài chính, vấn đề an toàn, thiệt hại uy tín), sự giám sát của con người trở nên quan trọng hơn.
- Sự mơ hồ và tính mới mẻ: Khi các tác nhân gặp phải những tình huống rất mơ hồ, mới mẻ, hoặc ngoài dữ liệu đào tạo của chúng, sự can thiệp của con người thường cần thiết để đưa ra quyết định hoặc đánh giá.
- Yêu cầu quy định: Một số ngành có các quy định yêu cầu sự giám sát của con người đối với các quy trình tự động nhất định.
Thực tế ‘con người trong vòng lặp’ (HITL) thực sự trông như thế nào?
‘Con người trong vòng lặp’ đề cập đến những điểm cụ thể trong quy trình công việc của tác nhân mà sự can thiệp của con người là cần thiết hoặc được tích hợp rõ ràng. Dưới đây là các ví dụ thực tiễn:
- Kiểm duyệt nội dung: Một tác nhân AI đánh dấu nội dung do người dùng tạo có thể gây vấn đề (ví dụ: phát ngôn thù địch, thư rác). Sau đó, một người kiểm duyệt sẽ xem xét các mục được đánh dấu này để đưa ra quyết định cuối cùng về việc xóa nội dung hay thực hiện hành động khác.
- Phát hiện gian lận tài chính: Một hệ thống AI xác định các giao dịch đáng ngờ. Thay vì tự động chặn tất cả các giao dịch bị đánh dấu (có thể dẫn đến các cảnh báo sai và gây khó chịu cho khách hàng), hệ thống sẽ chuyển chúng đến một nhà phân tích gian lận con người để điều tra thêm và quyết định xem có nên phê duyệt hay từ chối giao dịch.
- Hỗ trợ Chẩn đoán Y khoa: Một AI phân tích hình ảnh y khoa (ví dụ, X-quang, MRI) và đánh dấu các khu vực có khả năng quan ngại hoặc đề xuất chẩn đoán có thể có. Sau đó, một bác sĩ X-quang hoặc bác sĩ sẽ xem xét các phát hiện của AI, sử dụng chuyên môn của họ để diễn giải chúng trong bối cảnh lịch sử bệnh nhân, hướng dẫn y khoa và đưa ra chẩn đoán cuối cùng.
- Hỗ trợ Yêu cầu Khách hàng: Một chatbot AI cố gắng giải quyết truy vấn của khách hàng. Nếu nó không thể hiểu yêu cầu sau vài lần thử, hoặc nếu khách hàng bày tỏ sự thất vọng hoặc yêu cầu rõ ràng muốn trò chuyện với con người, quy trình làm việc sẽ tự động chuyển cuộc trò chuyện đến một nhân viên hỗ trợ khách hàng, cung cấp cho họ lịch sử cuộc trò chuyện.
Trong các hệ thống kết hợp giữa con người và AI, AI xử lý quy mô và tốc độ, trong khi con người đưa ra phán đoán, xử lý các sắc thái và chịu trách nhiệm cho các quyết định quan trọng.
Cần hạ tầng gì để hỗ trợ Quy trình dựa trên Đại diện?
Hỗ trợ các quy trình đại diện phức tạp cần nhiều hơn chỉ là mô hình AI. Một hạ tầng vững chắc là chìa khóa cho sự phát triển, triển khai, vận hành và bảo trì của chúng.
Công cụ chính để xây dựng và điều phối các agent AI
- Nền tảng Phát triển AI/ML:
- Khung làm việc: Thư viện như LangChain, LlamaIndex, AutoGen hoặc Semantic Kernel cung cấp các khối xây dựng nền tảng để tạo ra các agent. Chúng cung cấp các thành phần cho quản lý gợi ý, bộ nhớ, sử dụng công cụ, lập kế hoạch, và liên kết các cuộc gọi LLM.
- Nhà cung cấp Mô hình: Truy cập các mô hình nền tảng mạnh mẽ (ví dụ, dòng GPT của OpenAI, Claude của Anthropic, Gemini của Google) thường là cần thiết. Điều này có thể qua API của họ hoặc bằng cách sử dụng các mô hình mã nguồn mở được lưu trữ tại chỗ hoặc trên hạ tầng đám mây.
- Động cơ Điều phối:
- Các công cụ như Apache Airflow, Kubeflow Pipelines, Prefect hoặc các nền tảng điều phối tác nhân chuyên biệt (đang xuất hiện trên thị trường) giúp định nghĩa, lập lịch, thực thi và giám sát các quy trình phức tạp liên quan đến nhiều tác nhân hoặc bước. Chúng xử lý các phụ thuộc, thử lại và ghi lại nhật ký trong suốt quá trình làm việc.
- Cơ sở dữ liệu Vector:
- Đối với các tác nhân cần truy cập và lý luận trên lượng lớn dữ liệu văn bản (cho bộ nhớ dài hạn hoặc truy xuất kiến thức), các cơ sở dữ liệu vector như Pinecone, Weaviate, Milvus hoặc Chroma là quan trọng. Chúng lưu trữ dữ liệu dưới dạng biểu diễn và cho phép tìm kiếm tương tự hiệu quả.
- Cơ sở hạ tầng Tính toán:
- Cần có đủ tài nguyên tính toán (CPU, GPU để suy luận mô hình nếu tự lưu trữ, bộ nhớ). Các nhà cung cấp đám mây (AWS, Azure, GCP) cung cấp các tùy chọn tính toán có thể mở rộng. Công nghệ container hóa như Docker và điều phối như Kubernetes thường được sử dụng để triển khai và mở rộng.
- Nền tảng giám sát và quan sát:
- Các công cụ như Prometheus, Grafana, Datadog, New Relic hoặc các nền tảng quan sát LLM chuyên biệt (ví dụ: LangSmith, Arize AI, Weights & Biases) là rất cần thiết để theo dõi hành vi của tác nhân, hiệu suất và việc sử dụng tài nguyên.
- Quản lý và tích hợp API:
- Nếu các tác nhân cần tương tác với nhiều dịch vụ nội bộ hoặc bên ngoài, các cổng API và nền tảng tích hợp (ví dụ: MuleSoft, Apigee hoặc giải pháp tùy chỉnh) giúp quản lý các kết nối này một cách bảo mật và hiệu quả.
- Môi trường phát triển và công cụ CI/CD:
- Các công cụ phát triển phần mềm tiêu chuẩn như IDE, kiểm soát phiên bản (Git) và đường ống CI/CD (Jenkins, GitLab CI, GitHub Actions) là cần thiết để phát triển, thử nghiệm và triển khai hệ thống tác nhân.
Cách các tác nhân sử dụng API và plugin bên ngoài để thực hiện hành động
Để các tác nhân trở nên hữu ích vượt ra ngoài việc tạo văn bản đơn giản, chúng cần tương tác với thế giới bên ngoài và thực hiện các hành động. Các API (Giao diện lập trình ứng dụng) và plugin là cơ chế chính cho việc này:
- Định nghĩa ‘Công cụ’: Các nhà phát triển trang bị cho các tác nhân một tập hợp các ‘công cụ.’ Mỗi công cụ thường tương ứng với khả năng gọi một API cụ thể hoặc thực thi một chức năng.
- Tác nhân quyết định sử dụng công cụ: Khi một tác nhân dựa trên LLM xác định cần thông tin hoặc cần thực hiện một hành động mà nó không thể tự làm (ví dụ: lấy giá cổ phiếu hiện tại, gửi email, đặt sự kiện trên lịch), nó sẽ quyết định công cụ nào trong số các công cụ sẵn có là phù hợp.
- Gọi API có cấu trúc: Một khi một công cụ được chọn, tác nhân cần phải lập một cuộc gọi có cấu trúc tới API tương ứng. Điều này có nghĩa là cung cấp các tham số chính xác theo định dạng được mong đợi.
- Thực thi và Xử lý Phản hồi: Khung tác nhân thực thi cuộc gọi API. Sau đó, tác nhân nhận được phản hồi từ API (ví dụ: dữ liệu thời tiết, xác nhận rằng một email đã được gửi, hoặc thông báo lỗi).
- Đưa kết quả vào: Tác nhân xử lý phản hồi này và đưa thông tin hoặc kết quả của hành động vào nhiệm vụ đang thực hiện hoặc phản hồi tới người dùng.
Những gì có thể sai sót với Quy trình làm việc của Tác nhân và cách ngăn chặn
Mặc dù mạnh mẽ, chúng không miễn nhiễm với vấn đề. Hiểu các chế độ thất bại tiềm năng là bước đầu tiên hướng tới thiết kế các hệ thống bền vững và đáng tin cậy.
Các chế độ thất bại phổ biến như ảo giác và sai lệch
- Ảo giác (Bịa đặt):
- Đó là gì: Tác nhân AI tự tin khẳng định thông tin không chính xác hoặc vô lý, về cơ bản ‘bịa ra.’ Đây là một vấn đề phổ biến với LLM.
- Phòng ngừa/Giảm thiểu:
- Cập nhật: Cung cấp cho tác nhân quyền truy cập vào các nguồn dữ liệu thực tế (ví dụ: thông qua tạo ra gia tăng thông tin – RAG) và hướng dẫn nó dựa trên câu trả lời từ bối cảnh này.
- Công cụ Kiểm tra Thực tế: Trang bị cho tác nhân các công cụ để xác minh thông tin đối chiếu với các nguồn đáng tin cậy trước khi trình bày.
- Kỹ thuật Đề xuất: Tạo đề xuất một cách cẩn thận để khuyến khích tính thực tế và hạn chế suy đoán.
- Cài đặt Nhiệt độ: Hạ thấp thông số ‘nhiệt độ’ trong các mô hình ngôn ngữ để làm cho kết quả của chúng trở nên quyết định hơn và ít ‘sáng tạo’ hơn (và do đó ít có khả năng dẫn đến một số loại ảo giác).
- Sự không phù hợp (Mục tiêu không khớp):
- Đó là gì: Tác nhân theo đuổi một mục tiêu không phải là điều mà người dùng hoặc nhà thiết kế mong muốn, thường do hiểu sai chỉ dẫn, mục tiêu mơ hồ hoặc tối ưu hóa cho chỉ số sai.
- Phòng ngừa/Giảm thiểu:
- Đề xuất/Mục tiêu Rõ ràng, Không mơ hồ: Định nghĩa các mục tiêu với độ chính xác cao nhất có thể.
- Tinh chỉnh Lặp lại với Phản hồi: Kiểm tra kỹ lưỡng và sử dụng phản hồi để tinh chỉnh mục tiêu và chỉ dẫn.
- Trí Tuệ Nhân Tạo Lập Hiến/Biện pháp An toàn: Thực hiện các quy tắc hoặc nguyên tắc rõ ràng mà tác nhân phải tuân thủ, hạn chế hành vi của nó ngay cả khi hiểu sai mục tiêu chính một chút.
- Giám sát của Con người: Đối với các mục tiêu phức tạp hoặc quan trọng, hãy để con người xem xét kế hoạch đề xuất hoặc các hành động ban đầu của tác nhân.
- Lỗi Sử dụng Công cụ:
- Đó là gì: Tác nhân sử dụng sai một trong các công cụ của mình (ví dụ: gọi API với các tham số sai, hiểu sai phản hồi API, bị mắc kẹt trong vòng lặp khi cố gắng sử dụng công cụ bị lỗi).
- Phòng ngừa/Giảm thiểu:
- Thiết kế Công cụ Vững chắc: Đảm bảo các công cụ có khả năng xử lý lỗi tốt và cung cấp phản hồi rõ ràng cho tác nhân.
- Mô tả Công cụ Rõ ràng: Cung cấp cho tác nhân mô tả chính xác và toàn diện về từng công cụ làm gì và cách sử dụng nó.
- Cơ chế Thử lại với Giảm tải: Thực hiện các lần thử lại thông minh cho các lỗi công cụ tạm thời.
- Chiến lược Dự phòng: Định nghĩa những gì tác nhân nên thực hiện nếu một công cụ liên tục thất bại.
- Vòng lặp Vô tận hoặc Quá trình Không kiểm soát:
- Đó là gì: Đại lý bị mắc kẹt trong một chu kỳ hành động lặp đi lặp lại mà không có tiến triển, có khả năng tiêu thụ quá mức tài nguyên.
- Phòng ngừa/ Giảm thiểu:
- Giới hạn bước / Thời gian chờ: Triển khai các đếm vòng lặp tối đa hoặc giới hạn thời gian cho các nhiệm vụ.
- Giám sát trạng thái: Thiết kế đại lý nhận biết và thoát khỏi các vòng lặp không hiệu quả.
- Hạn mức tài nguyên: Áp đặt giới hạn tiêu thụ tài nguyên.
- Lỗ hổng bảo mật (ví dụ, Tiêm lệnh):
- Đó là gì: Các tác nhân độc hại tạo đầu vào đánh lừa đại lý thực hiện các hành động không mong muốn hoặc gây hại (ví dụ, tiết lộ thông tin nhạy cảm, thực thi mã tùy ý thông qua một công cụ bảo mật kém).
- Phòng ngừa/ Giảm thiểu:
- Thanh lọc và xác thực đầu vào: Kiểm tra cẩn thận và làm sạch các đầu vào của người dùng.
- Quyền tối thiểu cho công cụ: Đảm bảo các công cụ do đại lý sử dụng có quyền cần thiết tối thiểu.
- Tách biệt các hoạt động có quyền: Không để LLM trực tiếp xây dựng và thực thi các cuộc gọi đến API cực kỳ nhạy cảm; sử dụng mã trung gian đáng tin cậy.
Cách hệ thống làm việc của Agent sẽ thay đổi tương lai của công việc

Các hệ thống làm việc của Agent sẽ định hình lại cách thực hiện nhiệm vụ, cách đội ngũ kết hợp, và bản chất của nhiều công việc. Sự tập trung sẽ chuyển từ thực hiện thủ công sang thiết kế, giám sát, và phối hợp chiến lược với AI.
Những vai trò mới nào sẽ cần để quản lý các hệ thống agent AI?
Khi hệ thống agent trở nên phổ biến hơn, các vai trò chuyên môn mới có khả năng sẽ xuất hiện:
- Người điều hành/Quản lý tác nhân AI: Chuyên gia thiết kế, thiết lập cấu hình, giám sát, và quản lý đội ngũ AI agent và quy trình làm việc chúng thực hiện. Họ đảm bảo đại lý phù hợp với mục tiêu kinh doanh và hoạt động hiệu quả.
- Kỹ sư Đề xuất Tác nhân / Nhà thiết kế Tương tác AI: Chuyên gia trong việc tạo ra các đề xuất hiệu quả, xác định nhân dạng của tác nhân và thiết kế các mô hình tương tác hướng dẫn hành vi của tác nhân và đảm bảo hiệu suất tối ưu.
- Chuyên gia Đạo đức và Quản trị AI (cho hệ thống Agentic): Chuyên gia tập trung vào đảm bảo các quy trình hoạt động một cách có đạo đức, công bằng, minh bạch và tuân thủ các quy định và giá trị xã hội. Họ sẽ giải quyết các vấn đề về thiên kiến, an toàn và trách nhiệm giải trình.
- Người tích hợp API: Các nhà phát triển tạo ra và duy trì các công cụ tùy chỉnh, API và tích hợp mà tác nhân sử dụng để tương tác với các hệ thống và nguồn dữ liệu khác.
- Huấn luyện viên AI Agent và Chuyên viên Phân tích Hiệu suất: Cá nhân chịu trách nhiệm đào tạo và tinh chỉnh các mô hình AI cho các nhiệm vụ tác nhân đặc thù, giám sát hiệu suất của chúng, phân tích các đầu ra và xác định các khu vực cần cải thiện.
- Điều phối viên Hợp tác Nhân-AI: Người hỗ trợ các đội ngũ con người hợp tác hiệu quả với các tác nhân AI, xác định vai trò, tối ưu hóa quy trình làm việc và quản lý giao diện người-máy.
- Chuyên gia Tái thiết kế Quy trình Kinh doanh AI: Chuyên gia giúp các tổ chức tái thiết kế các quy trình kinh doanh hiện hữu để tận dụng khả năng của quy trình tác nhân, xác định cơ hội tự động hóa và tạo giá trị.
Những kỹ năng cần thiết để xây dựng các Tác nhân AI và tự động hóa quy trình tác nhân
- Kiến thức cơ bản về Kỹ thuật Đề xuất: Hiểu cách giao tiếp hiệu quả với các tác nhân dựa trên LLM để có được kết quả mong muốn.
- Hiểu biết về Dữ liệu: Khả năng hiểu, diễn giải và đánh giá một cách phê bình các dữ liệu mà tác nhân sử dụng và tạo ra.
- Tư duy Phản biện và Giải quyết Vấn đề: Phân tích đầu ra của tác nhân, xác định khi nào tác nhân có thể sai hoặc không phù hợp, và khắc phục sự cố.
- Nhận thức về đạo đức: Hiểu biết về các tác động đạo đức của việc sử dụng hệ thống AI tự động và nhận diện các thiên vị hoặc kết quả không công bằng có thể xảy ra.
- Khả năng thích ứng và học hỏi liên tục: Lĩnh vực này đang phát triển nhanh chóng, vì vậy cần có sự sẵn sàng học hỏi công cụ, kỹ thuật và khái niệm mới là rất quan trọng.
- Hợp tác và giao tiếp: Làm việc hiệu quả trong các nhóm bao gồm cả người và các đại lý AI.
- Thiết kế quy trình và suy nghĩ hệ thống: Hiểu cách mà nhiệm vụ của các đại lý cá nhân hòa hợp vào các quy trình làm việc và quy trình kinh doanh rộng lớn hơn ngoài các nhiệm vụ hành chính.
- Chuyên môn lĩnh vực + Hiểu biết về AI: Các chuyên gia lĩnh vực cần hiểu đủ về khả năng của AI để hình dung cách mà các đại lý có thể hỗ trợ trong lĩnh vực cụ thể của họ.
Khi nào nên sử dụng quy trình làm việc AI thay vì tự động hóa truyền thống
Chọn quy trình làm việc AI khi:
- Nhiệm vụ yêu cầu phân tích dữ liệu, đưa ra quyết định, lý luận, hoặc lập kế hoạch dựa trên các đầu vào động.
- Quy trình cần phải thích ứng với các tình huống mới hoặc không mong đợi.
- Nhiệm vụ liên quan đến việc hiểu ngôn ngữ tự nhiên hoặc tương tác với dữ liệu không cấu trúc.
- Mục tiêu là phức tạp và có thể cần nhiều bước không rõ ràng để đạt được.
- Cá nhân hóa hoặc nhận thức ngữ cảnh là yếu tố then chốt.
- Bạn muốn hệ thống có thể học hỏi và cải thiện theo thời gian mà không cần giám sát thường xuyên từ con người.
Hãy chọn tự động hóa truyền thống (ví dụ: Tự động hóa quy trình bằng robot – RPA, các kịch bản đơn giản) khi:
- Các quy trình cứng nhắc được lặp đi lặp lại, dựa trên quy tắc, và có thể dự đoán dễ dàng.
- Các đầu vào và đầu ra được cấu trúc tốt và đồng nhất.
- Các thắc mắc thông thường không yêu cầu quyết định phức tạp hoặc khả năng thích ứng.
- Môi trường ổn định và ít có khả năng thay đổi thường xuyên.
- Chi phí và độ phức tạp trong phát triển một giải pháp AI không được biện minh cho một nhiệm vụ đơn giản.
Một danh sách kiểm tra để biến quy trình thủ công thành quy trình làm việc AI
- Xác định quy trình phù hợp:
- Hiện tại nó có đang thủ công hoặc bán thủ công không?
- Nó có liên quan đến việc ra quyết định dựa trên các đầu vào khác nhau không?
- Nó có tốn nhiều thời gian hoặc dễ gây lỗi cho con người không?
- Có mục tiêu rõ ràng hoặc kết quả mong muốn không?
- Có dữ liệu để thông báo cho tác nhân không (hoặc có thể làm cho có dữ liệu không)?
- Xác định Mục tiêu và Phạm vi của Tác nhân:
- Mục tiêu chính của tác nhân là gì? Hãy cụ thể.
- Giới hạn là gì? Tác nhân nên không làm gì?
- Các đầu vào chính mà tác nhân sẽ nhận được là gì?
- Các đầu ra hoặc hành động mong đợi là gì?
- Phân Tích Quá Trình:
- Các bước logic liên quan là gì nếu một con người thực hiện điều này?
- Các quyết định được đưa ra ở đâu? Thông tin nào ảnh hưởng đến những quyết định đó?
- Thông tin hoặc công cụ nào mà tác nhân cần ở mỗi bước?
- Xác định Công Cụ và Nguồn Dữ Liệu Cần Thiết:
- Các hệ thống/nền tảng cơ sở dữ liệu nội bộ nào mà tác nhân cần truy cập?
- Các API hoặc dịch vụ bên ngoài nào là cần thiết (ví dụ: tìm kiếm web, email, ứng dụng kinh doanh cụ thể)?
- Kiến thức hoặc tài liệu nào mà tác nhân cần tham khảo?
- Thiết Kế Logic và Điểm Quyết Định của Tác nhân:
- Tác nhân sẽ nhận thức môi trường/đầu vào của nó như thế nào?
- Nó sẽ lập kế hoạch hành động như thế nào để đạt được mục tiêu? (ví dụ: sử dụng khả năng suy luận của LLM, một máy trạng thái được định trước).
- Nó sẽ quyết định sử dụng công cụ nào và khi nào?
- Lập Kế Hoạch Cho Giám Sát và Can Thiệp:
- Tại những điểm nào mà con người nên xem xét hoặc phê duyệt công việc của tác nhân?
- Các ngoại lệ hoặc lỗi sẽ được chuyển đến con người như thế nào?
- Mức độ tự chủ nào là phù hợp cho phiên bản đầu tiên này?
- Bắt Đầu Nhỏ và Lặp Lại:
- Bạn có thể xây dựng một phiên bản rất đơn giản (MVP) trước tiên để chứng minh ý tưởng không?
- Phần nhỏ nhất của luồng công việc mà bạn có thể tự động hoá với một tác nhân là gì?
Kết luận

Khi bạn xây dựng và triển khai các quy trình làm việc tác nhân thực sự hiệu quả, giá trị không nằm ở các buổi trình diễn hào nhoáng hay các khung lý thuyết, mà là ở tác động cộng dồn của chúng đối với cách công việc thực sự được hoàn thành và tiết kiệm thời gian.
Khi chúng tôi lần đầu tiên giới thiệu các quy trình làm việc tác nhân AI vào hoạt động của mình, chúng tôi không nhắm đến tự động hóa hoàn toàn, vì công nghệ chưa ở mức đó. Thay vào đó, chúng tôi tập trung vào việc tạo ra các tác nhân AI có thể xử lý các nhiệm vụ cụ thể và phức tạp như nghiên cứu, phác thảo ý tưởng, xử lý dịch vụ khách hàng và tự động hóa email, nhưng dựa trên phong cách ra quyết định của chúng tôi, giọng điệu thương hiệu và ngữ cảnh nhận thức nhưng với ít sự can thiệp của con người hơn.
Tóm lại, các quy trình làm việc tác nhân đã chuyển từ khái niệm mới thành một phần của cấu trúc hoạt động của chúng tôi. Chúng đã cho phép chúng tôi mở rộng quy mô một cách thông minh, đáp ứng thách thức nhanh chóng và liên tục cải thiện các quy trình của mình, trong khi vẫn giữ sự sáng tạo và đánh giá của con người ở vị trí quan trọng nhất.