Đánh giá về Đại lý ChatGPT – phiên bản mới nhất của OpenAI

Đại lý ChatGPT là một tính năng mới của OpenAI cho phép AI hoàn thành các nhiệm vụ trực tuyến phức tạp và nhiều bước một cách tự động. Dưới đây là bài đánh giá về Đại lý ChatGPT dựa trên kinh nghiệm thực tế của chúng tôi.

Đại lý ChatGPT là một tính năng mới của OpenAI cho phép AI hoàn thành các nhiệm vụ trực tuyến phức tạp và nhiều bước một cách tự động. Nó hoạt động trong một môi trường máy tính ảo cách ly, cho phép chuyển đổi giữa suy luận và hành động để thực hiện nhiều chức năng khác nhau, từ nghiên cứu chi tiết đến tương tác với các trang web.

Cải tiến này hiệu quả kết hợp hai công cụ chuyên biệt trước đây của OpenAI: ‘Operator,’ được thiết kế cho các hành động dựa trên web, và ‘Deep Research,’ tập trung vào tổng hợp thông tin. Kết quả là một hệ thống thống nhất không chỉ có thể duyệt web mà còn hoàn thành các biểu mẫu, chỉnh sửa bảng tính và chạy mã, đồng thời giữ cho người dùng luôn kiểm soát. Đại lý ChatGPT được thiết kế để tương tác và cộng tác, cho phép người dùng có thể gián đoạn, cung cấp làm rõ hoặc đảm nhận nhiệm vụ vào bất cứ lúc nào. Dưới đây là bài đánh giá thực tế của chúng tôi về Đại lý ChatGPT.

Các điểm chính

  • Thực thi Tác vụ Tự động: Đặc vụ ChatGPT là một AI tự chủ thực hiện các tác vụ kỹ thuật số phức tạp và đa bước trong một môi trường máy tính an toàn và cách ly.
  • Bộ công cụ tích hợp: Sử dụng các công cụ được tích hợp sẵn, bao gồm trình duyệt web và terminal mã, để duyệt web, tương tác với các ứng dụng và phân tích dữ liệu.
  • Hiệu suất tham chiếu: Trong các bài kiểm tra tham chiếu, đặc vụ đạt 45,5% trong các tác vụ bảng tính, cao hơn gấp đôi so với 20,0% mà Copilot của Microsoft đạt được trên Excel.
  • Chuyển đổi sang ủy quyền: Thay đổi vai trò của người dùng từ việc đặt câu hỏi đơn giản sang ủy quyền các dự án hoàn chỉnh, như lên kế hoạch chuyến đi hoặc tạo báo cáo nghiên cứu.
  • Vận hành dưới sự kiểm soát của người dùng: Đặc vụ hoạt động dưới sự kiểm soát hoàn toàn của người dùng, với khả năng tạm dừng, cung cấp chỉ dẫn mới hoặc dừng hoàn toàn một tác vụ bất cứ lúc nào.

Các tính năng của đặc vụ ChatGPT

Đặc vụ ChatGPT được trang bị bộ công cụ thiết kế để xử lý nhiều loại tác vụ kỹ thuật số. Các tính năng chính của nó được thiết kế nhằm cung cấp chức năng cao đồng thời ưu tiên kiểm soát và bảo mật cho người dùng. Đặc vụ ChatGPT minh họa sức mạnh thực tiễn của AI Agentic, tự động thực hiện các quy trình làm việc kỹ thuật số phức tạp chỉ từ một chỉ thị duy nhất của người dùng.

  • Môi trường máy tính ảo: Tác nhân hoạt động trong một máy tính ảo được cách ly và chạy trong hộp cát. Điều này cho phép thực thi các tác vụ một cách an toàn mà không truy cập vào tệp cục bộ của người dùng trừ khi có sự cho phép rõ ràng. Trong môi trường này, nó có thể mở trình duyệt có giao diện đồ họa để tương tác, sử dụng trình duyệt dựa trên văn bản cho các truy vấn đơn giản hơn, chạy mã trong terminal và sử dụng truy cập API trực tiếp.
  • Hệ thống tác nhân hợp nhất: Kết hợp khả năng của “Điều hành” và “Khảo sát chuyên sâu” trong một hệ thống đồng nhất. Sự tích hợp này không chỉ cho phép thực hiện các thao tác trên trang web, mà còn có thể phân tích chi tiết và tổng hợp thông tin từ nhiều nguồn khác nhau.
  • Bộ công cụ tích hợp: Tác nhân có bộ công cụ đa năng bao gồm trình duyệt đồ họa, trình duyệt văn bản, terminal và truy cập API. Nó có thể lựa chọn thông minh công cụ phù hợp cho từng nhiệm vụ, điều chỉnh cách tiếp cận để đạt hiệu quả nhanh chóng và chính xác hơn.
  • Kiểm soát và bảo mật của người dùng: Một nguyên tắc thiết kế quan trọng của Tác nhân ChatGPT là giữ cho người dùng kiểm soát. Bạn có thể ngắt quãng tác nhân bất cứ lúc nào để cung cấp hướng dẫn mới hoặc tự mình xử lý nhiệm vụ. Để tăng cường bảo mật, “Chế độ Giám sát” cung cấp cảnh báo trước khi tác nhân thực hiện các hành động nhạy cảm. Đối với người dùng doanh nghiệp trong các gói Team và Enterprise, có sẵn nhật ký chi tiết phục vụ mục đích gỡ lỗi và kiểm toán.
  • Tích hợp các kết nối: Đại lý ChatGPT có thể kết nối với các ứng dụng bên thứ ba như Gmail, Google Drive và SharePoint. Những kết nối này hoạt động như nguồn dữ liệu chỉ đọc, cho phép đại lý trích xuất thông tin liên quan đến các luồng công việc của bạn. Ví dụ, nó có thể tóm tắt hộp thư đến của bạn hoặc kiểm tra lịch để tìm thời gian còn trống cho các cuộc họp.

Khả năng của Đại lý ChatGPT

Khả năng của Đại lý ChatGPT vượt xa các tương tác chatbot đơn thuần, biến nó thành một công cụ hữu dụng để thực hiện các quy trình công việc phức tạp.

  • Tương tác web: Đại lý ChatGPT có thể duyệt web, điền biểu mẫu, nhấp nút và gửi truy vấn. Nó có thể xử lý cả việc duyệt web dựa trên văn bản đơn giản lẫn các tương tác phức tạp cần trình duyệt hình ảnh.
  • Tự động hóa tác vụ: Một trong những chức năng chính của đại lý là tự động hóa các tác vụ nhiều bước. Ví dụ, nó có thể được chỉ dẫn để tải xuống một tệp từ GitHub, chạy qua trình quét lỗ hổng và sau đó lưu kết quả vào Google Drive. Nó cũng có thể quản lý sự kiện lịch, lên kế hoạch bữa ăn dựa trên nhu cầu dinh dưỡng hoặc thực hiện phân tích cạnh tranh.
  • Tạo nội dung: Đại lý có khả năng tạo ra nhiều loại tài liệu khác nhau. Nó có thể tạo bài thuyết trình PowerPoint từ tập hợp hướng dẫn, tạo và điền dữ liệu vào bảng tính Excel, cũng như soạn thảo email.
  • Phân tích dữ liệu: Với quyền truy cập vào terminal mã và chức năng bảng tính, đại lý có thể thực hiện các tác vụ phân tích dữ liệu. Các điểm chuẩn cho thấy nó có thể vượt trội hơn Copilot của Microsoft trong một số tác vụ dựa trên Excel.

Các trường hợp sử dụng dành cho Đại lý ChatGPT

Các ứng dụng thực tiễn của Đại lý ChatGPT bao gồm nhiều lĩnh vực cá nhân và chuyên nghiệp. Khả năng tự động hóa nghiên cứu, tạo nội dung và các nhiệm vụ hành chính khiến nó trở thành trợ thủ đắc lực cho nhiều đối tượng người dùng.

  • Hoạt động Kinh doanh: Các đội ngũ bán hàng có thể ủy thác công việc nghiên cứu khách hàng tiềm năng và soạn thảo email liên hệ. Các phòng nhân sự có thể tự động hóa các khía cạnh tuyển dụng và hội nhập, như xem xét hồ sơ xin việc và gửi tài liệu giới thiệu.
  • Phát triển Sản phẩm và Hỗ trợ Điều hành: Các đội ngũ sản phẩm có thể sử dụng đại lý để nhanh chóng chuyển các đặc tả dự án thành các bài thuyết trình được trình bày chỉnh chu. Các lãnh đạo có thể giao nhiệm vụ nghiên cứu cho đại lý, yêu cầu chuẩn bị các báo cáo toàn diện về xu hướng thị trường hoặc đối thủ cạnh tranh.
  • Năng suất Cá nhân: Đại lý có thể được sử dụng cho nhiều công việc cá nhân như lên kế hoạch chuyến đi, bao gồm tìm vé máy bay và khách sạn, nghiên cứu hoạt động tham quan và tạo lịch trình. Nó cũng có thể hỗ trợ lên kế hoạch bữa ăn, quản lý tài chính cá nhân hoặc tổ chức các tập tin kỹ thuật số của bạn.
  • Mô hình Tài chính: Người dùng có thể yêu cầu đại lý xây dựng mô hình tỷ lệ đốt tiền cho startup. Nhiệm vụ phức tạp này có thể bao gồm truy cập tập tin cục bộ (với sự cho phép), thu thập dữ liệu ngành từ các nguồn trực tuyến, và xây dựng mô hình trong bảng tính.

Các Điểm Chuẩn của Đại lý ChatGPT

OpenAI đã phát hành nhiều điểm chuẩn nhằm chứng minh cải tiến hiệu năng của mô hình mới vận hành Đại lý ChatGPT.

  • Khoa học Nhân văn: Trong điểm chuẩn Kỳ Thi Nhân văn gần đây nhất, đại lý đạt 44,4%, vượt trội hơn so với hiệu suất của các mô hình đương đại khác.
  • Toán học: Trong bài đánh giá FrontierMath, kiểm tra khả năng lý luận toán học nâng cao, đại lý đã đạt được điểm 27,4%, một cải thiện đáng kể so với các mô hình trước đây của OpenAI.
  • Nhiệm vụ Bảng tính: Trong một bài đánh giá mang tên SpreadsheetBench, Đại lý ChatGPT đạt 45,5%, gấp hơn hai lần so với 20,0% mà Copilot của Microsoft đạt được trong Excel.
  • Khoa học Dữ liệu: Đại lý cũng thể hiện tiến bộ lớn về hiệu suất trong DSBench, một bài đánh giá được thiết kế để đo hiệu quả trong các nhiệm vụ khoa học dữ liệu thực tế.
  • Nhiệm vụ Dựa trên Web: Trong bài đánh giá Web Arena, đo hiệu năng trong các nhiệm vụ thực tế dựa trên web, báo cáo cho thấy đại lý đang tiến gần đến hiệu suất ở mức con người.

Cách Truy cập Đại lý ChatGPT

Đại lý ChatGPT đang được triển khai cho người dùng có các gói đăng ký cụ thể. Nó có sẵn cho người đăng ký Pro, Plus và Team, với kế hoạch mở rộng quyền truy cập cho người dùng Giáo dục và Doanh nghiệp trong tương lai gần. Người dùng Pro nhận được số lượng yêu cầu hàng tháng nhiều hơn so với người dùng Plus và Team. Để kích hoạt đại lý, bạn có thể chọn ‘Chế độ Đại lý’ từ menu công cụ trong giao diện ChatGPT hoặc nhập /agent trong phần soạn thảo.

Đánh giá Thực tế về Đại lý ChatGPT: Lên Kế hoạch Chuyến đi 10 Ngày tới Nhật Bản

Để thử nghiệm Đại lý ChatGPT, chúng tôi giao cho nó một nhiệm vụ thực tế: lên kế hoạch cho chuyến đi 10 ngày đến Nhật Bản cho một cặp đôi, bao gồm trượt tuyết mùa đông và tham quan Tokyo, Kyoto, và Osaka. Tổng ngân sách cho chuyến đi, bao gồm cả vé máy bay từ London, được đặt ở mức thách thức là 5.000 đô la. Dưới đây là mô tả từng bước cách đại lý xử lý yêu cầu.

Bước 1: Yêu cầu Ban đầu và Làm rõ

Chúng tôi bắt đầu với một yêu cầu rõ ràng và chi tiết:

Lên kế hoạch một chuyến du lịch trọn gói 10 ngày đến Nhật Bản cho một cặp đôi vào mùa đông. Chuyến đi phải bao gồm 3 ngày trượt tuyết, tiếp theo là 7 ngày phân chia giữa Tokyo, Kyoto và Osaka. Tổng ngân sách, bao gồm cả vé khứ hồi từ London, phải dưới 5.000 USD.

Nhân viên đã bắt đầu bằng cách phân tích yêu cầu thành một loạt các bước hợp lý. Anh ấy xác định các hạn chế chính: thời gian 10 ngày, hành trình qua bốn địa điểm, lịch trình mùa đông và ngân sách nghiêm ngặt 5.000 USD. Sau đó, anh ấy thiết lập kế hoạch hành động:

  1. Tìm các chuyến bay có giá rẻ nhất từ London đến Nhật Bản trong các tháng mùa đông (tháng 12 đến tháng 2).
  2. Nghiên cứu các khu nghỉ dưỡng trượt tuyết trọn gói ở Nhật Bản cung cấp giá cả hợp lý cho khoảng thời gian lưu trú 3 ngày.
  3. Tìm chỗ ở tiết kiệm tại Tokyo, Kyoto và Osaka cho 7 ngày còn lại.
  4. Lập lịch trình theo từng ngày bao gồm cả việc di chuyển giữa bốn điểm đến.
  5. Ước tính tổng chi phí cho vé máy bay, chỗ ở, vé trượt tuyết, phương tiện di chuyển và chi phí sinh hoạt hàng ngày để đảm bảo chuyến đi nằm trong ngân sách 5.000 USD.

Bước 2: Nghiên cứu và Thu thập Thông tin

Nhân viên đã bắt đầu nghiên cứu bằng trình duyệt web tích hợp của mình để tìm các chuyến bay. Anh ấy nhanh chóng quét qua nhiều trang tổng hợp du lịch và các trang web hãng hàng không, nhận thấy thời điểm rẻ nhất để đi du lịch là cuối tháng 1 hoặc đầu tháng 2, tránh mùa cao điểm nghỉ lễ. Anh ấy tìm thấy một số lựa chọn cho chuyến vé khứ hồi từ London đến Tokyo (Narita hoặc Haneda) với giá khoảng 1.200–1.500 cho hai người.

Tiếp theo, phần du lịch dành cho khu vực trượt tuyết đã được đề cập. Đại lý đã tìm kiếm ‘gói trọn gói trượt tuyết tại Nhật Bản’ và ‘các khu nghỉ dưỡng trượt tuyết giá rẻ gần Tokyo’. Họ đã phân tích nhiều lựa chọn, xem xét các yếu tố như khả năng tiếp cận từ Tokyo, giá vé trượt tuyết và chi phí lưu trú. Cuối cùng thu hẹp lựa chọn xuống một số khu nghỉ dưỡng ở các tỉnh Nagano và Niigata, nơi nổi tiếng với tuyết chất lượng cao và giá cả phải chăng hơn so với Hokkaido.

Đối với phần thành phố của chuyến đi, đại lý đã tìm kiếm các lựa chọn chỗ ở với giá phải chăng, bao gồm khách sạn doanh nhân, ryokan (nhà trọ truyền thống của Nhật Bản) và các danh sách Airbnb được đánh giá tốt. Họ đã so sánh giá cả với đánh giá và vị trí để tìm được sự cân bằng tốt nhất giữa chi phí và tiện lợi.

Bước 3: Tạo Lịch Trình và Ngân Sách

Sau khi hoàn tất nghiên cứu, đại lý bắt đầu xây dựng lịch trình. Họ tổ chức chuyến đi theo một trình tự hợp lý để giảm thiểu thời gian di chuyển và chi phí:

  • Ngày 1–4: Trượt Tuyết tại Hakuba
    • Ngày 1: Đến sân bay Narita ở Tokyo (NRT), đi xe buýt trực tiếp đến Hakuba (một khu trượt tuyết ở dãy Alps Nhật Bản). Đăng ký tại một nhà trọ trượt tuyết giá rẻ đã được chọn trước. Đại lý tìm được gói bao gồm 3 đêm lưu trú, vé trượt tuyết 2 ngày và bữa sáng với chi phí khoảng 800 đô la cho hai người.
    • Ngày 2–3: Trượt tuyết tại Hakuba. Đại lý nhận thấy nhiều nhà trọ ở Hakuba cung cấp giảm giá cho vé trượt tuyết và thuê thiết bị, điều này đã được tính vào ngân sách.
    • Ngày 4: Phiên trượt tuyết buổi sáng, rồi vào buổi chiều đi xe buýt trở lại Tokyo.
  • Ngày 4–6: Tokyo
    • Ngày 4 (Chiều): Đến Tokyo, nhận phòng khách sạn kinh doanh tại khu vực trung tâm như Shinjuku hoặc Shibuya. Đại lý tìm được các lựa chọn với giá khoảng 100–120 mỗi đêm.
    • Ngày 5: Khám phá Tokyo. Đại diện đã gợi ý một tour tự hướng dẫn qua các khu vực phổ biến như Shibuya (vì ngã tư đi bộ nổi tiếng), Harajuku (vì văn hóa thanh thiếu niên và thời trang), và Shinjuku (vì điểm ngắm cảnh miễn phí tại Toà nhà Chính quyền Đô thị Tokyo).
    • Ngày 6: Tham quan các địa điểm văn hóa như Chùa Senso-ji ở Asakusa và Đền Meiji. Đại diện cũng đề xuất khám phá Công viên Ueno và các bảo tàng trong khu vực.
  • Ngày 7–8: Kyoto
    • Ngày 7: Đi bằng Shinkansen (tàu siêu tốc) từ Tokyo đến Kyoto. Đại diện lưu ý rằng Japan Rail Pass có thể không tiết kiệm cho lịch trình này và đề nghị mua vé lẻ để tiết kiệm khoảng 150 USD. Đăng ký tại một ryokan để có trải nghiệm truyền thống hơn, với giá khoảng 130 USD mỗi đêm.
    • Ngày 8: Khám phá các địa điểm lịch sử ở Kyoto, bao gồm Đền Fushimi Inari (với hàng ngàn cổng torii đỏ), Kinkaku-ji (Chùa Vàng), và Rừng tre Arashiyama.
  • Ngày 9–10: Osaka
    • Ngày 9: Đi một chuyến tàu ngắn từ Kyoto đến Osaka. Đăng ký khách sạn ở khu vực Namba hoặc Umeda. Khám phá Dotonbori, khu vui chơi giải trí và ẩm thực nổi tiếng của Osaka, và thử các đặc sản địa phương như takoyaki và okonomiyaki.
    • Ngày 10: Tham quan Lâu đài Osaka vào buổi sáng, mua sắm quà lưu niệm phút chót, rồi di chuyển đến Sân bay Quốc tế Kansai (KIX) để bay về London.

Bước 4: Phân tích cuối cùng về ngân sách

Đại diện đã cung cấp bảng phân tích chi tiết để đảm bảo chuyến đi nằm trong ngân sách 5.000 USD:

  • Vé máy bay: ~1.500 USD (từ London đến Tokyo, về từ Osaka)
  • Chỗ ở:
    • Chalet trượt tuyết (3 đêm, bao gồm vé trượt tuyết): ~800 USD
    • Khách sạn Tokyo (3 đêm): ~360 USD
    • Ryokan ở Kyoto (2 đêm): ~260 USD
    • Khách sạn ở Osaka (1 đêm): khoảng 120 USD
  • Phương tiện di chuyển:
    • Xe buýt (Tokyo đến Hakuba và quay trở lại): khoảng 150 USD
    • Shinkansen (Tokyo đến Kyoto): khoảng 250 USD
    • Tàu địa phương (Kyoto đến Osaka, di chuyển sân bay, v.v.): khoảng 100 USD
  • Ăn uống và Chi phí hàng ngày: Ước tính 120mỗingàycho10ngày: 120mingàycho10ngày1,200
  • Quỹ dự phòng: khoảng 260 USD

Tổng chi phí ước tính: khoảng 4,900 USD

Ví dụ thực tế này minh họa cách mà Đại lý ChatGPT có thể hoạt động như một người lập kế hoạch du lịch năng lực và hiệu quả. Nó đã điều hướng thành công một tập hợp các ràng buộc phức tạp, thực hiện nghiên cứu kỹ lưỡng và cung cấp một hành trình chi tiết, khả thi đáp ứng tất cả yêu cầu của người dùng. Bằng cách phân chia vấn đề thành những bước nhỏ hơn và dễ quản lý hơn, đại lý đã tạo ra một kế hoạch tổng thể mà một người dùng con người sẽ mất hàng giờ, nếu không muốn nói là hàng ngày, để hoàn thành. Điều này chứng minh giá trị thực tiễn của Đại lý ChatGPT trong việc xử lý các nhiệm vụ đa bước thực tế.

Đánh giá Đại lý ChatGPT – Có đáng giá không?

Thành thật mà nói, khi giao cho Đại lý ChatGPT nhiệm vụ lên kế hoạch toàn bộ chuyến đi đến Nhật Bản với ngân sách hạn chế, đó là khoảnh khắc ‘hãy cho tôi thấy, đừng chỉ nói’. Và nó đã thể hiện. Đây là lúc bạn cảm nhận được sự khác biệt giữa một chatbot trả lời câu hỏi và một đại lý thực sự làm việc. Cảm giác không còn như đang gõ lệnh nữa mà giống như bạn đang giao dự án cho một trợ lý có năng lực.

Xem nó tạo các chuyến bay, gói trượt tuyết và lịch trình hàng ngày chính là lúc khái niệm ‘Đại lý AI’ trở nên có ý nghĩa, không chỉ là một ý tưởng suông, mà là một công cụ thật sự mang lại thời gian cho bạn. Mặc dù bạn vẫn cần kiểm soát, nhưng Đại lý ChatGPT là một phi công phụ quyền năng để điều hướng các nhiệm vụ phức tạp và tốn thời gian làm đầy ngày làm việc của chúng ta.

Business, Mentorship, and AI
Alexi Carmichael Business, Mentorship, and AI Được Xác Nhận Bởi Chuyên Gia
Alexi Carmichael is a tech writer with a special interest in AI's burgeoning role in enhancing the efficiency of American SMEs. With her know-how and experiences, she has since taken on the role of mentor for fellow entrepreneurs striving for digital optimization and transformation. With Tech Pilot, she shares her insights on navigating the complexities of AI and how to leverage its capabilities for business success.