22/04/2025

So sánh hai giao thức MCP và A2A

 

Mới đây Google đã công bố một giao thức mở có tên A2A (Agent2Agent), với mục tiêu chuẩn hóa cách chúng ta triển khai giao tiếp trong hệ thống đa tác tử (MultiAgent Systems). Giao thức này được xem như có những đặc điểm bổ trợ cho những hạn chế trước đó của giao thức MCP (Model Context Protocal) của Antropic, một giao thức cũng nhằm đóng gói các bộ công cụ cần thiết và kết nối mô hình tới chúng.


Những giao thức kết nối này gần đây đã làm chấn động cộng đồng AI và hứa hẹn sẽ thay đổi cách thức thiết kế và giao tiếp giữa các AI Agents trong thời gian tới.


Hãy cùng xem xét sự khác biệt và cách hai giao thức này bổ trợ cho nhau trong bài viết này:


I. Giới thiệu giao thức MCP

Giao thức MCP xây dựng một kết nối client-server giữa Agent với những bộ công cụ thường được sử dụng. Ba thành phần chính trong một kết nối MCP bao gồm:

1) MCP Host – Các chương trình sử dụng LLM làm lõi và muốn truy cập dữ liệu thông qua MCP. 

Note: Khi kết hợp với A2A, một Agent sẽ trở thành MCP Host.

2) MCP Client – Các client duy trì kết nối 1:1 với server.

3) MCP Server – Các chương trình nhẹ, cung cấp năng lực cụ thể thông qua giao thức chuẩn hóa Model Context Protocol.

Ngoài ra các loại dữ liệu có thể được sử dụng như những thông tin bổ sung cho LLM thông qua MCP Server bao gồm:

4) Nguồn dữ liệu cục bộ – Các tập tin, cơ sở dữ liệu và dịch vụ trên máy tính của bạn mà MCP Server có thể truy cập một cách an toàn.

5) Nguồn dữ liệu từ xa – Các hệ thống bên ngoài truy cập qua internet (ví dụ: qua API) mà MCP Server có thể kết nối đến.


II. Sự xuất hiện của A2A

MCP hướng tới cung cấp một giao thức chuẩn kết nối giữa agent tới tools nhưng không cho thấy khả năng tương tác mở rộng giữa các Agents. Ở những điểm MCP còn thiếu sót này sẽ được A2A bù đắp. Trong các ứng dụng Multi-Agent mà trạng thái không nhất thiết phải được chia sẻ, các Agent (MCP Host) sẽ triển khai và giao tiếp qua giao thức A2A, cho phép:


- Triển khai an toàn: Bổ sung thêm cơ chế xác thực mà MCP đang bị thiếu.

- Quản lý nhiệm vụ và trạng thái: Các nhiệm vụ và trạng thái sẽ được quản lý bên trong các hệ thống Multi-Agent một cách chặt chẽ.

- Thực hiện các tác vụ phức tạp: A2A cho phép lập kế hoạch, phối hợp và thảo luận giữa nhiều Agent nên giúp kết quả đạt được có độ chi tiết và chính xác cao.

- Tuy nhiên A2A cũng phát sinh các hạn chế: Cơ chế xử lý qua nhiều tương tác sẽ tăng thời gian cần thiết giải quyết các tác vụ và chi phí inference.


III. Suy nghĩ của tôi

Cả hai giao thức MCP và A2A đang trong giai đoạn bắt đầu hình thành nên sẽ có những cải tiến sắp tới ở hai giao thức này. Trong dài hạn, chúng ta sẽ chứng kiến một cuộc đua cải tiến giữa các giao thức để hướng tới hình thành một tiêu chuẩn lâu dài khi cả hai đang dần dần mở rộng các tính năng của chúng.


Source:

- MCP: https://www.anthropic.com/news/model-context-protocol

- Agent2Agent: https://developers.googleblog.com/en/a2a-a-new-era-of-agent-interoperability/

Compare MCP and A2A: 

- https://www.linkedin.com/pulse/mcp-a2a-dream-team-ai-helpers-manish-surapaneni-cfcic/

- https://www.linkedin.com/posts/aurimas-griciunas_llm-ai-machinelearning-activity-7316420758648315907-Tzuy/

Danh sách công cụ AI để "việc gì cũng làm được"



1+2. HeyGen + 11Labs
→ Combo tạo video AI “như người thật”

- Tạo Avatar AI giống hệt bạn (cử chỉ, nét mặt, giọng nói)
- Chỉ cần quay 2-5 phút video gốc → sau đó tạo cả loạt video mà không cần bạn xuất hiện!
- Đặc biệt phù hợp với người dạy online, b,án hàng bằng video.

-------

3. Suno AI → Tạo nhạc nền gốc không dính bản quyền

- Không còn phải dùng Epidemic hay YouTube library

- Tạo nhạc đúng vibe video, cá nhân hóa mà không lo bị “ăn gậy”

→ Dành cho Vlog, Reels, intro khóa học, video cảm xúc…

-------

4. NotebookLM (Google) → Biến blog/PDF thành podcast biết trao đổi

- Cho blog, sách, PDF vào → AI tự tóm tắt và chuyển thành audio

- Có thể hỏi ngược lại nội dung tài liệu như hỏi ChatGPT

→ Phù hợp với ai thích học nhanh, đọc nhiều hoặc tóm tắt tài liệu

-------

5. Claude (Anthropic) → Viết code, tự chạy luôn trên máy ảo!

- Chỉ cần mô tả ứng dụng của bạn. Claude nghe, hiểu và tự làm

- Viết app, viết hàm, thậm chí chơi ga,me đơn giản

→ Dành cho người không biết code nhưng muốn build nhanh.

-------

6. OMI → AI ghi nhớ & tóm tắt mọi cuộc trò chuyện

- AI ghi lại nội dung các cuộc họp. Sau đó bạn có thể hỏi lại.

→ Tương lai của ghi chép – phù hợp với sales, founder, cố vấn, coach…

-------

7. Instantly + Apollo → Tự động g,ửi email chào h,àng + chốt lịch hẹn

- Xác định kh,ách hàng lý tưởng → AI viết và gửi email phù hợp

→ Tăng do,anh số, tiết kiệm nhân sự sale mạnh.

-------

8. Flux AI → Tạo ảnh người thật siêu thực, dùng cho thumbnail, banner, social

- Upload hình bạn → AI tạo ảnh bạn mặc gì cũng được, làm gì cũng được

- Chất lượng cao hơn Midjourney, dùng cho LinkedIn, Reels, bìa video…

→ Dành cho ai cần “ảnh đẹp nhưng lười chụp”.

-------

9. Perplexity → Google thế hệ mới dành cho người làm content

- Trả kết quả theo thời gian thực, kèm nguồn, rõ ràng hơn cả ChatGPT

→ Dùng để tìm insight, thông tin mới, update xu hướng hàng ngày.