Microsoft Copilot, dù ban đầu có nhiều hứa hẹn với khả năng tích hợp sâu vào Windows, dường như đã dần mất đi tiềm năng ban đầu và trở thành một trợ lý AI thông thường. Ý tưởng điều khiển máy tính bằng AI, truy cập cài đặt và ứng dụng mà không cần thao tác thủ công, là một bước tiến lớn. Tuy nhiên, thay vì phát triển mạnh mẽ tính năng này, Microsoft lại biến Copilot thành một chatbot quen thuộc. May mắn thay, Windows-MCP, một công cụ của bên thứ ba, đã xuất hiện để lấp đầy khoảng trống này, mang đến những tính năng AI điều khiển PC mà Copilot (và sau này là Copilot+) lẽ ra phải có. Dựa trên các mô hình ngôn ngữ lớn (LLM) như Claude của Anthropic, Windows-MCP cho phép bạn kiểm soát máy tính theo nhiều cách khác nhau, từ mở ứng dụng, truy cập trang web cho đến thay đổi cài đặt và thậm chí cài đặt phần mềm.
Quá Trình Cài Đặt Windows-MCP: Không Dễ Dàng Như Bạn Nghĩ
Chuẩn Bị Kỹ Lưỡng Để Bắt Đầu
Ngay từ đầu, quá trình cài đặt Windows-MCP khá phức tạp, đòi hỏi người dùng phải có một chút kiến thức kỹ thuật và sự kiên nhẫn. Dự án GitHub của công cụ này liệt kê một số yêu cầu cơ bản, bao gồm Python 3.13 trở lên (phiên bản mới nhất tại thời điểm viết bài), ứng dụng Claude desktop của Anthropic, trình quản lý gói UV cho Python và công cụ Desktop Extension CLI của Anthropic.
Tuy nhiên, có một vài yêu cầu khác mà tài liệu gốc chưa đề cập. Bạn sẽ cần cài đặt Node.js, tốt nhất là có NVM (Node Version Manager) để quản lý các phiên bản Node.js, nhằm cài đặt công cụ Desktop Extension. Việc tạo extension cũng yêu cầu bạn clone repository GitHub của Windows-MCP bằng lệnh Git, do đó, việc cài đặt Git là cần thiết. Tất nhiên, bạn cũng có thể tải xuống kho lưu trữ và giải nén thủ công, nhưng nếu bạn tuân theo các bước khuyến nghị, bạn sẽ cần những công cụ này. Quá trình thiết lập tốn khá nhiều thời gian, nhưng nếu bạn tuân thủ tất cả các bước một cách chính xác, mọi thứ sẽ diễn ra ổn thỏa. Sau khi hoàn tất cài đặt các thành phần cần thiết, bạn cần tạo tiện ích mở rộng Windows-MCP cho Claude và sau đó tải nó vào ứng dụng Claude desktop. Đến lúc này, bạn đã sẵn sàng để sử dụng.
Ảnh chụp màn hình các cửa sổ đang mở trên Windows 11 hiển thị các yêu cầu cài đặt Windows-MCP
Điều Khiển PC Bằng Lệnh Văn Bản: Tiềm Năng Bị Copilot Bỏ Lỡ
Khả Năng Vượt Trội So Với Trợ Lý AI Thông Thường
Sau khi trải qua quá trình thiết lập khá mất sức, bạn có thể sử dụng Claude để điều khiển PC của mình thông qua các lệnh văn bản. Quá trình này diễn ra khá minh bạch: khi bạn đưa ra một lệnh, bạn có thể thấy mọi hành động mà Claude đang thực hiện để đạt được kết quả mong muốn. Đó có thể là kiểm tra trạng thái hiện tại của máy, khởi chạy một ứng dụng, nhấp vào một nút hay nhập văn bản.
Để đảm bảo an toàn, Claude yêu cầu quyền của bạn để thực hiện từng loại hành động khác nhau. Mặc dù việc phản hồi các lời nhắc cấp quyền đôi khi có thể làm gián đoạn luồng công việc, nhưng bạn có thể chọn luôn cho phép các hành động để trải nghiệm mượt mà hơn. Đây chính là tính năng mà Microsoft lẽ ra nên phát triển mạnh mẽ cho Copilot. Thay vì chỉ là một chatbot, Copilot có thể trở thành một trợ lý thực thụ, giúp tự động hóa và tương tác sâu với hệ điều hành, mang lại trải nghiệm điều khiển PC bằng AI toàn diện.
Ảnh chụp màn hình Claude trên Windows 11 yêu cầu quyền thực hiện một hành động cụ thể
Trải Nghiệm Thực Tế: Mở Ứng Dụng, Duyệt Web và Hơn Thế Nữa
Dù đang sử dụng gói miễn phí của Claude với số lượng tương tác hạn chế, tôi đã có cơ hội thử nghiệm Windows-MCP một vài lần. Tôi đã yêu cầu nó mở và đóng trình duyệt, bao gồm Vivaldi và Edge, mở ứng dụng Calculator và thậm chí truy cập các trang web cụ thể. Ví dụ, khi tôi yêu cầu mở XDA trong Vivaldi, tôi có thể theo dõi toàn bộ quá trình: Claude mở trình duyệt, chọn thanh địa chỉ và nhập URL. Claude thậm chí còn cung cấp một bản tóm tắt nhanh về nội dung trên trang.
Vì Windows-MCP dựa vào một mô hình ngôn ngữ lớn (LLM), bạn có thể làm được nhiều điều hơn thông qua các tương tác ngôn ngữ tự nhiên, đặc biệt là với các lệnh phức tạp hơn. Với khả năng này, nó thực sự mang lại một cái nhìn thoáng qua về tiềm năng của AI trong việc tự động hóa và điều khiển máy tính, vượt xa vai trò của một trợ lý AI thông thường.
Liệu Windows-MCP Có Thực Sự Đáng Giá?
Hiệu Suất Và Hạn Chế Đáng Kể
Mặc dù ý tưởng của Windows-MCP rất thú vị, nhưng tôi tự hỏi liệu công cụ này có thực sự hữu ích cho đa số người dùng hay không. Các phản hồi của Claude và việc thực hiện từng bước trong một quy trình tốn thời gian hơn đáng kể so với việc bạn tự làm. Điều này có thể được mong đợi ở một mức độ nào đó, nhưng sự chênh lệch về thời gian là khá lớn. Tôi đã phải ngồi và nhìn chằm chằm vào màn hình trong nhiều phút khi Claude tìm cách mở Vivaldi, sau đó nhập URL XDA vào thanh địa chỉ. Suốt khoảng thời gian đó, tôi thực sự ước mình có thể tự làm cho nhanh.
Tôi có thể thấy công cụ này hữu ích cho những tác vụ mà bạn có thể không biết cách thực hiện, chẳng hạn như thay đổi độ phân giải màn hình hoặc tắt thông báo. Tuy nhiên, ngoài những trường hợp cụ thể này, tiện ích của nó còn khá hạn chế.
Những Lỗi Gặp Phải Trong Quá Trình Trải Nghiệm
Thêm vào đó, trải nghiệm sử dụng Windows-MCP vẫn còn khá nhiều lỗi. Tôi đã gặp một số vấn đề trong quá trình sử dụng, điển hình là khi nó mở Vivaldi, nó hoàn toàn bỏ qua tất cả dữ liệu người dùng mà tôi đã có sẵn trong trình duyệt. Hồ sơ người dùng, tài khoản email, cài đặt, lịch sử – mọi thứ đều biến mất. Tôi đã thử tìm hiểu xem liệu nó có cài đặt một phiên bản Vivaldi riêng biệt hay không, nhưng dường như không phải vậy, và chúng đang chạy từ cùng một thư mục. Tôi thực sự không biết làm thế nào điều này có thể xảy ra.
Có một lần, tôi cũng đã thử yêu cầu Claude mở XDA trong Vivaldi hai lần liên tiếp. Tôi đã đóng trình duyệt sau lệnh đầu tiên. Tuy nhiên, khi tôi đưa ra lệnh thứ hai, Claude vẫn cho rằng Vivaldi đang mở và cố gắng tương tác với nó. May mắn thay, nó cuối cùng cũng nhận ra trình duyệt không có ở đó và lặp lại các bước. Giữa sự chậm chạp của trải nghiệm và các lỗi đôi khi xảy ra, tôi thấy rằng đây chưa phải là một trải nghiệm thực sự đáng giá. Với gói Claude trả phí, ít nhất bạn sẽ có các tương tác không giới hạn và có thể sử dụng nó mượt mà hơn, nhưng ngay cả khi đó, tôi không nghĩ đây sẽ là một trải nghiệm tuyệt vời, và chắc chắn không phải là thứ tôi sẵn sàng trả tiền hàng tháng.
Ảnh chụp màn hình Claude cạnh hai cửa sổ Vivaldi hiển thị hồ sơ người dùng hoàn toàn riêng biệt do lỗi của Windows-MCP
Bài Học Cho Microsoft Copilot
Mặc dù trải nghiệm sử dụng Windows-MCP chưa thực sự làm hài lòng, tôi vẫn thấy nó hấp dẫn hơn nhiều so với Copilot hiện tại của Microsoft. Nếu có điều gì, thì đây là một bài học cho Microsoft, cho thấy những gì có thể và nên được thực hiện với Copilot. Một trải nghiệm như thế này, được tích hợp sâu hơn vào hệ điều hành và tối ưu hóa để có hiệu suất nhanh hơn, sẽ vô cùng hợp lý. Nhưng thay vào đó, chúng ta lại mắc kẹt với một chatbot được cường điệu hóa, chỉ có thể tìm kiếm trên web và tạo ra những hình ảnh vô hồn.
Tôi thực sự hy vọng Windows-MCP có thể tiếp tục cải thiện và trở thành một công cụ hữu ích hơn theo thời gian. Ở thời điểm hiện tại, tôi chưa quan tâm đến việc sử dụng nó, nhưng ít nhất thì khái niệm mà nó mang lại thú vị hơn hầu hết những gì Copilot+ có thể làm bây giờ.