Bạn đã bao giờ tranh luận với một bot của OpenAI và cảm thấy nó đặc biệt thuyết phục, hay thậm chí rất hiểu tâm lý con người chưa? Nếu có, thì điều đó hoàn toàn có lý do. OpenAI đã tiết lộ rằng để huấn luyện một số mô hình AI mạnh mẽ nhất thế giới, họ đơn giản là hướng chúng tới một subreddit được xây dựng hoàn toàn cho mục đích tranh luận và để thuật toán tự đào tạo.
Giao diện ChatGPT trên nền máy tính, biểu tượng cho sức mạnh AI của OpenAI
“Change My View” – Nguồn Dữ Liệu Vàng Cho Khả Năng Lập Luận Của AI
Theo báo cáo của TechCrunch, OpenAI đã công bố mô hình o3-mini hoàn toàn mới. Một phần trong thông báo này, OpenAI đã tiết lộ phương pháp độc đáo để huấn luyện khả năng lập luận của AI: họ cho phép mô hình của mình duyệt subreddit /r/changemyview để thu thập càng nhiều thông tin càng tốt.
Đối với những ai chưa biết, /r/changemyview là một subreddit dành riêng cho các cuộc tranh luận, nhưng với một quy tắc đặc biệt. Bất kỳ ai cũng có thể đăng một chủ đề để tranh luận, nhưng họ phải sẵn sàng lắng nghe và cởi mở với những lập luận từ người khác. Người đăng bài gốc được phép bảo vệ và tranh luận trong phần bình luận, nhưng nguyên tắc chính là họ phải sẵn sàng để quan điểm của mình bị phân tích một cách có tính xây dựng. Từ đó có tên gọi “Change My View” (Thay đổi quan điểm của tôi).
Mô hình ngôn ngữ lớn ChatGPT đang hoạt động trên máy tính xách tay chạy Windows 11, minh họa khả năng lập luận của AI
Hóa ra, nguồn dữ liệu này là một mỏ vàng đối với OpenAI. Sau khi cho AI tự do “nghiên cứu” các cuộc tranh luận, OpenAI sẽ cung cấp cho mô hình một chủ đề ví dụ và yêu cầu nó tạo ra các lập luận nhằm thuyết phục người đăng bài gốc thay đổi quan điểm của họ. Các phản hồi này không được đăng công khai, thay vào đó, chúng được hiển thị cho một nhóm người để đánh giá mức độ đáng tin cậy của từng lập luận. Những phản hồi chất lượng cao sau đó được sử dụng để tinh chỉnh và hoàn thiện các mô hình như ChatGPT.
Vậy đó, nếu bạn từng tranh luận trên /r/changemyview, rất có thể một mô hình AI đã sử dụng những lập luận của bạn để phát triển khả năng của chính nó. Điều này minh chứng cho sự linh hoạt và sáng tạo của OpenAI trong việc khai thác các nguồn dữ liệu thực tế để nâng cao trí tuệ nhân tạo.
Kết Luận
Việc OpenAI sử dụng một nền tảng tranh luận cộng đồng như “Change My View” để huấn luyện khả năng lập luận và thuyết phục của AI là một minh chứng rõ ràng cho cách tiếp cận đổi mới trong phát triển trí tuệ nhân tạo. Điều này không chỉ giúp các mô hình AI như ChatGPT trở nên thông minh và linh hoạt hơn trong giao tiếp mà còn mở ra những hướng đi mới trong việc tận dụng dữ liệu người dùng thực tế để cải thiện trải nghiệm và hiệu suất của AI. Bạn nghĩ sao về phương pháp huấn luyện này của OpenAI? Hãy chia sẻ suy nghĩ của bạn trong phần bình luận bên dưới nhé!