Collaborative Reasoner, còn được gọi là Coral, là một khuôn khổ được thiết kế để đánh giá và nâng cao khả năng suy luận hợp tác của các mô hình ngôn ngữ lớn (LLMs). Thay vì chỉ tập trung vào các nhiệm vụ đơn lẻ, Coral biến các bài toán truyền thống thành các nhiệm vụ đa tác nhân, đa lượt, nơi hai tác nhân phải không chỉ giải quyết vấn đề mà còn đạt được sự đồng thuận thông qua đối thoại tự nhiên. Những tương tác này phản ánh động lực xã hội thực tế, yêu cầu các tác nhân thách thức kết luận sai, đàm phán quan điểm mâu thuẫn và đi đến quyết định chung.
🧠 Tự cải thiện thông qua đối thoại tổng hợp
Một điểm nổi bật của Collaborative Reasoner là khả năng tự cải thiện của các tác nhân AI thông qua các cuộc đối thoại tổng hợp. Bằng cách sử dụng một công cụ mô phỏng hiệu suất cao có tên Matrix, các tác nhân AI có thể tạo ra dữ liệu tương tác quy mô lớn, cho phép chúng học hỏi và cải thiện hiệu suất trong các nhiệm vụ suy luận hợp tác. Phương pháp này đã dẫn đến cải thiện hiệu suất lên đến 29.4% so với phương pháp 'chain-of-thought' tiêu chuẩn của một LLM đơn lẻ.
🧪 Các lĩnh vực ứng dụng
Collaborative Reasoner được áp dụng trong nhiều lĩnh vực, bao gồm:
- Toán học (MATH): Đánh giá khả năng suy luận hợp tác trong các bài toán toán học phức tạp.
- Khoa học và giáo dục (MMLU-Pro, GPQA): Kiểm tra khả năng hợp tác trong việc giải quyết các câu hỏi trắc nghiệm về khoa học và giáo dục.
- Nhận thức xã hội (ExploreToM, Hi-ToM): Đánh giá khả năng hiểu và phản ứng với trạng thái tinh thần của người khác.
🔧 Mã nguồn mở và tài nguyên
Meta đã phát hành mã nguồn của Collaborative Reasoner trên GitHub, bao gồm các công cụ huấn luyện, tập dữ liệu và tài liệu hướng dẫn chi tiết. Điều này cho phép cộng đồng nghiên cứu và phát triển AI có thể tái tạo và mở rộng công trình này, thúc đẩy sự tiến bộ trong lĩnh vực AI hợp tác.
