Chuyển giao Trí tuệ nhân tạo vào thế giới thực (OpenAI) | Hai phút giấy #202


Chào các nhà học giả, đây là Two Minute Papers với Károly Zsolnai-Fehér. Trong loạt bài viết này, chúng tôi thường nói về các thuật toán AI khác nhau giải quyết các nhiệm vụ siêu khó. Thông thường, chúng được thử nghiệm trên một môi trường mô phỏng trong chương trình mô phỏng.

Tuy nhiên, điều này thường để lại câu hỏi rằng liệu các thuật toán này có thực sự hoạt động trong môi trường thực tế không. Và vấn đề đó đã được giải quyết bởi OpenAI với công việc được gọi là domain randomization, được huấn luyện bằng cách sử dụng mô phỏng máy tính tương đối thô để có thể chuyển sang thế giới thực.

Vấn đề được sử dụng để chứng minh điều này là xác định vị trí và nắm bắt các đối tượng. Lưu ý rằng thuật toán này chưa bao giờ nhìn thấy bất kỳ hình ảnh nào và được huấn luyện bằng dữ liệu mô phỏng. Nó chỉ chơi một trò chơi trên máy tính.

Vậy tại sao thuật ngữ domain randomization lại liên quan đến việc chuyển tri thức mô phỏng thành thực tế? Quan sát chính là việc sử dụng dữ liệu huấn luyện mô phỏng là được chấp nhận, nhưng chúng ta phải đảm bảo rằng AI được tiếp xúc với một bộ sưu tập đa dạng các trường hợp để thu được kiến thức tổng quát hợp lý.

Trong các thí nghiệm này, các tham số sau được phân loại ngẫu nhiên: số lượng hình dạng và đối tượng gây phiền nhiễu trên bàn, vị trí và cấu trúc chất liệu của các vật, bàn và môi trường, số lượng đèn, thuộc tính chất liệu, và thuật toán thậm chí còn tiếp xúc với một số nhiễu ngẫu nhiên trong hình ảnh.

Và có vẻ như nếu ta làm điều đó đúng cách, đặt niềm tin vào kiến thức chỉ dẫn của chỉ vài ngàn hình ảnh, khi thuật toán được tải lên cánh tay robot thực tế, nó trở nên có khả năng nắm bắt các đối tượng đúng được yêu cầu. Trong trường hợp này, mục tiêu là phát hiện thư rác. Rất thú vị.

Tôi nghĩ phần thú vị là nó thậm chí không sử dụng phần mềm mô phỏng chụp hình thực tế và mô phỏng ánh sáng – các chương trình này có thể tạo ra những hình ảnh chất lượng cao giống với thế giới thực xung quanh chúng ta, và rõ ràng rằng chúng sẽ hữu ích để huấn luyện các thuật toán như vậy.

Tuy nhiên, điều này chỉ sử dụng dữ liệu rất thô và kiến thức của AI vẫn được tổng quát hóa đến thế giới thực. Giỏi thế! Cám ơn vì đã xem và ủng hộ chúng tôi, chúc gặp lại trong các bài viết tiếp theo!