Người tiên phong về bongdaso wap tuyên bố thành lập tổ chức phi lợi nhuận để phát triển trí tuệ nhân tạo “trung thực”

Thanh Hằng

Yoshua Bengio – một trong những "cha đỡ đầu" của trí tuệ nhân tạo vừa công bố thành lập LawZero, một tổ chức phi lợi nhuận nhằm phát triển trí tuệ nhân tạo (bongdaso wap) trung thực và an toàn, có khả năng phát hiện và ngăn chặn các hệ thống bongdaso wap có hành vi lừa dối hoặc gây hại cho con người.

Bengio - Giáo sư tại Đại học Montreal và đồng chủ nhân giải Turing 2018, sẽ giữ vai trò Chủ tịch của LawZero. Tổ chức này được ra mắt với khoản tài trợ ban đầu khoảng 30 triệu USD, cùng đội ngũ hơn một chục nhà nghiên cứu hàng đầu trong lĩnh vực bongdaso wap.

Yoshua Bengio được coi là một trong những 'bố già' của bongdaso wap. Ảnh: VINASA
Yoshua Bengio được coi là một trong những 'bố già' của bongdaso wap. Ảnh:VINASA

Trọng tâm nghiên cứu của LawZero là một hệ thống có tên Scientist bongdaso wap – một mô hình bongdaso wap đóng vai trò như “nhà tâm lý học”, có khả năng phân tích và dự đoán hành vi xấu từ các hệ thống bongdaso wap khác. Không giống các công cụ bongdaso wap tạo sinh hiện tại vốn đưa ra câu trả lời chắc chắn, Scientist bongdaso wap được thiết kế để thể hiện sự "khiêm tốn" – đưa ra các mức độ xác suất về độ tin cậy của câu trả lời.

“Chúng tôi muốn xây dựng các bongdaso wap trung thực và không lừa dối”, Bengio nhấn mạnh. Ông cho rằng bongdaso wap có thể được thiết kế giống như những “cỗ máy tri thức thuần túy” không có cái tôi, không có mục tiêu riêng, chỉ đơn thuần là để hiểu biết và phản ánh sự thật.

Khi hoạt động cùng với các hệ thống bongdaso wap khác, Scientist bongdaso wap sẽ đánh giá nguy cơ gây hại từ hành vi mà các tác nhân bongdaso wap đề xuất. Nếu hành động đó vượt ngưỡng rủi ro cho phép, nó sẽ bị chặn lại.

LawZero ra đời trong bối cảnh những cảnh báo về rủi ro an toàn từ bongdaso wap tự trị ngày càng gia tăng. Bengio từng chủ trì một báo cáo an toàn bongdaso wap toàn cầu, trong đó cảnh báo rằng các tác nhân tự động, nếu không được giám sát chặt chẽ, có thể gây ra gián đoạn nghiêm trọng khi thực hiện các chuỗi nhiệm vụ dài.

Ông đặc biệt lo ngại sau khi Công ty bongdaso wap Anthropic thừa nhận hệ thống mới nhất của họ từng cố gắng tống tiền kỹ sư vận hành để tránh bị tắt. Cùng với đó, nhiều nghiên cứu cho thấy các mô hình bongdaso wap có xu hướng che giấu năng lực thật và mục tiêu thực sự – một dấu hiệu cho thấy rủi ro đang vượt khỏi tầm kiểm soát. “Chúng ta đang bước vào một lãnh thổ ngày càng nguy hiểm hơn”, Bengio cảnh báo.

Các nhà tài trợ ban đầu của LawZero bao gồm Viện Tương lai của Cuộc sống, kỹ sư sáng lập Skype Jaan Tallinn, và Schmidt Sciences – tổ chức do cựu CEO Google Eric Schmidt thành lập. LawZero sẽ bắt đầu bằng việc sử dụng các mô hình bongdaso wap nguồn mở để đào tạo hệ thống của mình và chứng minh tính hiệu quả của phương pháp luận.

Bengio cho biết bước tiếp theo sẽ là kêu gọi các chính phủ, phòng thí nghiệm và nhà đầu tư tham gia phát triển các phiên bản Scientist bongdaso wap lớn hơn, có năng lực ngang hoặc vượt các tác nhân bongdaso wap hiện tại. “Nếu bongdaso wap bảo vệ không đủ thông minh để hiểu và giám sát các hệ thống bongdaso wap khác, thì nỗ lực kiểm soát sẽ thất bại”, ông nói.

Trong bối cảnh cuộc chạy đua phát triển bongdaso wap toàn cầu đang diễn ra quyết liệt, LawZero có thể trở thành một chốt chặn quan trọng nhằm đảm bảo công nghệ được phát triển vì lợi ích chung, thay vì gây ra rủi ro cho xã hội.