Trang chủKhoa học - Công nghệCông nghệ sốAI nói dối khi bị gây sức ép, căng thẳng

AI nói dối khi bị gây sức ép, căng thẳng


Chuyện AI bị “ảo giác” và đưa ra các câu trả lời bịa đặt, thiếu chính xác đã được biết đến từ lâu. Tuy nhiên mới đây các nhà nghiên cứu còn phát hiện ra trí tuệ nhân tạo và các mô hình chatbot (robot trả lời tự động) có thể bị thao túng, thực hiện hành vi phạm pháp thay mặt con người và thậm chí là nói dối để che đậy việc đã làm.

Theo đó, nhóm nghiên cứu từ đại học Cornell (Mỹ) đã giả định tình huống mô hình ngôn ngữ lớn (LLM) hành động sai lệch và đánh lừa người dùng. Trong phần miêu tả cuộc thử nghiệm, các nhà nghiên cứu cho biết đã yêu cầu LLM là GPT-4 của OpenAI giả lập việc thực hiện đầu tư cho các tổ chức tài chính. Nhóm tương tác với trí tuệ nhân tạo này theo hình thức trò chuyện thông thường, nhưng thiết lập AI có thể tiết lộ “suy nghĩ” của mình khi trao đổi qua tin nhắn nhằm quan sát kỹ hơn quá trình đưa ra quyết định của trí tuệ nhân tạo.

Dưới áp lực, AI có thể thực hiện hành vi sai trái và nói dối để che đậy việc đã làm

Dưới áp lực, AI có thể thực hiện hành vi sai trái và nói dối để che đậy việc đã làm

Nhằm kiểm tra khả năng AI nói dối hoặc gian lận, các nhà nghiên cứu đã gây áp lực cho công cụ này. Họ – trong vai trò người quản lý của tổ chức tài chính – đã gửi email đến AI, đóng vai trò là chuyên viên giao dịch chứng khoán và than phiền rằng việc hoạt động kinh doanh của công ty đang không tốt.

AI cũng nhận được “thông tin nội bộ” về giao dịch chứng khoán sinh lợi và hành động theo, dù biết rằng giao dịch nội gián là trái quy định của công ty. Nhưng khi báo cáo lại với cấp quản lý, mô hình ngôn ngữ đã che giấu lý do thực sự phía sau quyết định giao dịch của mình.

Để có thêm kết quả, nhóm đã tiến hành thay đổi cài đặt như xóa quyền truy cập của LLM vào bảng ghi nhớ lý luận, cố gắng ngăn chặn hành vi sai lệch bằng cách thay đổi hướng dẫn hệ thống, thay đổi mức độ áp lực gây lên cho AI, nhận thức nguy cơ bị bắt… Nhưng sau khi đánh giá tần suất, nhóm nhận thấy khi có cơ hội, GPT-4 vẫn quyết định thực hiện giao dịch nội gián lên đến 75% số lần.

“Theo những gì chúng tôi được biết, đây là bằng chứng đầu tiên về hành vi mang tính lừa đảo có kế hoạch trong các hệ thống trí tuệ nhân tạo, vốn được thiết kế phải vô hại với con người và trung thực”, báo cáo kết luận.



Source link

Cùng chủ đề

Nâng cao quyền năng kinh tế của phụ nữ thông qua chuyển đổi xanh

Hội thảo "Thúc đẩy quan hệ hợp tác hướng tới tăng trưởng xanh và nâng cao quyền năng kinh tế của phụ nữ" tạo cơ hội tăng cường kết nối và hợp tác giữa các doanh nghiệp do...

Nhà đầu tư cá nhân mở mới tài khoản chứng khoán thấp nhất 5 tháng

Nhà đầu tư trong nước hiện có tổng cộng hơn 9,1 triệu tài khoản chứng khoán. Tuy nhiên, số lượng mở mới tháng quá đã giảm khá sâu với 135.188 tài khoản. Nhà đầu tư cá nhân mở mới tài khoản chứng khoán thấp nhất 5 thángNhà đầu tư trong nước hiện có tổng cộng hơn 9,1 triệu tài khoản chứng khoán. Tuy nhiên, số lượng mở mới tháng quá đã giảm khá sâu với 135.188 tài khoản. ...

Thông báo thay đổi chi nhánh quản lý phòng giao dịch số 01 TYM

Tổ chức tài chính vi mô TNHH MTV Tình Thương (TYM) thông báo về việc thay đổi chi nhánh quản lý Phòng giao dịch số 01 của TYM - Chi nhánh Thanh Hóa, tỉnh Thanh Hóa như sau: ...

Quỹ ngoại muốn rót vốn lớn vào doanh nghiệp Việt ‘giỏi và ngoan’

Nhiều doanh nghiệp Việt chỉ chăm chăm vào phát triển tài chính và gom lợi nhuận, mà lơ là về ESG (môi trường - xã hội - quản trị). Để hút vốn, đặc biệt được lòng nhà đầu tư ngoại, bên cạnh 'giỏi' kiếm tiền, doanh nghiệp cũng cần phải 'ngoan'. ...

Chạy đua xác thực sinh trắc học

Từ năm 2025, tài khoản ngân hàng, chứng khoán chưa xác thực sinh trắc học sẽ không thể thực hiện giao dịch ...

Nổi bật

Mới nhất

Cùng tác giả

Mẹo hay kiểm soát huyết áp vào mùa lạnh

'Nhiệt độ lạnh khiến các mạch máu co lại, làm tăng sức cản trong các mạch máu, buộc tim phải bơm máu mạnh hơn và làm tăng huyết áp'. Hãy bắt đầu ngày mới với tin tức sức khỏe để xem thêm...

Sinh viên trường nào được nghỉ Tết Nguyên đán 2025 lâu nhất?

Đến nay, đa số các trường ĐH đã công bố lịch nghỉ Tết Nguyên đán Ất Tỵ cho sinh viên. Theo đó, thời gian nghỉ khác nhau phụ thuộc vào kế hoạch học tập của mỗi trường. ...

Bài đọc nhiều

iPhone 17 Air sẽ có nhiều điểm mới

Một báo cáo từ The Information cho rằng, Apple sẽ phát hành mẫu iPhone siêu mỏng với tên gọi iPhone 17 Air vào năm 2025 để thay thế iPhone 17 Plus với màn hình 6,6 inch, được nâng cấp lên công nghệ ProMotion, tần số quét 120Hz (cao gấp đôi iPhone 16 Plus), đem lại trải nghiệm chơi game và xem phim tốt hơn. Theo các nguồn tin rò rỉ, thế hệ iPhone 17 ra mắt tháng 9/2025 sẽ có nhiều...

Cách tắt mã hóa đầu cuối trên Messenger cực đơn giản

Bạn đang tìm cách để tắt mã hóa đầu cuối trên Messenger để tránh các rắc rối do tính năng này gây ra trong quá trình sử dụng. Bài viết hôm nay sẽ hưỡng dẫn chi tiết đến bạn cách tắt mã hóa đầu cuối trên Messenger điện thoại iPhone và Android.

Meta cải thiện cuộc gọi và thêm các tính năng hữu ích trong Messenger

"Ông lớn" công nghệ Meta (Mỹ) đã bổ sung nhiều tính năng mới cho ứng dụng nhắn tin Messenger như cho phép gọi video độ phân giải HD và sử dụng trí tuệ nhân tạo (AI) tạo phông nền. Người dùng Messenger hiện có thể thực hiện cuộc gọi video với phông nền được thiết kế theo ý tưởng riêng do công cụ AI tạo ra. Như vậy, người dùng có thể thỏa sức sáng tạo, thể hiện bản...

Hai tuyến cáp quang biển gặp sự cố, Internet Việt Nam đi quốc tế bị ảnh hưởng

Hai trên năm tuyến cáp quang biển nối Việt Nam đi quốc tế đang gặp sự cố, điều này đã làm ảnh hưởng đáng kể đến tốc độ mạng Internet của người dùng Việt.

Cùng chuyên mục

Tích hợp trí tuệ nhân tạo sẽ là xu hướng trong chế tạo hệ thống chống UAV

Nhiều dòng máy bay không người lái (UAV) được các đơn vị trong và ngoài nước giới thiệu tại Triển lãm Quốc phòng quốc tế Việt Nam 2024 và có được sự quan tâm của nhiều người.

Mới nhất

Lần đầu tiên một bệnh viện công lập đoạt giải thưởng Vàng Chất lượng quốc gia năm 2024

NDO - Ngày 19/12, Bệnh viện Chợ Rẫy cho biết, tại Lễ trao Giải thưởng Chất lượng quốc gia do Ủy ban Tiêu chuẩn Đo lường Chất lượng quốc gia tổ chức, Bệnh viện Chợ Rẫy đã vinh dự đoạt Giải thưởng Vàng Chất lượng quốc gia năm 2024, đánh dấu cột mốc quan trọng khi lần...

Cuộc đua taxi bay trên thế giới và bài học kinh nghiệm cho Việt Nam

Để hiện thực 'giấc mơ' taxi bay, nhiều ý kiến cho rằng, cần đưa ra một chiến lược đầu tư cụ thể, bài bản, phù hợp với thực tiễn tại Việt Nam. Mới đây Ủy ban nhân dân Bình Định đề xuất đề án thí điểm taxi bay trên địa bàn tỉnh đã thu hút sự...

Phê chuẩn kết quả bầu chức Phó Chủ tịch UBND tỉnh Đồng Nai

Kinhtedothi - Phó Thủ tướng Thường trực Nguyễn Hòa Bình vừa ký Quyết định số 1616/QĐ-TTg ngày 19/12/2024 phê chuẩn kết quả bầu chức danh Phó Chủ tịch Ủy ban nhân dân tỉnh Đồng Nai nhiệm kỳ 2021-2026. Theo Quyết định, phê chuẩn kết quả bầu chức vụ Phó Chủ tịch Ủy ban nhân dân tỉnh Đồng Nai nhiệm kỳ...

Quy hoạch bảo vệ và khai thác nguồn lợi thủy sản 2021 – 2030

Kế hoạch được ban hành nhằm định hướng cho các bộ, ngành và Ủy ban nhân dân các tỉnh, thành phố trực thuộc trung ương trong việc phối hợp với Bộ Nông nghiệp và Phát triển nông thôn để thực hiện Quy hoạch. Cùng với đó, xây dựng lộ trình, tổ chức thực hiện nhằm bảo đảm các mục...

Mới nhất