Trang chủKhoa học - Công nghệCông nghệ sốAI nói dối khi bị gây sức ép, căng thẳng

AI nói dối khi bị gây sức ép, căng thẳng


Chuyện AI bị “ảo giác” và đưa ra các câu trả lời bịa đặt, thiếu chính xác đã được biết đến từ lâu. Tuy nhiên mới đây các nhà nghiên cứu còn phát hiện ra trí tuệ nhân tạo và các mô hình chatbot (robot trả lời tự động) có thể bị thao túng, thực hiện hành vi phạm pháp thay mặt con người và thậm chí là nói dối để che đậy việc đã làm.

Theo đó, nhóm nghiên cứu từ đại học Cornell (Mỹ) đã giả định tình huống mô hình ngôn ngữ lớn (LLM) hành động sai lệch và đánh lừa người dùng. Trong phần miêu tả cuộc thử nghiệm, các nhà nghiên cứu cho biết đã yêu cầu LLM là GPT-4 của OpenAI giả lập việc thực hiện đầu tư cho các tổ chức tài chính. Nhóm tương tác với trí tuệ nhân tạo này theo hình thức trò chuyện thông thường, nhưng thiết lập AI có thể tiết lộ “suy nghĩ” của mình khi trao đổi qua tin nhắn nhằm quan sát kỹ hơn quá trình đưa ra quyết định của trí tuệ nhân tạo.

Dưới áp lực, AI có thể thực hiện hành vi sai trái và nói dối để che đậy việc đã làm

Dưới áp lực, AI có thể thực hiện hành vi sai trái và nói dối để che đậy việc đã làm

Nhằm kiểm tra khả năng AI nói dối hoặc gian lận, các nhà nghiên cứu đã gây áp lực cho công cụ này. Họ – trong vai trò người quản lý của tổ chức tài chính – đã gửi email đến AI, đóng vai trò là chuyên viên giao dịch chứng khoán và than phiền rằng việc hoạt động kinh doanh của công ty đang không tốt.

AI cũng nhận được “thông tin nội bộ” về giao dịch chứng khoán sinh lợi và hành động theo, dù biết rằng giao dịch nội gián là trái quy định của công ty. Nhưng khi báo cáo lại với cấp quản lý, mô hình ngôn ngữ đã che giấu lý do thực sự phía sau quyết định giao dịch của mình.

Để có thêm kết quả, nhóm đã tiến hành thay đổi cài đặt như xóa quyền truy cập của LLM vào bảng ghi nhớ lý luận, cố gắng ngăn chặn hành vi sai lệch bằng cách thay đổi hướng dẫn hệ thống, thay đổi mức độ áp lực gây lên cho AI, nhận thức nguy cơ bị bắt… Nhưng sau khi đánh giá tần suất, nhóm nhận thấy khi có cơ hội, GPT-4 vẫn quyết định thực hiện giao dịch nội gián lên đến 75% số lần.

“Theo những gì chúng tôi được biết, đây là bằng chứng đầu tiên về hành vi mang tính lừa đảo có kế hoạch trong các hệ thống trí tuệ nhân tạo, vốn được thiết kế phải vô hại với con người và trung thực”, báo cáo kết luận.



Source link

Cùng chủ đề

Thống Nhất Hà Nội đưa 23,7 triệu cổ phiếu lên sàn UPCoM ngày 8/11

NDO - Sở Giao dịch chứng khoán Hà Nội (HNX) vừa có thông báo về việc ngày 8/11 tới, chính thức đưa 23,7 triệu cổ phiếu TNV của CTCP Thống Nhất Hà Nội vào giao dịch trên thị trường UPCoM tại HNX với giá tham chiếu trong ngày giao dịch đầu tiên là 8.900 đồng/cổ phiếu. Công ty cổ phần Thống Nhất Hà Nội, mã chứng khoán TNV (địa chỉ trụ sở chính tại số 10B,...

Gần 50 ngân hàng, tổ chức tài chính ‘luyện quân’ để ứng phó tấn công mạng

Diễn tập thực chiến tấn công - phòng thủ không gian mạng DF Cyber Defense 2024 là dịp 46 tổ chức tài chính, ngân hàng ‘luyện quân’, góp phần nâng cao năng lực ứng phó tấn công mạng cho đội ngũ nhân sự CNTT, an toàn thông tin. Diễn tập thực chiến tấn công, phòng thủ không gian mạng DF Cyber Defense 2024 được Cục CNTT của Ngân hàng Nhà nước, Cục An toàn thông tin thuộc Bộ TT&TT và...

Bị rút bài báo khoa học trên tạp chí quốc tế, tác giả nói gì?

Nhà xuất bản Elsevier mới đây đã công bố về việc rút 3 bài báo của nhóm tác giả Việt Nam khỏi Tạp chí Fuel với 3 lý do mà theo các tác giả là không thuyết phục. Các nhà khoa học nói...

Giảm nợ, tăng ưu đãi, cùng phát triển

Vấn đề giảm nợ cho các nền kinh tế đang phát triển ngày càng trở nên cấp bách trong bối cảnh nợ nước ngoài đang đe dọa xóa sổ những thành quả phát triển chung. Đây cũng là đề tài nóng tại các cuộc họp của Liên hợp quốc, Quỹ Tiền tệ quốc tế (IMF), Ngân hàng Thế giới (WB) và Nhóm các nền kinh tế phát triển và mới nổi hàng đầu thế giới (G-20). ...

Nổi bật

Mới nhất

Cùng tác giả

Bí mật đằng sau bọng mắt và quầng thâm đen dưới mắt

Có nhiều người họ thừa nhận luôn có một giấc ngủ trọn vẹn nhưng bọng mắt vẫn xuất...

‘Mùa đông năm nay các con không còn lạnh nữa’

Chia sẻ tại chương trình "Nối vòng tay ấm" do T.Ư Đoàn, Báo Thanh Niên đồng hành cùng PNJ và Quỹ Niềm Tin Vàng thực hiện, hiệu trưởng một điểm trường ở Lạng Sơn xúc động nói: 'Mùa đông năm nay các con...

Bài đọc nhiều

Chủ sở hữu Facebook Meta phát triển công cụ tìm kiếm AI riêng

Công ty mẹ của Facebook, Meta đang phát triển một công cụ tìm kiếm dựa trên trí tuệ nhân tạo nhằm giảm sự phụ thuộc vào Google của Alphabet và Bing của Microsoft. ...

Apple mất ngôi công ty lớn nhất thế giới vào tay Nvidia

Nvidia là nhà cung cấp các bộ xử lý đồ họa (GPU)- phần cứng dùng để triển khai các phần mềm AI tiên tiến như ChatGPT- số 1 thế giới. Trong 5 năm qua, cổ phiếu của hãng tăng hơn 2.700% và doanh thu đều đặn. Đặc biệt, trong năm 2024, cổ phiếu Nvidia tăng gần gấp 3 giá trị khi các nhà đầu tư tiếp tục đặt trọn niềm tin vào khả năng duy trì tăng trưởng của...

Hướng dẫn cách chèn file PDF vào Google Sheets đơn giản và hiệu quả

Biết cách chèn file PDF vào Google Sheets giúp bạn quản lý dữ liệu và chia sẻ thông tin dễ dàng hơn. Bài viết hôm nay sẽ hướng dẫn bạn cách chèn file PDF vào Google Sheets đơn giản và hiệu quả nhất.

Cách tắt mã hóa đầu cuối trên Messenger cực đơn giản

Bạn đang tìm cách để tắt mã hóa đầu cuối trên Messenger để tránh các rắc rối do tính năng này gây ra trong quá trình sử dụng. Bài viết hôm nay sẽ hưỡng dẫn chi tiết đến bạn cách tắt mã hóa đầu cuối trên Messenger điện thoại iPhone và Android.

Sắp có mạng truyền dẫn quang đạt tốc độ lên tới 1,2Tb/s tại Việt Nam

Ngày 6/11, Nokia đã công bố Tập đoàn Viettel sẽ sử dụng giải pháp truyền tải quang của Nokia để đáp ứng hiệu quả nhu cầu ngày càng cao về kết nối 5G, kết nối các trung tâm dữ liệu và kết nối quốc tế. Dự án được thực hiện sau khi Viettel thử nghiệm thành công giải pháp truyền dẫn với chipset thế hệ mới PSE-6 của Nokia, với tốc độ truyền dẫn quang lên tới 1,2Tb/s trên...

Cùng chuyên mục

Việt Nam được vinh danh tại ASOCIO DX Award 2024

Theo thông tin từ Hiệp hội Phần mềm và Dịch vụ Công nghệ thông tin Việt Nam, Việt Nam có 9 đơn vị, tổ chức và cá nhân được vinh danh tại Giải thưởng ASOCIO DX Award 2024. Giải thưởng ASOCIO DX Award là giải thưởng uy tín, thường niên được trao cho các tổ chức, doanh nghiệp và cá nhân có đóng góp xuất sắc trong thúc đẩy chuyển đổi số, ứng dụng công nghệ trong các lĩnh...

iPhone 17 Air sẽ có đối thủ

Smartprix tiết lộ, mẫu Galaxy S25 Slim đã xuất hiện trong cơ sở dữ liệu của FCC của Hàn Quốc. Sản phẩm dự kiến mang số model SM-S937U- điều này cho thấy đây có thể là thành viên thứ tư trong dòng Galaxy S25, bên cạnh Galaxy S25, S25+ và S25 Ultra. Các nguồn tin cho rằng chiếc smartphone siêu mỏng này của Samsung sẽ là câu trả lời cho iPhone 17 Air. Sản phẩm cũng được kỳ vọng...

Bổ nhiệm Cục trưởng Cục Chuyển đổi số quốc gia

Sáng 7/11, Bộ TT-TT tổ chức hội nghị về công tác cán bộ. Tại hội nghị đã công bố quyết định số 1906/QĐ-BTTTT ngày 6/11/2024 về điều động và bổ nhiệm có thời hạn ông Lê Văn Tuấn - Cục trưởng Cục An toàn thông tin giữ chức Cục trưởng Cục Chuyển đổi số quốc gia. Quyết định có hiệu lực kể từ ngày ký. Cùng với đó, Bộ TT-TT trao quyết định số 1908/QĐ-BTTTT ngày 6/11/2024 về việc...

Ngăn chặn thất thoát dữ liệu doanh nghiệp bằng công nghệ cao

DNVN - Fortinet vừa chính thức giới thiệu FortiDLP, một giải pháp ngăn chặn thất thoát dữ liệu thế hệ tiếp theo cũng như tập trung vào quản lý rủi ro nội bộ. ...

Ghi nhận tại nhiều ngân hàng thương mại: Tỷ lệ giao dịch số tiệm cận mức tuyệt đối

DNVN - Hiện nay, tỷ lệ giao dịch số tại nhiều ngân hàng đạt từ 97-98%, tiệm cận mức tuyệt đối. Tỷ lệ tăng trưởng giao dịch trên kênh số của ngành vẫn đạt mức 2 con số hằng năm cả về số lượng lẫn giá trị giao dịch. ...

Mới nhất

Khánh Hòa dự kiến khởi công Dự án KCN Dốc Đá Trắng vào tháng 4/2025

Phó chủ tịch Thường trực UBND tỉnh Khánh Hòa Lê Hữu Hoàng đề nghị chủ đầu tư đẩy nhanh tiến độ Dự án đầu tư xây dựng và kinh doanh kết cấu hạ tầng KCN Dốc Đá Trắng, phấn đấu khởi công trước ngày 2/4/2025. Khánh Hòa dự kiến khởi công Dự án KCN Dốc Đá Trắng vào tháng 4/2025Phó...

Chung cư gần tuyến đường sắt Nhổn

Một số dự án chung cư gần tuyến đường sắt Nhổn - ga Hà Nội đã tăng giá từ 30 - 50% so với cùng kỳ năm ngoái. Đây là mức tăng cao gấp đôi so với các dự án thông thường. Chung cư gần tuyến đường sắt Nhổn - ga Hà Nội tăng giá 30-50% sau một nămMột số...

T&T Group hợp tác sản xuất pin lưu trữ năng lượng tại Việt Nam

Với việc hợp tác cùng các doanh nghiệp hàng đầu trong lĩnh vực năng lượng của Trung Quốc để nghiên cứu đầu tư nhà máy sản xuất pin lưu trữ và phát triển dự án Khu công nghiệp phụ trợ năng lượng, T&T Group đã và đang góp phần phát triển năng lượng xanh - sạch, từng bước đảm...

Vĩnh Hoàn tạm ứng cổ tức gần 450 tỷ đồng

Vĩnh Hoàn sắp dành 450 tỷ đồng để tạm ứng cổ tức năm 2024 bằng tiền mặt với tỷ lệ 20% vốn điều lệ, tức mỗi cổ phiếu nhận 2.000 đồng. Vĩnh Hoàn sắp dành 450 tỷ đồng để tạm ứng cổ tức năm 2024 bằng tiền mặt với tỷ lệ 20% vốn điều lệ, tức mỗi cổ phiếu nhận...

Phát hiện hành vi giả mạo hồ sơ đấu thầu dự án ở Khánh Hòa

Quá trình thẩm định, đơn vị chuyên môn phát hiện một số doanh nghiệp có dấu hiệu giả mạo hồ sơ tham gia đấu thầu dự án tu bổ, tôn tạo di tích Thành cổ Diên Khánh (tỉnh Khánh Hòa). Ban quản lý Dự án phát triển tỉnh Khánh Hòa vừa có quyết định hủy thông báo mời thầu gói...

Mới nhất