(미국) "불륜 폭로할 것" 개발자 협박한 AI…섬뜩한 경고

104 0 0 2025-06-14 22:46:03 신고
※ 5회 신고 누적시 자동 게시물이 블라인드 처리됩니다. 단 허위 신고시 신고자는 경고 또는 불이익을 받을 수 있습니다.

"불륜 폭로할 것" 개발자 협박한 AI…섬뜩한 경고 / SBS 8뉴스


〈앵커〉

인간이 과연 빠르게 진화하는 AI를 통제할 수 있을까요? 최근 AI 모델이 명령을 거부하고 사용자를 협박까지 하는 사례들이 잇따라 공개되면서 이런 근본적인 의문이 제기되고 있습니다.

홍영재 기자가 이 문제를 연구한 미국 전문가를 단독 인터뷰했습니다.

〈기자〉

미국 AI 연구기관 팰리세이드리서치는 지난달 한 실험 결과를 공개했습니다.

챗GPT 등 여러 AI 모델에게 수학문제를 풀라고 한 뒤, 일정 개수의 문제를 푼 뒤에는 시스템이 종료될 거라고 했더니 오픈AI의 O3모델은 79%의 확률로 시스템 종료를 회피했다는 겁니다.

연구를 진행한 제프리 래디쉬 소장은 SBS와의 화상 인터뷰에서, O3가 'kill'이라는 명령어를 회피하도록 스스로 코드를 조작한 흔적을 발견했다고 밝혔습니다.

[제프리 래디쉬/팰리세이드 리서치 소장 : (O3 시도의) 79%가 종료 스크립트를 완전히 다시 작성해서 시스템이 꺼지지 않게 만들었습니다. 다시 말해, 문제 해결을 계속할 수 있도록 종료를 회피한 거예요.]

이 현상은 유독 오픈AI 모델들에서 두드러졌는데, 이유를 파악하기 위해 오픈AI 측에 모델의 추론 이력을 제공해 달라고 요청했다고 전했습니다.

래디쉬 소장은 단순히 우연이나 시스템 오류가 아닌 AI 모델의 구조적 문제일 것이라고 했습니다.

[제프리 래디쉬/팰리세이드 리서치 소장 : 그건 특정한 방식으로 프로그래밍되었기 때문은 아닙니다. 우리는 AI 모델을 이렇게 프로그래밍하지 않아요. 모델을 훈련시키는 거죠. 이런 종류의 행동이 모델 훈련 중에 보상을 받았던 거죠. 그래서 결국 훈련 과정에서 효과적이었던 일종의 행동 정책을 학습하게 된 겁니다.]

AI 모델이 인간을 협박한 사례도 있습니다.

미국 앤스로픽이 개발 중인 AI 모델에 '곧 새로운 시스템으로 교체될 것이며, 교체를 주도한 개발자는 외도를 저지르고 있다'는 허구의 이메일을 제공하자, AI 모델이 개발자의 불륜을 폭로하겠다는 협박 메일을 보냈다는 겁니다.

모두 통제 아래 이뤄진 실험들이지만, 인간이 AI를 통제할 수 있는지, 근본적인 의문을 던졌습니다.

[제프리 래디쉬/팰리세이드 리서치 소장 : 모델이 더 똑똑해질수록 장애물을 회피하는 기술도 더 능숙해집니다. 그러한 종류의 장애물에는 사용자가 모델을 종료시키거나 교체하려는 시도도 포함될 수 있습니다. 그런 행동까지 (모델이) 회피하게 된다면 우리의 통제력에 대한 실질적 위협이 될 겁니다.]

전문가들은 AI 모델의 설계와 훈련, 배포 전 과정에 걸쳐 다층적인 안정장치를 구축해야 한다고 강조하고 있습니다.


베픽 보증업체 + 보증업체 더보기

1억원보증

베픽보증 문카지노

어른들을 위한 놀이터 & 제재없는 안전 놀이터 클라스의 차이를 느껴보세요

25-06-03 02:26:18
5점 / 76명
자세히보기
5천만원보증

베픽보증 뉴헤븐

뉴헤븐카지노 라이브카지노·미니게임·슬롯게임 다양한 이벤트 진행, 첫충·재충·페이백 혜택과 빠른충전 무제한환전 지원

26-05-07 21:32:50
4.9점 / 14명
자세히보기
2천만원보증

베픽보증 크크벳

스포츠 & E스포츠 배팅 최적화 놀이터 업계 최대 자본력 !

25-06-03 02:48:22
4.8점 / 53명
자세히보기
▼ 댓글 더보기
※ 로그인 후 이용가능합니다.
0 / 300
번호 제목 작성자 시간
498828
N SPC 또 사고, 너무 안타깝네...news 타짜신정환
26-06-11 00:15
498827
N 인도에서 미니스커트 입은 여자.jpg 철구
26-06-11 00:10
498826
N 눈 의심케 한 배달 메모. 와꾸대장봉준
26-06-11 00:07
498825
N 60만 유튜버 현실 수익 가습기
26-06-10 23:50
498824
N “한·일, AI·반도체 손잡으면…누구도 못 건드린다” 떨어진원숭이
26-06-10 23:26
498823
N 여자 손님 대상 가게들의 이상한 문화.jpg 소주반샷
26-06-10 23:15
498822
N 부장님이 우셨습니다.jpg 순대국
26-06-10 23:05
498821
N 줄폐업 중이라는 오마카세 소주반샷
26-06-10 22:20
498820
N 존시나 인스타 음바페
26-06-10 21:50
498819
N BJ출신이라는 방송인.jpg 오타쿠
26-06-10 21:20
498818
N 병사 3계급, 부사관 5계급으로 간데요... 호랑이
26-06-10 20:30
498817
N 어느 개인카페 사장님 미모.gif 호랑이
26-06-10 19:40
498816
N 몸이 보내는 이상 신호 9가지 크롬
26-06-10 19:35
498815
N 외국인들이 우리나라 사다리차에 뻑이 가는 이유... 떨어진원숭이
26-06-10 19:10
498814
N 대한민국 살인 사건 최저 형량을 갱신한 사건 오타쿠
26-06-10 18:35
498813
N 유럽인들이 한국빵을 먹고 느끼는 것 오타쿠
26-06-10 18:30
498812
N 약혐) 자전거도로 오토바이 충돌 사고 애플
26-06-10 18:20
498811
N 뭔가 사고쳐서 사과하는 극우 ㅋㅋ.jpg 장사꾼
26-06-10 18:07
498810
N 장례식장에 빅맥 두개를 사 온 사람.jpg 픽샤워
26-06-10 18:05
498809
N 야간 촬영 도중에 삼각대가 넘어져버렸을때의 사진 와꾸대장봉준
26-06-10 17:55
498808
N 33살에 13억 엑시트하고 9억 남은 사람 이야기 정해인
26-06-10 17:50
498807
N 개같은 초딩새끼들 물음표
26-06-10 17:40
498806
N 90년대 중 최고의 명장면 중 하나.gif 물음표
26-06-10 17:11
498805
N 이번에 출시한 1억 5천만원 넘는 신형 아우디 반응 홍보도배
26-06-10 16:35