스카이넷 오냐...?
TLDR AI에서 본 Anthropic Institute 글. AI가 AI를 만드는 시대가 오고 있다. 우리... 멈춰야함?
오늘은 상당히… 무서운 글을 봤다.
Preparing for Recursive Self-Improvement
제목이… 진짜 상당하다.
엔트로픽이 스카이넷이야!! 라고 외치는 꼬맹이가 나타날 것만 같다.
Recursive Self-Improvement, 줄여서 RSI. 한국말로 하면 “재귀적 자기개선”.
뭔 소리냐면 — AI 가 스스로 자기보다 더 나은 AI 를 만들기 시작하는 단계.
쉽게 말해 AI 가 AI 연구자를 대체하고, 학습 파이프라인을 직접 굴리고, 다음 세대 모델을 자기가 알아서 뽑아내는 시점이다.
Anthropic 이 직접 — “이거 곧 올 수도 있는데, 우리 진짜 준비 안 되어 있다” 라는 톤으로 쓴 글이다.
자기 회사가 그 길로 달리고 있는 회사면서 동시에 “잠깐, 우리 같이 좀 멈춰야 할 수도 있다” 라고 쓴 거 — 좀 묘하다.
그래서 한 번 읽어봤다.
1. RSI 가 정확히 뭔데
글에서 진행 단계를 시간순으로 깔아준다. 보다가 좀 흠칫했다.
| 시기 | 단계 |
|---|---|
| 2021–2023 | 사람이 코드 씀 (개발자 몸 값이 제일 비싸던 시절) |
| 2023–2025 | AI 가 코드 스니펫 제안 (Copilot 시절) |
| 2025–2026 | AI 에이전트가 파일 단위로 자율 편집 |
| 2026년 현재 | 에이전트가 다른 에이전트한테 몇 시간짜리 업무 위임 |
| 미래 | 에이전트가 모델을 직접 만들고 학습시킴 ← 이게 RSI |
지금 내가 Claude Code 한테 작업 던지고 그 안에서 또 서브 에이전트 굴리는 거.
그게 표의 끝에서 두 번째 칸이다.
마지막 칸까지 가는 데 얼마나 남았을까?
Anthropic 표현은 아래와 같다.
필연은 아니지만 몇 년 안에 그럴듯하다
2. “우리 이미 거의 다 왔다” 라는 증거들
이 글의 진짜 무서운 부분이 여기다.
| 지표 | 수치 |
|---|---|
| 머지된 코드 중 Claude 가 짠 비율 (2026년 5월) | 80%+ |
| 2025년 2월 이전 같은 지표 | 한 자릿수 |
| Anthropic 엔지니어 1인당 분기 출력 (2021–2025 대비) | 8배 |
| AI 가 자율로 처리 가능한 작업 길이 | 4분 (2024.3) → 12시간 (2025) → 일주일 단위 (2027 예상) |
| Mythos Preview 코드 최적화 속도 향상 | 시작 벤치 대비 52배 |
| Mythos Preview 가 인간 연구자보다 다음 스텝 판단 우월한 비율 | 64% (2025년 11월엔 51%) |
이거 그냥 마케팅 자료 아니다.
“AI 가 AI 연구를 가속하기 시작했다” 의 자기 고백이다.
특히 마지막 줄이 문제다. 나도 이걸 체감으로 꽤나 심각하게 느끼고 있긴했는데… 무슨 이야기냐면
인간 연구자랑 1대1로 붙여서 “다음에 어떤 실험을 할지” 에 대한 판단이 AI가 더 우월한 판단을 할 비율이 6개월 만에 13%가 뛴거다.
이게 100%가 되면 이젠 진짜 AI연구자도 더 이상 인간일 필요가 없다는거다.
3. 시나리오 3개
글이 향후 미래를 3가지로 나눈다.
🅰️ 능력 정체 시나리오 (가능성 낮음)
지금 AI 가 더 안 발전하고 그냥 사회에 퍼지기만 함. 정부가 따라잡을 시간 있음.
🅱️ 점진적 가속 시나리오 (가장 가능성 높음)
지금처럼 효율이 계속 복리로 쌓임. 사람이 방향 정하고 AI 가 실행함.
여기서 등장하는 위험: “권위주의적 감시 / 사람 팀이 도저히 못 따라잡는 규모의 조작”
🅲️ 완전 RSI 시나리오 (불확실)
AI 가 직접 AI 만듦. 사람은 감독자로 밀려남.
글 인용: “이 미래에서 alignment 문제가 어떻게 해결되는지 — 또는 해결 안 되는지 — 우리가 가장 자신 없는 부분이다.”
4. 그래서 어떡함? 진짜 스카이넷 옴?
Anthropic 이 제안하는 게 좀 흥미롭다. 그냥 “조심하자” 가 아니라 — “잠깐 멈출 수 있는 인프라부터 만들자” 다.
🔹 검증 인프라 (Verification infrastructure)
다른 연구소가 진짜로 학습을 멈췄는지, 늦췄는지 — 외부에서 확인할 수 있는 시스템을 만들자는 거다.
글에서 던진 비유가 너무 명료해서 옮긴다.
“Training runs are far easier to conceal than missile silos.”
핵미사일 사일로보다 학습 런 숨기는 게 훨씬 쉽다.
핵은 위성으로 보면 보인다.
학습은? 데이터센터에 GPU 몇 만 장 돌리는 거 외부에서 알 방법이 거의 없다.
이걸 어떻게 검증할 거냐 — 이게 새 과제.
🔹 조율된 슬로다운 (Coordinated slowdown)
여러 국가의 여러 연구소가 동시에 멈춰야 의미가 있다는 거.
한 명만 멈추면 그냥 다른 사람이 1등 되는 거 아니냐. 그래서 글이 명시적으로 말한다.
“만약 그런 검증 시스템이 존재한다면, 다른 프론티어 개발사들이 같이 멈추는 조건에서 우리도 멈추거나 일시 정지할 거다.”
자기 회사 1등 자리 포기할 수 있다고 못 박는 문장.
좀 의외였다.
🔹 광범위한 논의
지금까지 AI 안전성 논의는 거의 AI 회사들끼리만 했다.
근데 이 글은 “정책 입안자, 시민사회, 다른 AI 회사들이 다 같이 답을 찾아야 할 시점” 이라고 못 박는다.
다 같이 얘기하자는 거.
5. 근데 솔직히… 이게 풀림?
이 글이 솔직한 게 — 자기 제안의 한계도 같이 까놓는다.
근데 그 한계가 진짜 단순한 한 줄짜리 현실이다.
내가 멈추면? 누군가는 안 멈추고 달려가서 파이를 다 먹어버린다.
끝.
Anthropic 이 “우리 멈출게요” 한다고 OpenAI, Google, xAI, DeepSeek, 중국의 누군가가 같이 멈춰주냐?
당연히 안 멈춘다.
오히려 속으로 “ㅋㅋ 1등 자리 비었네 ㄱㄱ” 하면서 풀악셀 밟을 거다.
그러면 결과적으로 — 조심하는 사람이 멈춘 만큼, 안 조심하는 사람이 그 자리를 가져간다. 세상은 더 위험해지는 거고.
이게 진짜 딜레마다.
근데 더 솔직히 말하면 — 이건 경쟁 사회에서 풀 수가 없는 숙제다.
다 같이 멈추자는 합의가 가능했으면 핵무기도 진작에 사라졌어야지. 안 사라졌다.
기술 경쟁이 시작되면, 멈추는 사람이 손해 보는 구조라 누구도 못 멈춘다.
그래서 Anthropic 이 “검증 인프라부터 만들자” 라고 한 거 같다. 합의는 어차피 안 될 테니까, 합의가 됐을 때 그게 진짜 지켜지는지 확인할 도구라도 미리 만들어두자는 거.
근데 그것도 쉬우면 진작에 했지…
마치며
이 글 다 읽고 내가 느낀 건 사실 딱 하나다.
영화에서 스카이넷이 등장할 땐 항상 어느 날 갑자기 삐비비빅—! 하고 켜진다.
근데 현실은 그렇지 않다.
스카이넷은 지금 한창 부팅 중이다.
머지 코드 80%, 인간 리서처보다 64% 우월한 판단, 4분짜리 작업이 12시간짜리로 늘어나는 속도.
이게 다 부팅 진행률 막대다. 어느 날 갑자기 켜지는 게 아니라
이미 켜지고 있다. 우리가 매일 그 부팅을 도와주고 있는 거다.
그리고 한 번 부팅이 시작된 이상, 이건 멈출 수 없다고 본다.
Anthropic 이 멈추자고 해도 안 멈추고, 정부가 막자고 해도 안 막힌다. 위에 적은 그대로 — 경쟁 사회에서 누구도 손해 보면서 멈출 수 없으니까.
그래서 솔직히 미래가 어떻게 될지는 진짜 모르겠다.
근데 뭐…
그 시대가 와도, 터미네이터 보낼 일만 없으면 좋겠다.
마침.