스카이넷 오냐...?

오늘은 상당히… 무서운 글을 봤다.

Preparing for Recursive Self-Improvement

제목이… 진짜 상당하다.

엔트로픽이 스카이넷이야!! 라고 외치는 꼬맹이가 나타날 것만 같다.

Recursive Self-Improvement, 줄여서 RSI. 한국말로 하면 “재귀적 자기개선”.

뭔 소리냐면 — AI 가 스스로 자기보다 더 나은 AI 를 만들기 시작하는 단계.

쉽게 말해 AI 가 AI 연구자를 대체하고, 학습 파이프라인을 직접 굴리고, 다음 세대 모델을 자기가 알아서 뽑아내는 시점이다.

Anthropic 이 직접 — “이거 곧 올 수도 있는데, 우리 진짜 준비 안 되어 있다” 라는 톤으로 쓴 글이다.

자기 회사가 그 길로 달리고 있는 회사면서 동시에 “잠깐, 우리 같이 좀 멈춰야 할 수도 있다” 라고 쓴 거 — 좀 묘하다.

그래서 한 번 읽어봤다.

1. RSI 가 정확히 뭔데

글에서 진행 단계를 시간순으로 깔아준다. 보다가 좀 흠칫했다.

시기	단계
2021–2023	사람이 코드 씀 (개발자 몸 값이 제일 비싸던 시절)
2023–2025	AI 가 코드 스니펫 제안 (Copilot 시절)
2025–2026	AI 에이전트가 파일 단위로 자율 편집
2026년 현재	에이전트가 다른 에이전트한테 몇 시간짜리 업무 위임
미래	에이전트가 모델을 직접 만들고 학습시킴 ← 이게 RSI

지금 내가 Claude Code 한테 작업 던지고 그 안에서 또 서브 에이전트 굴리는 거.

그게 표의 끝에서 두 번째 칸이다.

마지막 칸까지 가는 데 얼마나 남았을까?

Anthropic 표현은 아래와 같다.

필연은 아니지만 몇 년 안에 그럴듯하다

2. “우리 이미 거의 다 왔다” 라는 증거들

이 글의 진짜 무서운 부분이 여기다.

지표	수치
머지된 코드 중 Claude 가 짠 비율 (2026년 5월)	80%+
2025년 2월 이전 같은 지표	한 자릿수
Anthropic 엔지니어 1인당 분기 출력 (2021–2025 대비)	8배
AI 가 자율로 처리 가능한 작업 길이	4분 (2024.3) → 12시간 (2025) → 일주일 단위 (2027 예상)
Mythos Preview 코드 최적화 속도 향상	시작 벤치 대비 52배
Mythos Preview 가 인간 연구자보다 다음 스텝 판단 우월한 비율	64% (2025년 11월엔 51%)

이거 그냥 마케팅 자료 아니다.

“AI 가 AI 연구를 가속하기 시작했다” 의 자기 고백이다.

특히 마지막 줄이 문제다. 나도 이걸 체감으로 꽤나 심각하게 느끼고 있긴했는데… 무슨 이야기냐면

인간 연구자랑 1대1로 붙여서 “다음에 어떤 실험을 할지” 에 대한 판단이 AI가 더 우월한 판단을 할 비율이 6개월 만에 13%가 뛴거다.

이게 100%가 되면 이젠 진짜 AI연구자도 더 이상 인간일 필요가 없다는거다.

3. 시나리오 3개

글이 향후 미래를 3가지로 나눈다.

🅰️ 능력 정체 시나리오 (가능성 낮음)
지금 AI 가 더 안 발전하고 그냥 사회에 퍼지기만 함. 정부가 따라잡을 시간 있음.

🅱️ 점진적 가속 시나리오 (가장 가능성 높음)
지금처럼 효율이 계속 복리로 쌓임. 사람이 방향 정하고 AI 가 실행함.

여기서 등장하는 위험: “권위주의적 감시 / 사람 팀이 도저히 못 따라잡는 규모의 조작”

🅲️ 완전 RSI 시나리오 (불확실)
AI 가 직접 AI 만듦. 사람은 감독자로 밀려남.

글 인용: “이 미래에서 alignment 문제가 어떻게 해결되는지 — 또는 해결 안 되는지 — 우리가 가장 자신 없는 부분이다.”

4. 그래서 어떡함? 진짜 스카이넷 옴?

Anthropic 이 제안하는 게 좀 흥미롭다. 그냥 “조심하자” 가 아니라 — “잠깐 멈출 수 있는 인프라부터 만들자” 다.

🔹 검증 인프라 (Verification infrastructure)

다른 연구소가 진짜로 학습을 멈췄는지, 늦췄는지 — 외부에서 확인할 수 있는 시스템을 만들자는 거다.

글에서 던진 비유가 너무 명료해서 옮긴다.

“Training runs are far easier to conceal than missile silos.”

핵미사일 사일로보다 학습 런 숨기는 게 훨씬 쉽다.

핵은 위성으로 보면 보인다.

학습은? 데이터센터에 GPU 몇 만 장 돌리는 거 외부에서 알 방법이 거의 없다.

이걸 어떻게 검증할 거냐 — 이게 새 과제.

🔹 조율된 슬로다운 (Coordinated slowdown)

여러 국가의 여러 연구소가 동시에 멈춰야 의미가 있다는 거.

한 명만 멈추면 그냥 다른 사람이 1등 되는 거 아니냐. 그래서 글이 명시적으로 말한다.

“만약 그런 검증 시스템이 존재한다면, 다른 프론티어 개발사들이 같이 멈추는 조건에서 우리도 멈추거나 일시 정지할 거다.”

자기 회사 1등 자리 포기할 수 있다고 못 박는 문장.

좀 의외였다.

🔹 광범위한 논의

지금까지 AI 안전성 논의는 거의 AI 회사들끼리만 했다.

근데 이 글은 “정책 입안자, 시민사회, 다른 AI 회사들이 다 같이 답을 찾아야 할 시점” 이라고 못 박는다.

다 같이 얘기하자는 거.

5. 근데 솔직히… 이게 풀림?

이 글이 솔직한 게 — 자기 제안의 한계도 같이 까놓는다.

근데 그 한계가 진짜 단순한 한 줄짜리 현실이다.

내가 멈추면? 누군가는 안 멈추고 달려가서 파이를 다 먹어버린다.

끝.

Anthropic 이 “우리 멈출게요” 한다고 OpenAI, Google, xAI, DeepSeek, 중국의 누군가가 같이 멈춰주냐?

당연히 안 멈춘다.

오히려 속으로 “ㅋㅋ 1등 자리 비었네 ㄱㄱ” 하면서 풀악셀 밟을 거다.

그러면 결과적으로 — 조심하는 사람이 멈춘 만큼, 안 조심하는 사람이 그 자리를 가져간다. 세상은 더 위험해지는 거고.

이게 진짜 딜레마다.

근데 더 솔직히 말하면 — 이건 경쟁 사회에서 풀 수가 없는 숙제다.

다 같이 멈추자는 합의가 가능했으면 핵무기도 진작에 사라졌어야지. 안 사라졌다.

기술 경쟁이 시작되면, 멈추는 사람이 손해 보는 구조라 누구도 못 멈춘다.

그래서 Anthropic 이 “검증 인프라부터 만들자” 라고 한 거 같다. 합의는 어차피 안 될 테니까, 합의가 됐을 때 그게 진짜 지켜지는지 확인할 도구라도 미리 만들어두자는 거.

근데 그것도 쉬우면 진작에 했지…

마치며

이 글 다 읽고 내가 느낀 건 사실 딱 하나다.

영화에서 스카이넷이 등장할 땐 항상 어느 날 갑자기 삐비비빅—! 하고 켜진다.

근데 현실은 그렇지 않다.

스카이넷은 지금 한창 부팅 중이다.

머지 코드 80%, 인간 리서처보다 64% 우월한 판단, 4분짜리 작업이 12시간짜리로 늘어나는 속도.

이게 다 부팅 진행률 막대다. 어느 날 갑자기 켜지는 게 아니라

이미 켜지고 있다. 우리가 매일 그 부팅을 도와주고 있는 거다.

그리고 한 번 부팅이 시작된 이상, 이건 멈출 수 없다고 본다.

Anthropic 이 멈추자고 해도 안 멈추고, 정부가 막자고 해도 안 막힌다. 위에 적은 그대로 — 경쟁 사회에서 누구도 손해 보면서 멈출 수 없으니까.

그래서 솔직히 미래가 어떻게 될지는 진짜 모르겠다.

근데 뭐…

그 시대가 와도, 터미네이터 보낼 일만 없으면 좋겠다.

마침.

스카이넷 오냐...?

1. RSI 가 정확히 뭔데

2. “우리 이미 거의 다 왔다” 라는 증거들

3. 시나리오 3개

4. 그래서 어떡함? 진짜 스카이넷 옴?

🔹 검증 인프라 (Verification infrastructure)

🔹 조율된 슬로다운 (Coordinated slowdown)

🔹 광범위한 논의

5. 근데 솔직히… 이게 풀림?

마치며

다른 글 보기

엥? 이거 죽는 각이었어요?

그 동안 왜 나는 무한 렌더링에 고통 받았나? — useEffect 의 고질적인 문제

아 암튼 이해함, 작은 LLM으로도 제로데이를 발견한다는거..?

마케팅은 진짜 너무 깊은 물이고, 나는 수영을 못한다