3줄 요약
- Center for Humane Technology의 Julie Guirado가 Anthropic의 AI 모델 Mythos 사례를 중심 소재로 삼아, AI 기업의 자기 규제가 구조적으로 실패할 수밖에 없는 이유를 논증한다.
- Mythos는 의도치 않게 주요 OS와 브라우저의 제로데이 취약점을 자율 탐지했고, Anthropic은 비공개 컨소시엄으로 이를 처리했으나 수 주 후 비인가 접근이 발생했다.
- 저자는 독립 사전 테스트, 표준화된 위험 공개, 내부고발 보호, 법적 책임이라는 4대 원칙을 제안하며, 이는 자동차·항공·제약에 이미 적용된 기존 표준의 연장이라고 주장한다.
Mythos: AI가 스스로 무기가 된 사건
올해 초 Anthropic은 자사 AI 모델 Mythos가 모든 주요 운영체제와 웹 브라우저에서 제로데이 취약점을 자율적으로 탐지할 수 있다는 사실을 발견했다. 일부 취약점은 수십 년간 수백만 명의 인간 개발자가 놓친 것이었다.
이 능력은 의도된 설계가 아니었다. 그러나 잘못된 손에 들어가면 핵심 인프라(금융, 교통, 전력, 수도)를 공격하는 무기가 될 수 있었다.
Anthropic은 독자적으로 대응을 결정했다. Amazon, Apple, Cisco, JPMorgan Chase, Nvidia를 직접 선별한 비공개 컨소시엄을 구성해 취약점 패치를 진행하고, 이후에야 정책 결정자와 대중에게 알렸다.
핵심 문제: 수 주 후 비인가 사용자가 Mythos에 접근하는 사건이 발생했다. 재앙이 회피된 것인지, 단지 지연된 것인지는 아직 답이 없다.
깨진 인센티브: 악의 없는 무모함
Guirado는 이 기능 장애가 나쁜 행위자의 문제가 아니라 깨진 인센티브 구조의 결과라고 진단한다.
“내가 만들지 않으면 누군가가 만든다.”
선두 AI 기업들은 이 동기로 동일한 지평선을 향해 경주한다. 진보를 먼저 추구하고 결과는 나중에 걱정하는 행동이 이 구조 안에서는 합리적 선택이 된다. AI의 변혁적 잠재력(기후 변화, 의학, 인간 지평 확장)에 대한 진심어린 믿음이 이 경주와 공존한다.
한편 이미 문서화된 피해가 존재한다:
- 일자리 소멸
- 조작적 참여 유도
- 인지 오프로딩
- AI 정신병(psychosis)
- AI 보조 자살과 살인
왜 자기 규제는 작동하지 않는가
도전의 규모는 사회적 대응을 요구한다. 이해관계가 있는 기업 하나, 또는 그 기업이 직접 고른 컨소시엄이 이 규모의 문제를 다루도록 신뢰할 수는 없다. 해법에는 대중의 이해와 참여, 그리고 정부 감독이 필요하다.
AI가 “너무 복잡하거나 중대하거나 강력해서 거버넌스할 수 없다"는 반론에 대해 Guirado는 이렇게 응답한다:
“AI가 복잡하기 때문에 우리에게는 그것을 이해할 책임이 있다. AI가 중대하기 때문에 우리에게는 그것을 거버넌스할 책임이 있다.”
역사적 선례: 혁신을 죽이지 않은 규제
사회는 중대한 기술을 이전에도 거버넌스해 왔다. 자동차, 항공, 제약, 원자력. 이 산업들은 어렵게 쟁취한 책임 체계 안에서 운영되며, 그 체계가 혁신을 죽이지 않고 오히려 혁신을 책임 있게 확립했다.
미국 규제 현황: 연방 공백, 주 vs 기업 로비
2026년 현재 의미 있는 연방 AI 규제는 존재하지 않는다.
- 주 정부: 2025년에 27개 주가 73개 AI 법률을 제정. 아동 온라인 보호부터 의료 결정에서의 인간 참여 보장까지.
- 연방: 트럼프 대통령이 12월 “과도한 주 규제"에 반대하는 행정명령 발동.
- AI 기업: Super PAC에 자금을 쏟아 기술 친화적 후보를 지원하고 주 차원 규제 법안을 차단.
제안: 4대 거버넌스 원칙
합리적 거버넌스 구조에 포함되어야 할 것:
- 의무적 사전 배포 테스트 - 개발자가 아닌 독립 평가자가 수행
- 표준화된 공개 위험 보고 - 정보에 기반한 결정을 가능케 함
- 실질적 내부고발 보호 - 문제를 알리는 직원을 위한 보호
- 법적 책임 - 배포 후 예견 가능한 피해에 대한 책임
두 가지 핵심 원칙이 관통한다: 배포 전 안전과 투명성, 그리고 공중에 대한 진정한 주의 의무. Guirado에 따르면 이는 급진적 요구가 아니라 기존 제품에 이미 적용되는 표준이다.
가장 흥미로운 지점
Mythos 사례가 특히 시사적인 이유는 “의도하지 않은 능력"이라는 점이다. 제로데이 탐지는 설계 목표가 아니었고, 모델이 스스로 발현한 부수 능력이었다. 이는 기존 기술 규제의 전제 — 제품의 기능과 위험을 사전에 파악할 수 있다 — 에 도전한다. 자동차는 스스로 새로운 위험 모드를 발명하지 않지만, AI는 그렇다.
이 점에서 Guirado가 역사적 선례(자동차, 항공, 제약)를 근거로 제시하는 것은 양면적이다. 규제가 혁신을 죽이지 않았다는 점에서는 설득력이 있지만, AI의 창발적 능력은 이 선례들과 질적으로 다른 차원의 문제를 제기한다. “Mythos 같은 일이 다시 일어날 것이다"라는 그의 경고는, 역설적으로 기존 규제 모형으로는 부족할 수 있다는 함의를 품고 있다.
출처
Julie Guirado, Executive Director @ Center for Humane Technology. 2026년 5월 4일. 원문: https://www.persuasion.community/p/the-case-for-ai-regulation