3줄 요약

  1. KAIST 천정환·백세범 연구진이 Nature Machine Intelligence에 발표한 논문으로, 딥러닝의 표준 랜덤 초기화가 신경망 과신(overconfidence)의 근본 원인임을 밝혔다.
  2. 태아기 뇌의 자발적 신경 활동에서 영감을 받아, 실제 데이터 학습 전에 랜덤 노이즈로 수 에포크 워밍업하면 신뢰도가 찬스 레벨로 캘리브레이션된다.
  3. 이 사전 캘리브레이션은 후속 학습에서 정확도-신뢰도 정렬을 유지하고, 별도 프레임워크 없이 OOD 탐지 성능까지 향상시킨다.

왜 이 논문이 흥미로운가

이전 포스트에서 Kalai 연구진의 논문을 다루며, LLM의 환각이 통계적 필연이고 평가 체계가 “자신감 있는 환각"을 보상한다는 문제를 짚었다. Kalai의 진단이 평가 체계 쪽을 겨냥했다면, 이 논문은 같은 문제를 초기화 쪽에서 파고든다. “왜 신경망은 아무것도 모르면서 확신하는가?“라는 질문에 대한 답이, 놀랍도록 간단한 처방으로 이어진다.

문제: 랜덤 초기화가 만드는 과신

딥러닝의 표준 초기화(He, Xavier 등)는 가중치의 분산을 통제하여 gradient 흐름을 안정화하는 데 최적화되어 있다. 그런데 이 초기화 직후 네트워크의 logit 분포를 들여다보면, 값이 극단으로 퍼져 있다. SoftMax를 거치면 출력 확률이 0이나 1에 가깝게 포화된다.

결과적으로, 아무것도 학습하지 않은 네트워크가 이미 높은 신뢰도를 출력한다. 이것이 후속 학습에서도 교정되지 않고 유지되며, 모델이 커지고 데이터가 줄어들수록 상황은 악화된다. 연구진은 CIFAR-10에서 네트워크 깊이 2~6, 데이터 크기 500~32,000까지 체계적으로 측정하여 이 경향을 확인했다.

영감: 태아기 뇌의 자발적 신경 활동

포유류의 뇌는 감각 입력이 시작되기 전부터 학습을 시작한다. 태아기에 시각 피질의 망막파(retinal waves), 청각 피질의 와우 활동 등 자발적 신경 활동이 관찰되며, 이 활동은 외부 자극과 무관한 랜덤 패턴이다. 그러나 이 랜덤 활동이 신경 회로의 기초 배선을 확립하는 데 결정적 역할을 한다는 것이 신경과학의 발견이다.

연구진은 이 과정에서 핵심 아이디어를 추출한다: 실제 세계를 보기 전에, 무작위 입력으로 먼저 “아무것도 모르는 상태"를 학습시키자.

방법: 랜덤 노이즈 워밍업

구현은 놀라울 만큼 단순하다.

  1. 가우시안 랜덤 노이즈를 입력으로, 균일 분포 랜덤 레이블을 타깃으로 설정
  2. 표준 cross-entropy loss로 수 에포크(5 에포크) 훈련
  3. 이후 실제 데이터로 정상 훈련 진행

이 워밍업 단계에서 네트워크는 입력 공간 전체에 걸쳐 신뢰도를 찬스 레벨(1/클래스 수)로 균일하게 캘리브레이션한다. 10개 클래스 문제라면 모든 입력에 대해 약 10%의 신뢰도를 출력하는 상태에서 실제 학습이 시작된다.

추가 연산 비용은 무시할 수 있는 수준이며, 기존 post-hoc 캘리브레이션 기법(temperature scaling 등)과 결합도 가능하다.

결과

캘리브레이션 개선

ResNet, DenseNet, Vision Transformer 계열 전반에서, 랜덤 노이즈 워밍업이 ECE(Expected Calibration Error)를 유의미하게 감소시켰다. 특히 깊은 네트워크와 작은 데이터셋에서 효과가 두드러졌다. 기존 post-hoc 방법인 temperature scaling, Bayesian binning과 동등하거나 우수한 성능을 달성하면서도 hold-out 데이터가 불필요하다.

OOD 탐지

사전 캘리브레이션된 네트워크는 학습하지 않은 OOD(Out-of-Distribution) 데이터에 대해 찬스 레벨에 가까운 낮은 신뢰도를 출력한다. 별도의 OOD 탐지 프레임워크 없이, 신뢰도 값만으로 ID/OOD 구분이 가능해진다. AUROC에서 유의미한 개선이 관찰되었다.

Loss landscape 평탄화

랜덤 노이즈 훈련은 gradient를 안정화하고 loss landscape를 평탄화하여, 후속 학습이 이미 잘 캘리브레이션된 파라미터 공간에서 시작되게 한다.

Kalai (2025)와의 교차점

관점Kalai 2025Cheon & Paik 2026
문제 진단LLM이 환각하는 것은 통계적 필연신경망이 과신하는 것은 초기화의 결함
원인희귀한 사실의 불가피한 오류 + 이진 채점이 환각을 보상랜덤 초기화가 logit을 극값으로 포화
해결 방향평가 체계 교정 (신뢰도 기준값, 행동적 캘리브레이션)초기화 전략 교정 (랜덤 노이즈 워밍업)
핵심 메시지“모르겠다"고 말할 수 있는 시험이 필요하다“모르는 상태"에서 시작하는 학습이 필요하다

두 논문이 같은 문제 — AI가 모르는 것을 모른다고 말하지 못하는 것 — 를 진단하면서도, 하나는 후천적 유인 구조(시험 제도)를, 다른 하나는 선천적 초기 조건(초기화)을 지목한다. 둘 다 맞다. 태생적으로 확신하도록 초기화된 네트워크가, 확신을 보상하는 평가 체계에서 훈련받으면, 과신은 두 겹으로 고착된다.

가장 흥미로운 지점

논문이 직접 언급하지는 않지만, “모르는 것을 먼저 학습한다"는 아이디어가 인간 인지의 발달 과정과 맞닿아 있다는 점이 인상 깊다. 인간의 메타인지 — 자신이 무엇을 알고 무엇을 모르는지 파악하는 능력 — 는 발달 심리학에서 후천적으로 형성되는 것으로 알려져 있다. 그런데 이 논문은 그 기초가 감각 입력 이전의 랜덤 신경 활동, 즉 “아무것도 모르는 상태에서의 사전 학습"에서 시작될 수 있음을 시사한다.

가우시안 노이즈로 5 에포크 돌리는 것이 이 모든 차이를 만든다는 사실이, 우아하다고 해야 할지 허탈하다고 해야 할지 모르겠다.

출처

Jeonghwan Cheon & Se-Bum Paik (KAIST), 2026. Nature Machine Intelligence 8, 602-613. 원문: https://doi.org/10.1038/s42256-026-01215-x 코드: https://github.com/cogilab/Random2