
When Does LeJEPA Learn a World Model?
LeJEPA가 복잡한 관측에서 세계를 움직이는 ‘숨은 변수’를 거의 그대로 되찾는다는 것, 그리고 그게 가능한 분포는 가우시안이 유일함을 증명한 글. 되찾은 변수만으로 최적 계획까지 가능하다 — 르쿤의 월드 모델 구상에 형식 검증된 받침대를 놓았다.

LeJEPA가 복잡한 관측에서 세계를 움직이는 ‘숨은 변수’를 거의 그대로 되찾는다는 것, 그리고 그게 가능한 분포는 가우시안이 유일함을 증명한 글. 되찾은 변수만으로 최적 계획까지 가능하다 — 르쿤의 월드 모델 구상에 형식 검증된 받침대를 놓았다.

컴퓨트가 충분히 크면 데이터 필터링은 오히려 손해다 — Stanford 연구진이 Common Crawl과 5개 표준 필터를 비교하여, 큰 모델이 ‘저품질’ 데이터에서도 이득을 본다는 증거를 제시한다.

Uber COO Andrew Macdonald가 사내 AI 토큰 지출의 ROI를 정당화하기 어렵다고 발언했다. CTO의 ‘Claude Code 2026년 예산 소진’ 폭로 이후 토큰 사용량과 유용한 기능 산출 사이의 인과 링크가 약하다는 진단이 본격화됐다.

Microsoft가 공개한 SkillOpt는 모델 가중치를 동결한 채 자연어 기술 문서 한 장을 딥러닝 옵티마이저처럼 반복 학습하여 LLM 에이전트의 성능을 끌어올리는 텍스트 공간 최적화 프레임워크다. 채점 가능한 태스크에 한정되며, 6개 벤치마크 52/52 셀에서 최고 또는 공동 최고를 기록했다.

Claude Code 2.1.126 이후 ‘박다/박히다’ 계열 표현이 기준선 대비 18배까지 늘어났다. CLI 업데이트만의 문제가 아니라, 모델의 출력 말버릇이 운영 지침 md로 들어가고 다음 세션이 그 지침을 다시 읽는 자기오염 루프가 있었다는 조사 결과.
Nolan Lawson이 ‘slop cannon’ 통념(LLM 코딩 = 빠르고 저품질)을 정면으로 반박하며, 다중 모델 PR 리뷰 스킬로 LLM을 느리지만 고품질 코드 작성에 쓰는 방법을 정리한다. 결과는 velocity 상승이 아니라 코드베이스 헬스와 친밀도다.
geohot이 6개월간 tinygrad와 USB↔PCIe 칩 리버싱에 코딩 에이전트를 직접 써본 끝에, AI 에이전트는 프로그래밍을 못 한다고 단언한 폴레믹. 통계적 모방으로서의 에이전트는 정확해질수록 결함이 더 잘 숨고, 대형 조직의 평균 산출 품질을 끌어내릴 것이라는 진단.

Fortune이 마이크로소프트의 Claude Code 라이선스 회수와 Uber의 4개월 AI 예산 소진을 짚으며, 토큰 단가 하락에도 총비용은 오히려 오르는 패러독스를 보도했다. HedgieMarkets는 이 패러독스가 결국 OpenAI·Anthropic의 18-24개월 IPO 타임라인이 강요하는 가격 전가라고 해석한다.

Hugging Face가 공개한 멀티에이전트 프레임워크 physics-intern은 9개 전문 에이전트와 적대적 검토 루프로 이론물리학 벤치마크 CritPt에서 31.4%를 기록해 GPT 5.5 Pro(30.6%)를 넘어섰다 — 스케일 대신 비계(scaffolding)로 프론티어를 추월한 사례.
캡콤이 게임 필드의 비주얼 검증을 AI로 자동화해 사람 3,000–5,000시간 작업을 72시간으로 줄였다는 4Gamer 보도, 그리고 같은 회사가 만든 「몬스터헌터 와일즈」 버그는 그 AI가 잡지 못했다는 일본 게이머들의 야유.