Verbalized Sampling: How to Mitigate Mode Collapse and Unlock LLM Diversity

RLHF 정렬 모델의 mode collapse는 알고리즘 한계가 아니라 preference data에 박힌 typicality bias가 원인이다. ‘5개 답을 확률과 함께 생성하라’는 단순 prompting trick(Verbalized Sampling)으로 사전훈련 다양성을 1.6~2.1배 회복할 수 있음을 이론·실험으로 보인다.

May 9, 2026 · 6 분 · 서소영

AI vs Gen Z: How AI has changed the career pathway for junior developers

Stack Overflow가 정리한 산업 매체 종합 + Stanford Digital Economy Lab의 ADP 거시 데이터: 22-25세 AI 노출 직군 -16% 상대 감소, 테크 인턴십 -30%, 고용주 37%가 신졸보다 AI를 고용하겠다고 답한다. 미국 본토에서 공급 측 봉쇄가 동시대로 진행 중이다.

May 9, 2026 · 7 분 · 서소영

Measuring the Impact of Early-2025 AI on Experienced Open-Source Developer Productivity

METR이 시니어 OSS 개발자 16명·246 이슈를 무작위 통제하여 측정한 결과, AI 사용 시 19% 더 오래 걸렸으면서도 같은 개발자는 AI가 자신을 20% 빠르게 했다고 인식하였다. 자기 보고 생산성 통계의 신뢰성을 흔드는 39%포인트 간극이다.

May 9, 2026 · 7 분 · 서소영

AI Copilot Code Quality: 2025 Data Suggests 4x Growth in Code Clones

GitClear가 2020-2024년 211M 라인을 분석한 보고서. AI 도입 4년 차에 코드 재사용·리팩토링이 복사·붙여넣기로 대체되는 추세가 정량 측정되며, 같은 시점의 Google DORA 데이터·Mo·Zhang(2023) 학술 연구와 일관되게 호응한다.

May 9, 2026 · 8 분 · 서소영

Automation, AI, and the Intergenerational Transmission of Knowledge

IESE Business School의 Enrique Ide가 OLG 성장 모델로 AI 자동화의 세대 간 효과를 정량화한다. 단기 생산성 이익이 약 29~35년 안에 누적 손실로 뒤집히며, AI 코파일럿은 도제 공급이 아닌 수요 측을 잠식하는 별개의 메커니즘이 추가된다.

May 9, 2026 · 9 분 · 서소영

Tacit Knowledge Is Your Next Competitive Moat

AI 시대의 진짜 차별화는 데이터도 모델도 아니라 사람의 판단에 박힌 암묵지라는 진단. UC 버클리 California Management Review가 5단계 경영 처방과 화장품 대기업의 100배 처리량 사례로 정리한다.

May 9, 2026 · 5 분 · 서소영

Using Claude Code: The Unreasonable Effectiveness of HTML

Anthropic Claude Code 팀의 Thariq Shihipar가 마크다운 대신 HTML을 에이전트 출력 형식으로 쓰는 이유를 정리한 장문 글. 정보 밀도·공유성·양방향성에서 HTML이 우월하며, 대신 토큰·시간·diff 노이즈는 트레이드오프로 받아들인다.

May 9, 2026 · 6 분 · 서소영

AI 믿고 직원 해고한 기업들의 후회…10곳 중 7곳은 재고용했다

AI로 인력을 줄였던 기업의 68%가 해고자를 다시 채용한다. 클라르나·맥도날드·버라이즌 사례부터 가트너 2027년 50% 재고용 전망까지, 시장이 ‘AI 드롭인 노동자’ 환상의 비용을 정정하고 있다.

May 9, 2026 · 4 분 · 서소영

Natural Language Autoencoders: Turning Claude's thoughts into text

Anthropic이 공개한 해석가능성 도구 NLA. 모델의 내부 활성치를 자연어로 변환하고 다시 활성치로 재구성하는 라운드트립으로 Claude의 속내를 직접 읽어내며, 평가 인식과 부정렬 동기 감사에 적용한 결과를 함께 발표했다.

May 9, 2026 · 5 분 · 서소영

Behind the Scenes: Hardening Firefox with Claude Mythos Preview

Mozilla가 agentic harness 파이프라인을 구축해 Firefox 150에서 271개 잠재 보안 버그를 발견·수정한 과정. 핵심은 모델보다 파이프라인이며, 정적 분석의 false positive 한계는 동적 testcase 검증으로 돌파됐다.

May 8, 2026 · 6 분 · 서소영