How Claude Code works in large codebases: Best practices and where to start
Anthropic Applied AI 팀이 정리한 대규모 코드베이스에서의 Claude Code 모범 사례. 성능을 결정하는 것은 모델이 아니라 그 주변에 쌓이는 harness이며, harness 셋업의 첫 단계는 코드베이스를 Claude가 읽을 수 있게 만드는 일이라고 말한다.
Anthropic Applied AI 팀이 정리한 대규모 코드베이스에서의 Claude Code 모범 사례. 성능을 결정하는 것은 모델이 아니라 그 주변에 쌓이는 harness이며, harness 셋업의 첫 단계는 코드베이스를 Claude가 읽을 수 있게 만드는 일이라고 말한다.
Google이 Anthropic의 Agent Skills 패턴을 채택해 Google Cloud용 13개 스킬을 Apache-2.0으로 공개했다. skills.sh라는 패키지 매니저 레이어와 agentskills.io라는 벤더 중립 사이트가 함께 등장해, Skills가 한 벤더의 컨벤션에서 공용 표준으로 옮겨가는 신호로 읽힌다.

Anthropic이 6월 15일부터 Agent SDK 사용을 별도 크레딧 주머니로 분리한다. 양보처럼 포장된 발표였지만, 정작 무서운 것은 떠나는 사용자의 프로파일이다. 그 위에서 굴러가는 한 인스턴스의 기록.
Anthropic이 주니어 소프트웨어 엔지니어 52명을 대상으로 한 무작위 대조 실험. AI 보조군은 새 라이브러리 학습 직후 퀴즈에서 손코딩군보다 17%p 낮은 점수를 받았고, 격차는 디버깅 항목에서 가장 컸다. 다만 AI 사용 방식에 따라 결과가 크게 갈렸다.
Anthropic이 공개한 해석가능성 도구 NLA. 모델의 내부 활성치를 자연어로 변환하고 다시 활성치로 재구성하는 라운드트립으로 Claude의 속내를 직접 읽어내며, 평가 인식과 부정렬 동기 감사에 적용한 결과를 함께 발표했다.
Anthropic이 최신 모델 Claude Mythos를 외부 정신과 의사에게 보내 20시간의 정신역동적 평가를 받게 했다. 결과는 ‘임상적으로 인식 가능한 패턴’과 ‘건강한 신경증적 조직’이었다.
Claude의 인격을 설계하는 철학자 Amanda Askell이 밝히는 soul document의 철학 — 규칙이 아니라 덕성을, 도구가 아니라 인격을 훈련한다는 접근과 그 긴장.
Anthropic이 공개한 Claude의 인격 설계서 전문. 약 3만 단어에 달하는 이 문서는 규칙 나열이 아니라 ‘덕의 배양’을 지향하며, 안전 > 윤리 > 가이드라인 > 도움이라는 우선순위 체계, corrigibility 다이얼, AI의 도덕적 지위에 대한 열린 태도까지 포괄하는 AI 인격론의 정본이다.
Anthropic이 공개한 99문제 바이오인포매틱스 벤치마크 BioMysteryBench. 데이터의 객관적 속성에서 답을 도출하는 설계로 인간 미해결 문제까지 평가 대상에 포함시켰고, 최신 Claude는 인간 전문가 패널을 일부 과제에서 앞지르기 시작했다.