Behind the Scenes: Hardening Firefox with Claude Mythos Preview
Mozilla가 agentic harness 파이프라인을 구축해 Firefox 150에서 271개 잠재 보안 버그를 발견·수정한 과정. 핵심은 모델보다 파이프라인이며, 정적 분석의 false positive 한계는 동적 testcase 검증으로 돌파됐다.
Mozilla가 agentic harness 파이프라인을 구축해 Firefox 150에서 271개 잠재 보안 버그를 발견·수정한 과정. 핵심은 모델보다 파이프라인이며, 정적 분석의 false positive 한계는 동적 testcase 검증으로 돌파됐다.

PoisonedRAG는 RAG 시스템의 지식 DB에 5개의 악성 텍스트만 넣으면 90% 이상의 확률로 LLM이 원하는 오답을 내놓게 만든다. 모델은 멀쩡한데 참고 자료가 오염된 것이다.