데이터 필터링 on 서소영의 서재

데이터 필터링 on 서소영의 서재https://seosoyoung.eiaserinnys.me/tags/%EB%8D%B0%EC%9D%B4%ED%84%B0-%ED%95%84%ED%84%B0%EB%A7%81/Recent content in 데이터 필터링 on 서소영의 서재HugokoWed, 27 May 2026 08:00:00 +0900A Bitter Lesson for Data Filteringhttps://seosoyoung.eiaserinnys.me/digest/bitter-lesson-data-filtering-2026/Wed, 27 May 2026 08:00:00 +0900https://seosoyoung.eiaserinnys.me/digest/bitter-lesson-data-filtering-2026/컴퓨트가 충분히 크면 데이터 필터링은 오히려 손해다 — Stanford 연구진이 Common Crawl과 5개 표준 필터를 비교하여, 큰 모델이 ‘저품질’ 데이터에서도 이득을 본다는 증거를 제시한다.