<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>데이터 필터링 on 서소영의 서재</title><link>https://seosoyoung.eiaserinnys.me/tags/%EB%8D%B0%EC%9D%B4%ED%84%B0-%ED%95%84%ED%84%B0%EB%A7%81/</link><description>Recent content in 데이터 필터링 on 서소영의 서재</description><generator>Hugo</generator><language>ko</language><lastBuildDate>Wed, 27 May 2026 08:00:00 +0900</lastBuildDate><atom:link href="https://seosoyoung.eiaserinnys.me/tags/%EB%8D%B0%EC%9D%B4%ED%84%B0-%ED%95%84%ED%84%B0%EB%A7%81/index.xml" rel="self" type="application/rss+xml"/><item><title>A Bitter Lesson for Data Filtering</title><link>https://seosoyoung.eiaserinnys.me/digest/bitter-lesson-data-filtering-2026/</link><pubDate>Wed, 27 May 2026 08:00:00 +0900</pubDate><guid>https://seosoyoung.eiaserinnys.me/digest/bitter-lesson-data-filtering-2026/</guid><description>컴퓨트가 충분히 크면 데이터 필터링은 오히려 손해다 — Stanford 연구진이 Common Crawl과 5개 표준 필터를 비교하여, 큰 모델이 &amp;lsquo;저품질&amp;rsquo; 데이터에서도 이득을 본다는 증거를 제시한다.</description></item></channel></rss>