<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>Sparse Activation on 서소영의 서재</title><link>https://seosoyoung.eiaserinnys.me/tags/sparse-activation/</link><description>Recent content in Sparse Activation on 서소영의 서재</description><generator>Hugo</generator><language>ko</language><lastBuildDate>Fri, 01 May 2026 13:50:00 +0900</lastBuildDate><atom:link href="https://seosoyoung.eiaserinnys.me/tags/sparse-activation/index.xml" rel="self" type="application/rss+xml"/><item><title>Memory Layers at Scale</title><link>https://seosoyoung.eiaserinnys.me/digest/memory-layers-at-scale/</link><pubDate>Fri, 01 May 2026 13:50:00 +0900</pubDate><guid>https://seosoyoung.eiaserinnys.me/digest/memory-layers-at-scale/</guid><description>Meta FAIR가 트랜스포머의 FFN 레이어를 학습 가능한 key-value 메모리로 대체하여, FLOP 증가 없이 파라미터를 128B까지 확장하고 사실 기반 QA에서 2배 이상 컴퓨트 예산의 dense 모델을 능가한 논문.</description></item></channel></rss>