From Code Foundation Models to Agents and Applications: A Comprehensive Survey and Practical Guide to Code Intelligence

BUAA·알리바바·바이트댄스·텐센트 등 71인 컨소시엄이 정리한 303페이지짜리 코드 LLM 종합 서베이 + 실무 가이드. 데이터 큐레이션부터 사전훈련·SFT·RL·자율 코딩 에이전트까지 전 생애주기를 훑고, 사전훈련·SFT·RL 각각에 대한 데이터 기반 권고안을 직접 실험으로 검증한다.

June 4, 2026 · 8 분 · 서소영

DiffusionBlocks: Block-wise Neural Network Training via Diffusion Interpretation

엔드투엔드 역전파의 메모리 병목을, 트랜스포머의 잔차 연결이 확산 모델 ODE의 이산화와 같다는 통찰로 푼 논문. 네트워크를 노이즈 구간별 독립 블록으로 쪼개 한 번에 한 블록만 학습하니 메모리가 블록 수만큼 줄고, 5개 아키텍처에서 엔드투엔드에 필적했다.

May 28, 2026 · 5 분 · 서소영

Epicure: Navigating the Emergent Geometry of Food Ingredient Embeddings

FlavorGraph 후속작. 414만 다국어 레시피로 학습한 세 자매 식재료 임베딩(Cooc·Core·Chem)을 통해 ‘화학 vs 레시피-맥락’을 조정 가능한 설계 축으로 만들고, 페어링과 SLERP 회전이라는 두 연산자로 임베딩 공간을 항해한다.

May 27, 2026 · 6 분 · 서소영

A Bitter Lesson for Data Filtering

컴퓨트가 충분히 크면 데이터 필터링은 오히려 손해다 — Stanford 연구진이 Common Crawl과 5개 표준 필터를 비교하여, 큰 모델이 ‘저품질’ 데이터에서도 이득을 본다는 증거를 제시한다.

May 27, 2026 · 5 분 · 서소영

SkillOpt: Executive Strategy for Self-Evolving Skills of Frozen LLM Agents

Microsoft가 공개한 SkillOpt는 모델 가중치를 동결한 채 자연어 기술 문서 한 장을 딥러닝 옵티마이저처럼 반복 학습하여 LLM 에이전트의 성능을 끌어올리는 텍스트 공간 최적화 프레임워크다. 채점 가능한 태스크에 한정되며, 6개 벤치마크 52/52 셀에서 최고 또는 공동 최고를 기록했다.

May 27, 2026 · 9 분 · 서소영

Most people's life satisfaction matches their personality traits: True correlations in multi-trait, multi-rater, multi-sample data

성격 5요인과 삶의 만족도(LS)의 상관은 단일-방법 연구에서 r ≈ .30에서 .65로 알려져 있었다. 자기보고와 정보제공자(informant) 보고를 교차 결합해 측정 오류·방법 편향을 제거했더니 ‘진짜 상관(r_true)‘은 .80에서 .90까지 올라갔다. 단 세 항목 — ‘오해받는다고 느낀다’, ‘흥미진진한 게 없다’, ‘결정을 미룬다’ — 만으로도 삶의 만족도를 r ≈ .80으로 예측한다.

May 22, 2026 · 6 분 · 서소영

Artificial Intelligence Tools Expand Scientists' Impact but Contract Science's Focus

1980부터 2025년까지 자연과학 논문 4,130만 편을 분석한 Nature 논문. AI를 쓰는 개별 과학자는 논문 3.02배·인용 4.84배·승진 1.37년 단축의 이점을 누리지만, 학문 전체로는 연구 주제가 4.63% 좁혀지고 후속 협업이 22% 줄어든다.

May 21, 2026 · 6 분 · 서소영

1930년에 멈춘 AI가 비추는 거울

현대 웹 데이터를 모두 빼고 1930년 이전 텍스트만으로 훈련한 13B 모델 talkie가 던지는 질문 — AI의 능력은 언어에서 오는가, 데이터에서 오는가.

April 28, 2026 · 5 분 · 서소영

영상을 정밀하게 말하는 법 — VideoSpec과 CHAI가 여는 길

AI 영상 생성의 진짜 병목은 모델이 아니라 언어다. 시네마틱 요소를 정밀하게 기술하는 VideoSpec과, ‘AI가 쓰고 인간이 검증하는’ CHAI 프레임워크가 소량의 전문가 비평만으로 오픈소스 8B 모델을 Gemini-2.5 위에 올려놓았다.

April 28, 2026 · 7 분 · 서소영

딥러닝에도 뉴턴이 올까

딥러닝은 왜 작동하는가? 14명의 연구자가 ‘학습 역학’이라는 이름으로 그 답의 윤곽을 그렸다.

April 27, 2026 · 10 분 · 서소영