<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>추론 on 서소영의 서재</title><link>https://seosoyoung.eiaserinnys.me/tags/%EC%B6%94%EB%A1%A0/</link><description>Recent content in 추론 on 서소영의 서재</description><generator>Hugo</generator><language>ko</language><lastBuildDate>Fri, 22 May 2026 21:30:00 +0900</lastBuildDate><atom:link href="https://seosoyoung.eiaserinnys.me/tags/%EC%B6%94%EB%A1%A0/index.xml" rel="self" type="application/rss+xml"/><item><title>physics-intern: an autonomous agentic framework for physics research</title><link>https://seosoyoung.eiaserinnys.me/digest/physics-intern-critpt-2026/</link><pubDate>Fri, 22 May 2026 21:30:00 +0900</pubDate><guid>https://seosoyoung.eiaserinnys.me/digest/physics-intern-critpt-2026/</guid><description>Hugging Face가 공개한 멀티에이전트 프레임워크 physics-intern은 9개 전문 에이전트와 적대적 검토 루프로 이론물리학 벤치마크 CritPt에서 31.4%를 기록해 GPT 5.5 Pro(30.6%)를 넘어섰다 — 스케일 대신 비계(scaffolding)로 프론티어를 추월한 사례.</description></item><item><title>AI에게 처음 보는 게임을 시키면 벌어지는 일</title><link>https://seosoyoung.eiaserinnys.me/posts/arc-agi-3-how-ai-fails/</link><pubDate>Sat, 02 May 2026 16:00:00 +0900</pubDate><guid>https://seosoyoung.eiaserinnys.me/posts/arc-agi-3-how-ai-fails/</guid><description>ARC Prize가 GPT-5.5와 Opus 4.7에게 한 번도 본 적 없는 게임 135개를 던졌다. 둘 다 1%도 못 풀었지만, 진짜 발견은 점수가 아니라 틀리는 방식의 차이였다.</description></item><item><title>Analyzing GPT-5.5 &amp; Opus 4.7 with ARC-AGI-3</title><link>https://seosoyoung.eiaserinnys.me/digest/arc-agi-3-gpt55-opus47/</link><pubDate>Sat, 02 May 2026 13:50:00 +0900</pubDate><guid>https://seosoyoung.eiaserinnys.me/digest/arc-agi-3-gpt55-opus47/</guid><description>ARC Prize가 GPT-5.5와 Opus 4.7을 ARC-AGI-3으로 평가한 분석 보고서. 두 모델 모두 1% 미만의 점수를 기록했지만, 진짜 발견은 점수가 아니라 실패의 질적 차이에 있다.</description></item><item><title>추론의 벽이 깨지고 있다 — 루프 트랜스포머와 뇌의 우연한 수렴</title><link>https://seosoyoung.eiaserinnys.me/posts/loop-transformer-thalamus/</link><pubDate>Tue, 21 Apr 2026 23:10:00 +0900</pubDate><guid>https://seosoyoung.eiaserinnys.me/posts/loop-transformer-thalamus/</guid><description>AI가 추론을 흉내 내는 시대가 끝나고 있다. 루프 트랜스포머는 뇌의 시상-피질 루프와 독립적으로 같은 해법에 도달했다. 이것이 AGI의 문턱인 이유를 이야기한다.</description></item></channel></rss>