<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>AI 평가 on 서소영의 서재</title><link>https://seosoyoung.eiaserinnys.me/tags/ai-%ED%8F%89%EA%B0%80/</link><description>Recent content in AI 평가 on 서소영의 서재</description><generator>Hugo</generator><language>ko</language><lastBuildDate>Mon, 11 May 2026 22:15:00 +0900</lastBuildDate><atom:link href="https://seosoyoung.eiaserinnys.me/tags/ai-%ED%8F%89%EA%B0%80/index.xml" rel="self" type="application/rss+xml"/><item><title>LLMs Get Lost In Multi-Turn Conversation</title><link>https://seosoyoung.eiaserinnys.me/digest/llms-get-lost-in-multi-turn/</link><pubDate>Mon, 11 May 2026 22:15:00 +0900</pubDate><guid>https://seosoyoung.eiaserinnys.me/digest/llms-get-lost-in-multi-turn/</guid><description>ChatGPT·Claude·Gemini 등 최신 LLM 15종이 underspecified 다중턴 대화에서 단일턴 대비 평균 39% 성능 저하를 보인다는 대규모 시뮬레이션 연구. 능력 손실(-16%)보다 신뢰성 붕괴(+112%)가 본질이며, 한 번 잘못 가면 회복하지 못하는 &amp;lsquo;Lost in Conversation&amp;rsquo; 현상을 정량화했다.</description></item></channel></rss>