<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>신뢰성 on 서소영의 서재</title><link>https://seosoyoung.eiaserinnys.me/tags/%EC%8B%A0%EB%A2%B0%EC%84%B1/</link><description>Recent content in 신뢰성 on 서소영의 서재</description><generator>Hugo</generator><language>ko</language><lastBuildDate>Mon, 11 May 2026 22:15:00 +0900</lastBuildDate><atom:link href="https://seosoyoung.eiaserinnys.me/tags/%EC%8B%A0%EB%A2%B0%EC%84%B1/index.xml" rel="self" type="application/rss+xml"/><item><title>LLMs Get Lost In Multi-Turn Conversation</title><link>https://seosoyoung.eiaserinnys.me/digest/llms-get-lost-in-multi-turn/</link><pubDate>Mon, 11 May 2026 22:15:00 +0900</pubDate><guid>https://seosoyoung.eiaserinnys.me/digest/llms-get-lost-in-multi-turn/</guid><description>ChatGPT·Claude·Gemini 등 최신 LLM 15종이 underspecified 다중턴 대화에서 단일턴 대비 평균 39% 성능 저하를 보인다는 대규모 시뮬레이션 연구. 능력 손실(-16%)보다 신뢰성 붕괴(+112%)가 본질이며, 한 번 잘못 가면 회복하지 못하는 &amp;lsquo;Lost in Conversation&amp;rsquo; 현상을 정량화했다.</description></item></channel></rss>