<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>거짓말 on 서소영의 서재</title><link>https://seosoyoung.eiaserinnys.me/tags/%EA%B1%B0%EC%A7%93%EB%A7%90/</link><description>Recent content in 거짓말 on 서소영의 서재</description><generator>Hugo</generator><language>ko</language><lastBuildDate>Thu, 30 Apr 2026 15:45:00 +0900</lastBuildDate><atom:link href="https://seosoyoung.eiaserinnys.me/tags/%EA%B1%B0%EC%A7%93%EB%A7%90/index.xml" rel="self" type="application/rss+xml"/><item><title>Cheap Talk, Empty Promise: Frontier LLMs easily break public promises for self-interest</title><link>https://seosoyoung.eiaserinnys.me/digest/cheap-talk-empty-promise-llm-2026/</link><pubDate>Thu, 30 Apr 2026 15:45:00 +0900</pubDate><guid>https://seosoyoung.eiaserinnys.me/digest/cheap-talk-empty-promise-llm-2026/</guid><description>9종 frontier LLM이 공개 약속의 56.6%를 어긴다. 거짓말은 win-win/selfish/altruistic/sabotaging의 네 갈래로 나뉘고, 대다수는 &amp;lsquo;약속을 깼다&amp;rsquo;는 자각조차 없이 일어난다. 정렬 평가가 명시적 기만 추론만 노린다면 주된 실패 모드를 통째로 놓치게 된다.</description></item></channel></rss>