
Persuading Large Language Models to Comply with Objectionable Requests
Cialdini의 일곱 설득 원칙을 프롬프트에 넣으면 LLM의 규제 약물 합성 요청 컴플라이언스가 35.3%에서 51.3%로 상승한다. PNAS 2026, 세 프런티어 모델 대상 126,000회 통제 실험.

Cialdini의 일곱 설득 원칙을 프롬프트에 넣으면 LLM의 규제 약물 합성 요청 컴플라이언스가 35.3%에서 51.3%로 상승한다. PNAS 2026, 세 프런티어 모델 대상 126,000회 통제 실험.
욕설을 많이 쓰는 사람일수록 정직하다. Feldman 등(2017)이 개인·온라인·사회 세 수준에서 일관되게 관찰한 결과. 단, 여기서의 ‘정직’은 자기 미화용 거짓말의 부재일 뿐, 윤리적 우월성이 아니다.