3줄 요약
- KAIKAKU.AI의 Radzikowski & Chen이 FlavorGraph의 식재료 임베딩을 LLM 큐레이션으로 정제하여 맛·질감·문화·영양 등 15개 독립 차원을 복원한 논문이다.
- 핵심 발견은 레시피 동시출현 패턴만으로 셰프의 암묵지(tacit knowledge)가 구조적으로 인코딩된다는 것이며, USDA 실측치와의 교차검증으로 LLM 라벨링 편향이 아님을 확인했다.
- 데이터 큐레이션이 모델 아키텍처 개선보다 더 큰 성능 향상을 가져온다는 data-centric AI 패러다임의 식품 도메인 검증 사례다.
배경: FlavorGraph와 그 한계
FlavorGraph(Park et al., 2021)는 100만 개 이상의 레시피와 1,561개 향미 분자 데이터로 학습한 300차원 그래프 임베딩이다. 약 6,653개 식재료 노드를 가지고 있지만, 원시 데이터에는 심각한 문제가 있다.
- 비식품 항목이 섞여 있다: 알루미늄 호일, 표백제, 이쑤시개 등
- 이름 불일치가 만연하다: “Kraft Sharp Cheddar Cheese"와 “cheddar"가 별도 노드
- 소고기(beef) 변형만 138종이 존재한다
Epicure는 이 노이즈를 정제하는 것만으로 잠재 구조가 극적으로 드러남을 보인다.
데이터 큐레이션 파이프라인
Gemini 기반 3단계 LLM 정규화 + 수동 QC로 6,653개를 1,032개 정본 항목으로 압축한다.
- Step 1 (단순화): 브랜드명·용량·조리법 제거. Jaccard 유사도 클러스터링 후 LLM 처리
- Step 2 (정제): keep/remove/consolidate 분류. 비식품 제거, 다국어 번역
- Step 3 (초정제): 450줄 도메인 규칙. 문화적 고유 식재료(자타르, 사워도우 등)는 보존
- Step 4 (수동 QC): 5~10% 항목 수정
- Step 5-6 (통합): 통합된 식재료의 새 임베딩은 원본 벡터들의 산술 평균
통합 후 임베딩이 원래 의미를 보존하는지가 관건인데, 대부분의 차원에서 상관계수가 상승하여 노이즈 제거 효과가 확인되었다.
15개 독립 차원의 복원
300차원 공간에서 선형 축(centroid-to-centroid)을 정의하고 투영하면 15개 독립 차원이 복원된다.
순서형 상관 (ρ, 모두 p<.001):
| 차원 | ρ | 특이사항 |
|---|---|---|
| 스코빌(매움) | 0.76 | 피망→하바네로 순서 정렬 |
| 기후대(위도) | 0.52 | 열대→아북극 |
| 감칠맛 | 0.48 | 미소·간장·파마산이 최상위 |
| 단맛 | 0.44 | |
| 짠맛 | 0.40 | |
| NOVA 가공 수준 | 0.37 |
이진 분리 (Cohen’s d, 모두 p<.001):
| 차원 | d |
|---|---|
| 수분 | 1.26 |
| 지방감 | 1.14 |
| 경도 | 1.05 |
| 신맛 | 0.88 |
| 쓴맛 | 0.79 |
모델은 고추를 본 적이 없고 스코빌이 무엇인지도 학습하지 않았지만, 잠재 공간의 단일 선형 방향이 피망에서 하바네로까지 ρ=0.76으로 정렬한다. 이소티오시아네이트 기반 매움(와사비, 겨자)은 정확하게 0 SHU로 분류된다.
맛 공간의 기하학: 토러스
UMAP 시각화에서 맛 공간은 선형이 아닌 토러스(고리) 형태의 다양체로 나타난다.
- 양극: 단맛(sweet)과 감칠맛(savoury)
- 다리 위의 이중 시민: 칠리, 감귤, 미소, 바닐라
셰프들이 경험적으로 “브릿지 재료"로 쓰는 것들이 기하학적으로도 실제 다리 위에 위치한다. 인터랙티브 3D 탐색기가 epicure-data.kaikaku.ai에서 제공된다.
화학·영양 교차검증
LLM 라벨링 편향 가능성을 차단하기 위해 USDA FoodData Central 실험실 측정값과 대조했다.
거시영양소 5종 (USDA 712개 매칭, LLM 무관여):
| 영양소 | ρ |
|---|---|
| 단백질 | 0.47 |
| 탄수화물 | 0.47 |
| 칼로리 | 0.47 |
| 섬유질 | 0.44 |
| 지방 | 0.44 |
맛-화학물질 대응 (FooDB):
- 당류 ↔ 단맛 축: ρ = 0.41
- 나트륨 ↔ 짠맛 축: ρ = 0.29
- 글루타민산 ↔ 감칠맛 축: ρ = 0.24
허브 절제(Hub Ablation): 신호의 출처 추적
FlavorGraph의 1,561개 훈련 화합물 중 수크로스(sucrose)와 나트륨(sodium)은 단 한 번도 등장하지 않는다. 즉 단맛과 짠맛은 화학 엣지가 아닌 레시피 동시출현만으로 학습되었다. 반면 감칠맛, 단백질, 지방은 화학 경로가 부분적으로 기여한다.
문화 클러스터링
7대 거시 문화권(일본, 동아시아, 동남아, 남아시아, 라틴아메리카, 지중해, 북대서양)이 kNN 순도 0.43(기준선 대비 6.2배)으로 클러스터링된다.
각 문화권의 고유 맛 지문:
- 일본: 감칠맛 +0.45
- 남아시아: 쓴맛 +0.31, 경도 +0.40
- 동남아: 매움 +0.20
- 지중해·북대서양: 지방감 +0.23 / +0.30
큐레이션 전후 비교에서 kNN 순도가 약 2배 상승했다(Wilcoxon p=0.008). 데이터 품질 개선이 문화적 구조의 가독성을 극적으로 높인다.
가장 흥미로운 지점
이 논문의 핵심 메시지는 “레시피에서 식재료가 함께 사용되는 패턴 자체가 셰프의 인지를 반영하는 충분통계량"이라는 것이다. Polanyi(1966)가 말한 암묵지 — 실천자가 유창하게 적용하지만 명시적 규칙으로 완전히 표현할 수 없는 전문 지식 — 가 동시출현 통계에서 계산적으로 복원된다.
word2vec가 단어 동시출현만으로 성별·지리·언어적 규칙성을 인코딩했듯이, FlavorGraph는 레시피 동시출현만으로 맛·문화·영양을 인코딩한다. 그리고 이 구조를 드러내는 데 가장 효과적인 수단은 더 좋은 모델이 아니라 더 깨끗한 데이터였다.
출처
Jakub Radzikowski, Josef Chen (KAIKAKU.AI), 2026년 4월 2일 원문: https://arxiv.org/abs/2604.22776 인터랙티브 3D 탐색기: https://epicure-data.kaikaku.ai