[论文解读] Flavor Pairing in Medieval European Cuisine: A Study in Cooking with Dirty Data
本研究利用完整程度不同的两种化学标注食材数据库,检验了中世纪欧洲烹饪中的风味搭配假说。研究发现,数据质量对结论具有决定性影响:一种数据库支持中世纪食谱中存在风味搭配,而更完整的数据库则否定了这一结论,凸显了‘脏数据’如何在计算美食学研究中逆转分析结果。
An important part of cooking with computers is using statistical methods to create new, flavorful ingredient combinations. The flavor pairing hypothesis states that culinary ingredients with common chemical flavor components combine well to produce pleasant dishes. It has been recently shown that this design principle is a basis for modern Western cuisine and is reversed for Asian cuisine. Such data-driven analysis compares the chemistry of ingredients to ingredient sets found in recipes. However, analytics-based generation of novel flavor profiles can only be as good as the underlying chemical and recipe data. Incomplete, inaccurate, and irrelevant data may degrade flavor pairing inferences. Chemical data on flavor compounds is incomplete due to the nature of the experiments that must be conducted to obtain it. Recipe data may have issues due to text parsing errors, imprecision in textual descriptions of ingredients, and the fact that the same ingredient may be known by different names in different recipes. Moreover, the process of matching ingredients in chemical data and recipe data may be fraught with mistakes. Much of the `dirtiness' of the data cannot be cleansed even with manual curation. In this work, we collect a new data set of recipes from Medieval Europe before the Columbian Exchange and investigate the flavor pairing hypothesis historically. To investigate the role of data incompleteness and error as part of this hypothesis testing, we use two separate chemical compound data sets with different levels of cleanliness. Notably, the different data sets give conflicting conclusions about the flavor pairing hypothesis in Medieval Europe. As a contribution towards social science, we obtain inferences about the evolution of culinary arts when many new ingredients are suddenly made available.
研究动机与目标
- 检验风味搭配假说——即共享风味化合物的食材搭配良好——在中世纪欧洲烹饪中的适用性。
- 探究数据质量和不完整性对计算美食分析推断的影响。
- 使用相同的化学数据库,比较中世纪烹饪与现代地区性烹饪的风味搭配趋势。
- 评估哥伦布大交换对食材多样性及风味搭配模式的影响。
- 证明数据质量是计算美食创作中分析结果的根本决定因素。
提出的方法
- 从哥伦布时代以前的文献中收集并整理了中世纪欧洲食谱数据集。
- 使用两种不同的数据库将食谱中的食材映射到化学风味化合物:VCF(醋与柑橘类风味)和Fenaroli。
- 基于共享风味化合物计算成对食材的相似性,使用Jaccard相似性或等效方法。
- 生成随机食谱集合,以估计基线搭配频率,并与实际食谱进行比较。
- 对比两种化学数据库的结果,评估对数据质量的敏感性。
- 使用相同的资料处理流程,评估中世纪烹饪中风味搭配的强度相对于现代地区性烹饪的水平。
实验结果
研究问题
- RQ1当使用不完整的化学数据分析时,风味搭配假说是否适用于中世纪欧洲烹饪?
- RQ2选择不同的化学化合物数据库如何影响对历史食谱中风味搭配的推断?
- RQ3哥伦布大交换在多大程度上能够解释中世纪与现代烹饪之间风味搭配模式的变化?
- RQ4为何在相同分析框架下,使用不同完整程度的数据会得出相互矛盾的结果?
- RQ5仅凭数据质量是否足以逆转关于计算美食学中烹饪设计原则的结论?
主要发现
- 使用数据较少的VCF数据库时,研究发现中世纪欧洲烹饪中对风味搭配假说存在强有力支持。
- 使用更完整的Fenaroli数据库时,结果与假说相矛盾,显示食谱中未表现出共享风味化合物的食材有过度代表现象。
- 两种数据库中贡献最高的15种食材存在显著差异,VCF强调鱼类,而Fenaroli则包含更广泛的食材范围。
- 结果冲突主要归因于Fenaroli数据库中鱼类食材匹配不佳,未能将许多鱼类与相应的风味化合物关联。
- 尽管可用食材较少,中世纪厨师实现的风味搭配水平与现代西式烹饪相当,表明其烹饪设计具有明确的意图性。
- 本研究证明,数据质量与数据整理不仅是技术问题,还可能从根本上逆转计算美食学研究中的科学结论。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。