投稿レシピの食材名から栄養価成分表へのアクティブラーニングによる効率的なマッピング

書誌事項

タイトル別名
  • A Mapping from Ingredient Names to Standard Tables of Food Composition and Its Efficient Construction via Active Learning

この論文をさがす

抄録

投稿型のレシピサイトでは数多くのレシピデータが構築される一方,表記の多様性により計算処理による分析の難しさがある.栄養価計算は一般にレシピに出現する食材に対して,栄養成分表の対応項目を見つけ出し栄養価を積算することで行われるが,別名や表記ゆれのため単なる文字列一致では計算処理により見つけ出すことは困難である.機械学習により食材名と栄養成分表の対応を見つけ出す場合,正解データを準備する必要があるが,これはすなわち大量の栄養価計算結果を準備することであり手間がかかる.本研究では,アクティブラーニングにより準備すべき栄養価計算結果を選定することにより効率的な正解データの作成とそれによる機械学習の性能向上を示す.アクティブラーニングによるデータ作成方法において,データ間の類似による選別方法を提案し,評価実験としてレシピの出現分布に沿ったランダムな抽出と比較を行い,少ないラベル付与数で精度の向上を確認した.

User posted recipe data and their web services are famous popular big-data. On the other hand, there are many name variations for ingredients, and it leads various problems to handle them by natural language processing. Calculation of nutrition value is the most important task for the recipe data and theirs web-service. For an ingredient on the posted recipes, it is difficult problem to find the correct entity from the nutrition table. In addition, we need huge volume of correct calculation of nutrition as training data for machine learning approach. We suggest an active learning method for this nutrition finding task in this paper. At first, we propose that word ranking method using only word similarity, then it is shown that an efficient algorithm to select unlabeled data for next annotation. In the evaluation, we have had higher performance comparing to the standard example selection method.

収録刊行物

詳細情報 詳細情報について

問題の指摘

ページトップへ