単語分散表現による類義語統一と単語N-gramによるフレーズ抽出に基づくセキュリティ要件分類手法

書誌事項

タイトル別名
  • Classification of Security Requirements Based on Unification of Synonyms Using Word Embedding and Extraction of Phrases Using N-gram

この論文をさがす

抄録

見落とされやすい非機能要件の特定を支援するために,非機能要件分類手法が提案されている.しかしながら,既存手法には(1)単語の類似性を考慮しておらず類似した単語で構成される要件文を異なる種類の品質特性を有する要件文と扱うことがある,(2)単語の順序関係を考慮しておらず同じ単語で構成されるが異なる意味を持つフレーズ(異なる品質特性を有する要件文)を同じものとして扱うことがある,という問題点がある.本研究では,単語の類似性と単語の順序関係を考慮することで,非機能要件分類手法の精度向上を目指す.単語の類似性を考慮するために,(1-A) シソーラスを用いた類義語の統一,(1-B) 単語分散表現を用いた類義語の統一の2つのアプローチをとる.単語の順序関係を考慮するために,(2-A) 固定長の単語N-gramをフレーズとして抽出する場合と(2-B)可変長の単語N-gram(N ≥ 1)をフレーズとして抽出する場合の2つのアプローチをとる.非機能要件のうち,セキュリティ要件の分類を対象とした評価実験の結果,提案手法は既存手法よりも精度が高くなることを確認した.また,教師ありアルゴリズムと分類対象のセキュリティ要件によって,精度が最も高い類義語統一処理とフレーズ抽出の組合せが異なることが分かった.

In order to identify easily-overlooked nonfunctional requirements, many automated classification methods for nonfunctional requirements have been proposed. Existing methods, however, have common shortcomings: (1) they does not consider similarities among words used in requirement documents and sometimes classify requirements described using similar words into different classes, and (2) they also does not consider order relations of words used in requirement documents and they sometimes classify requirements using different phrases with the same words into the same class. The goal of our study is to improve the classification accuracy by considering similarities and order relations among words used in requirement documents. Our method unifies synonyms in requirement documents by using (1-A) a thesaurus (SEThesaurus) and (1-B) word embeddings (Word2vec, fastText, and SO_Word2vec) to resolve the issue of similarities among words used in requirement documents. It also extracts phrases of (1) fixed-length word N-grams and (2) variable-length word N-gram (N ≥ 1) to resolve the issue of order relations of words used in requirement documents. As a result of a security classification experiment, our method outperformed the existing method and showed a combination of the synonym unification and the phrase extraction is different from properties of security requirements.

収録刊行物

詳細情報 詳細情報について

問題の指摘

ページトップへ