書誌事項
- タイトル別名
-
- Pattern Discovery from Distributions of String Frequency
- モジレツ ノ ヒンド ブンプ ニ ヨル キョウツウ パタン ハッケン
この論文をさがす
抄録
パタンを定数と変数からなる文字列とする。パタン中の変数を定数文字列で置きかえて得られる文 字列をそのパタンから生成される語とする。本稿では、未知のパタンから生成された語の有限集合が 与えられた時に、そのパタンの定数部分を見つける問題(テンプレート発見問題) を考察する。未知 パタンの定数部分が適当な長さを持ち、変数へ代入される定数文字列が自然な確率分布に従っている ならば、パタンから生成される語において、定数部分と変数に代入された文字列の部分文字列の出現 頻度の差を利用してテンプレートを効率よく発見できることを示す。さらに、Web 上のHTML ファ イルでの予備的な実験結果を紹介する。
第72回情報学基礎研究会、第157回自然言語処理研究会(合同開催), September, 2003
収録刊行物
-
- 情報処理学会研究報告 : 自然言語処理
-
情報処理学会研究報告 : 自然言語処理 2003 (98), 25-32, 2003-09
東京 : 情報処理学会
- Tweet
キーワード
詳細情報 詳細情報について
-
- CRID
- 1050580007681075072
-
- NII論文ID
- 120006655053
- 110002948741
-
- NII書誌ID
- AN10539294
-
- ISSN
- 09196072
-
- HANDLE
- 2324/2968
-
- NDL書誌ID
- 6734372
-
- 本文言語コード
- ja
-
- 資料種別
- conference paper
-
- データソース種別
-
- IRDB
- NDL
- CiNii Articles