文字列データを対象としたデータ圧縮においては,辞書式圧縮と呼ばれる様々な手法が知られている.一般に,部分文字列の反復(繰り返し)が多いほど,文字列は圧縮されやすい傾向にあるため,LZ 分解などの文字列構造のサイズは,文字列の反復性を捉えた反復性指標と見なすことができる.最近では,String attractor や部分文字列複雑性に基づいた反復性指標が提案され,反復性への理解が進められているが,本申請課題では,辞書式圧縮とは直接関係のない Lyndon 文字列および関連する文字列構造を導入することで,新たな視点から反復性指標の解析を行い,その本質を明らかにする.