2015年03月22日

文字列の特定単語の前後にタグを付ける

文字列の中の特定単語の前後にタグを追加したい場合、単語に変更がなければ正規表現などで置換すればできます。しかし、単語が自由に登録、削除でき、順番もばらばらで似たような単語が多くある場合、単純な置換だけだと、漏れがでる場合があります。

例 単語が以下のように登録されている場合


春分
秋分

文字列が、"春は春分、秋は秋分" の場合、登録されている順番に正規表現で置換すると、”春”、”秋”で置換されて、”<b></b><b></b>分、<b></b><b></b>分”になってしまいます。

求めるのは、"<b></b><b>春分</b><b>秋</b>は<b>秋分</b>"で、登録単語の順番を変えれば、正規表現と置換で簡単にできますが、求めるのは、どのような単語の組み合わせにも対応できるものです。

とりあえずネットで検索してみましたが、上手く見つからなかったので、作ってみました。
https://github.com/ajisaba/WordMarker

他に何かいい方法が無いか、また調べたいと思います。
posted by jun1 at 21:36| Comment(0) | TrackBack(0) | ソフト