perlでHTMLから本文を抜き出せるモジュール HTML::ExtractContent 他
- 2009.01.28
- perlモジュール
HTMLから本文を抜き出せるモジュール
HTML::ExtractContent
作者:伊奈林太郎(id:tarao)
解説スライド:http://up.orezdnu.org/papers/Kansai.pm/2009-03-22/slide.pdf
参照:http://perl-mongers.org/2008/10/extract-content-from-html.html
HTML::ContentExtractor
参照:http://d.hatena.ne.jp/tohtas/20081102/1225642884
HTML::ContentExtractor + Lingua::JA::Summarize::Extract
参照:http://naoya.g.hatena.ne.jp/naoya/20070324/1174712425
HTML::Feature
参照:http://d.hatena.ne.jp/download_takeshi/20071026/1193410600
-
前の記事
useでライブラリを重複呼び出した場合 2008.10.24
-
次の記事
ただ単にダミー画像をperlで表示するだけのルーチン 2009.02.02