2009 1月28日

気になったのでとりあえずメモ

HTMLから本文を抜き出せるモジュール 
HTML::ExtractContent

参照:http://perl-mongers.org/2008/10/extract-content-from-html.html


類似モジュール
HTML::ContentExtractor

参照:http://d.hatena.ne.jp/tohtas/20081102/1225642884

HTML::ContentExtractor + Lingua::JA::Summarize::Extract
参照:http://naoya.g.hatena.ne.jp/naoya/20070324/1174712425


類似モジュール
HTML::Feature

参照:http://d.hatena.ne.jp/download_takeshi/20071026/1193410600


カテゴリー: perlモジュール - Trackback Uri



コメントする