2009年1月

perlでHTMLから本文を抜き出せるモジュール HTML::ExtractContent 他

  • 2009.01.28

HTMLから本文を抜き出せるモジュール HTML::ExtractContent 作者:伊奈林太郎(id:tarao) 解説スライド:http://up.orezdnu.org/papers/Kansai.pm/2009-03-22/slide.pdf 参照:http://perl-mongers.org/2008/10/extract-content-from-html.html HTML::ContentExtractor 参照:http://d.hatena.ne.jp/tohtas/20081102/1225642884 HTML::ContentExtractor + Lingua: […]