カテゴリー
perlモジュール

LWP::SimpleでUserAgentを指定する

LWP::SimpleはUserAgentを指定出来ないという文書が多いけどどうやら指定出来るらしい。

use LWP::Simple qw/:DEFAULT $ua/;
$ua->agent('My UserAgent');

これでLWP::UserAgentまでもない場面でUserAgentが必要なときにも安心。

参考:LWP::Simple で UserAgent を変更する

カテゴリー
perlモジュール

perlでHTMLから本文を抜き出せるモジュール HTML::ExtractContent 他

HTMLから本文を抜き出せるモジュール

HTML::ExtractContent

作者:伊奈林太郎(id:tarao)
解説スライド:http://up.orezdnu.org/papers/Kansai.pm/2009-03-22/slide.pdf
参照:http://perl-mongers.org/2008/10/extract-content-from-html.html

HTML::ContentExtractor
参照:http://d.hatena.ne.jp/tohtas/20081102/1225642884

HTML::ContentExtractor + Lingua::JA::Summarize::Extract
参照:http://naoya.g.hatena.ne.jp/naoya/20070324/1174712425

HTML::Feature
参照:http://d.hatena.ne.jp/download_takeshi/20071026/1193410600

カテゴリー
perlモジュール

CGI::SpeedyCGI(PersistentPerl)によるPERLの実行速度アップ

SpeedyCGIの導入

# yum install perl-CGI-SpeedyCGI

※要rpmfogeの導入

概要:http://perldoc.jp/docs/modules/CGI-SpeedyCGI-2.21/SpeedyCGI.pod

MAXRUNS
コマンドライン    : -rN
環境変数       : SPEEDY_MAXRUNS
CGI::SpeedyCGI    : MAXRUNS
mod_speedycgi    : SpeedyMaxruns
デフォルト値     : 0 (つまり上限なし)?500? ※
説明:
PerlインタープリタはN回実行すると、終了する。

例)

#!/usr/bin/speedy -- -r500


500回実行するとプロセス終了。
グローバル変数も初期化される。


http://perldoc.jp/docs/modules/CGI-SpeedyCGI-2.21/SpeedyCGI.pod
では500とあるが、
http://homepage3.nifty.com/hippo2000/perltips/CGI/SpeedyCGI.htm
では0となっている。
500が正しいか?

使用する際の注意点

基本的にパスはフルパスで書かなければならない。

○良い例) /home/html/cgi-bin/xxx.cgi

×悪い例) ./xxx.cgi

全てのグローバル変数の値はクリアされない

プロセスが死ぬまで変数の値は引き継がれる。

サーバのリブートやApacheのリスタートが無く、プロセスが死なない事を仮定すると

$a += 1;

はずっと加算されていく事になる。

カテゴリー
perlモジュール

HTML::Mason

HTML::Mason というperlモジュールを検索中に発見。
どうやらphpのようにhtml中にperlを埋め込んで使うらしい。

後で調べてみよう。
てか、情報少なすぎなんだよな。。