SweetPotato::Plagger このページをアンテナに追加 RSSフィード

2007-10-20

[] Web::Scraper for CF::Script コミックHOLIC  Web::Scraper for CF::Script コミックHOLIC - SweetPotato::Plagger を含むブックマーク はてなブックマーク -  Web::Scraper for CF::Script コミックHOLIC - SweetPotato::Plagger  Web::Scraper for CF::Script コミックHOLIC - SweetPotato::Plagger のブックマークコメント

コミックHOLICの各話を取得。

assets/plugins/CustomFeed-Script/comicholic.pl

#!/usr/bin/perl
use strict;
use warnings;
use utf8;

use URI;
use Web::Scraper;
use YAML;

my $url = 'http://www.toranoana.jp/webcomic/holic/';

my $s = scraper {
    process '//div[./a[@target="_blank"]]', 'comic[]' => scraper {
        process '/div/a',     link  => ['@href', sub { $_->as_string } ];
        process '/div/a/img', icon  => ['@src', sub { +{ url => $_->as_string } } ];
        process '/div',       title => 'text';
        result qw/link icon title/;
    };
    result qw/comic/;
};

binmode STDOUT, ':utf8';
print YAML::Dump +{
    title => 'コミックHOLIC',
    link  => $url,
    entry => $s->scrape(URI->new($url)),
};

config.yaml

plugins:
  - module: Subscription::Config
    config:
      feed:
        - url: 'script:/path/to/comicholic.pl'

  - module: CustomFeed::Script
トラックバック - http://plagger.g.hatena.ne.jp/SweetPotato/20071020