SweetPotato::Plagger このページをアンテナに追加 RSSフィード

2007-02-09

[][] scraper for CustomFeed::Config CG定点観測  scraper for CustomFeed::Config CG定点観測 - SweetPotato::Plagger を含むブックマーク はてなブックマーク -  scraper for CustomFeed::Config CG定点観測 - SweetPotato::Plagger  scraper for CustomFeed::Config CG定点観測 - SweetPotato::Plagger のブックマークコメント

CG定点観測を解析し,日付ごとにエントリ化する。

id:Seacolorさん作のscraperは,正規表現版は最新2日分の記事を絵師サイトごとに,XPath版は最新日の記事をカテゴリごと(今日のネコミミ,今日のぱんちゅ,……)にエントリ化するのだけれど,私にとっては日付ごとにエントリ化された方が便利だったので作成。

assets/plugins/CustomFeed-Config/cgteiten.yaml

元はCSSで指定されている文字の大きさを再現するために extract_after_hook にて手入れ。

# author: SweetPotato
match: http://drag11\.(?:sakura\.ne\.jp|s6\.xrea\.com)/check/$
extract: <!--check\d{8}--><DIV CLASS="cap"><SPAN CLASS="cap-day">(.*?)</SPAN><A NAME="(.*?)">(.*?)</A></DIV>(.*?</DL>)
extract_capture: date link title body
extract_date_format: %Y/%m/%d
extract_date_timezone: Asia/Tokyo
extract_after_hook: |
  $data->{title} = $data->{date}.' '.$data->{title};
  $data->{link} = $feed->link.'#'.$data->{link};
  $data->{body} =~ s!<SPAN CLASS="drag11_big">!<SPAN STYLE="font-size: 200%; font-weight: bold;">!g;

config.cgteiten.yaml

  - module: Subscription::Config
    config:
      feed:
        - url: http://drag11.s6.xrea.com/check/
  - module: CustomFeed::Config
トラックバック - http://plagger.g.hatena.ne.jp/SweetPotato/20070209