SweetPotato::Plagger このページをアンテナに追加 RSSフィード

2007-01-09

[][] scraper for CustomFeed::Config TINAMI ちえりリスト 01:06  scraper for CustomFeed::Config TINAMI ちえりリスト - SweetPotato::Plagger を含むブックマーク はてなブックマーク -  scraper for CustomFeed::Config TINAMI ちえりリスト - SweetPotato::Plagger  scraper for CustomFeed::Config TINAMI ちえりリスト - SweetPotato::Plagger のブックマークコメント

TINAMIのちえりリストを取得し,更新ページごとにエントリ化する。最新~過去24時間,過去24~48時間,RSS更新リストに対応。authorをセットするのでCustomFeed::Configは新しいものを使うこと。現時点での最新バージョンは0.02

assets/plugin/CustomFeed-Config/tinami_chierilist.yaml

神経質にも程があるextract。

# author: SweetPotato
match: http://www\.tinami\.com/chieri/list_(?:new|old|rss)_[a-e]\.html$
extract: <TD ROWSPAN=3 WIDTH=80 ALIGN="right" VALIGN="top">.*?<IMG SRC="(.*?)".*?<SPAN CLASS="chielink"><A HREF="(.*?)">\s*(.*?)\s*</A>.*?\n\s*(.*?)\s\x{3055}\x{3093}.*?</TD>.*?<TD ALIGN="left".*?>\s*(.*?\s.*?)\s.*?<TD ALIGN="left".*?>(.*?)</TD>
extract_capture: icon link title author date body
extract_date_format: %Y/%m/%d %H:%M:%S
extract_date_timezone: Asia/Tokyo
extract_after_hook: $data->{link} = 'http://www.tinami.com'.$data->{link}

assets/plugin/Filter-TruePermalink/tinami_launcher.yaml

おまけとして作成。Filter::TruePermalinkのためのassets。リダイレクタURLを本来のページそのもののURLに変換。使用はお好みで。

# author: SweetPotato
match: http://www\.tinami\.com/cgi-bin/launcher\?
query_param: URL

config.tinami_chierilist.yaml

上にも書いた通り,Filter::TruePermalinkの使用はお好みで。RSS更新リストを取得する場合はFilter::ResolveRelativeLinkを使うのが吉。

plugins:
  - module: Subscription::Config
    config:
      feed:
        - url: http://www.tinami.com/chieri/list_new_a.html
        - url: http://www.tinami.com/chieri/list_new_b.html
        - url: http://www.tinami.com/chieri/list_new_c.html
        - url: http://www.tinami.com/chieri/list_new_d.html
        - url: http://www.tinami.com/chieri/list_new_e.html
        - url: http://www.tinami.com/chieri/list_old_a.html
        - url: http://www.tinami.com/chieri/list_old_b.html
        - url: http://www.tinami.com/chieri/list_old_c.html
        - url: http://www.tinami.com/chieri/list_old_d.html
        - url: http://www.tinami.com/chieri/list_old_e.html
        - url: http://www.tinami.com/chieri/list_rss_a.html
        - url: http://www.tinami.com/chieri/list_rss_b.html
        - url: http://www.tinami.com/chieri/list_rss_c.html
        - url: http://www.tinami.com/chieri/list_rss_d.html
        - url: http://www.tinami.com/chieri/list_rss_e.html
  - module: CustomFeed::Config
  - module: Filter::ResolveRelativeLink
  - module: Filter::TruePermalink
トラックバック - http://plagger.g.hatena.ne.jp/SweetPotato/20070109