Hatena::Groupplagger

Plugin::mikan RSSフィード

 | 

2006-11-15

[]Filter::EntryFullText 切込隊長BLOG Filter::EntryFullText 切込隊長BLOG - Plugin::mikan を含むブックマーク はてなブックマーク - Filter::EntryFullText 切込隊長BLOG - Plugin::mikan Filter::EntryFullText 切込隊長BLOG - Plugin::mikan のブックマークコメント

取得自体は簡単なのですが、RSSの古い記事が削除されないらしく、今のところ2005/03/31からのエントリ総数470件。これを毎回読み込むのはちょっと…(Ruleで何とか出来るのでしょうか)。

kirikomi.yaml regex版

handle_force: http://column.chbox.jp/home/kiri/archives/blog/main/¥w+
extract: <h3>(.*?)</h3>.*?<h2>(.*?)</h2>.*?<div class="content">(.*?)</div>
extract_capture: date title body

kirikomi.yaml Xpath版(死ぬほど時間がかかりますが、一応)

handle_force: http://column.chbox.jp/home/kiri/archives/blog/main/¥w+
extract_xpath:
  date: //h3
  title: //h2
  body: //div[@class="content"]

 |