Hatena::Groupplagger

Plugin::mikan RSSフィード

2007-09-27

[]EFT らばQ EFT らばQ - Plugin::mikan を含むブックマーク はてなブックマーク - EFT らばQ - Plugin::mikan EFT らばQ - Plugin::mikan のブックマークコメント

# upgrade http://labaq.com/atom.xml
handle_force: http://labaq\.com/archives/\w+
extract: extract: (<h3 class="title">.*?)<div class="amazlet-box"
extract_capture: body

08/05/01更新。

2007-09-22

[]pya.yaml pya.yaml - Plugin::mikan を含むブックマーク はてなブックマーク - pya.yaml - Plugin::mikan pya.yaml - Plugin::mikan のブックマークコメント

pyaの(18+)は2007年7月31日で公開を停止したらしいので…。

# upgrade http://pya.cc/pyarss/rss2r0.xml
author: Masafumi Otsune
custom_feed_handle: http://pya\.cc/
custom_feed_follow_link: cnt2\.php\?uid=\d+
handle: http://pya\.cc/
extract: ((?:<(?:A Href|[iI]mg [sS]rc)=["']?http://125\.207\.177\.163/\d+/\w+/\w+\d+/[\d\w_/]+\.(?:gif|png|jpe?g|wmv)["']?[^>]*>)+)
extract_capture: body

extractのアドレスを変えただけですが、多分これで大丈夫だと思います。

2007-01-29

[]Filter::EntryFullText だから東京が好き!街のねこたち Filter::EntryFullText だから東京が好き!街のねこたち - Plugin::mikan を含むブックマーク はてなブックマーク - Filter::EntryFullText だから東京が好き!街のねこたち - Plugin::mikan Filter::EntryFullText だから東京が好き!街のねこたち - Plugin::mikan のブックマークコメント

Plagger/assets/plugins/Filter-EntryFullText/cats-blog_com.yaml

#http://www.cats-blog.com/?feed=atom
handle_force: http://www¥.cats¥-blog¥.com/¥w+
extract: <div class="storycontent">(.*?)<div class="feedback">
extract_capture: body

やっつけですが、とりあえず。

2006-11-25

[]Filter::EntryFullText Narinari.com Filter::EntryFullText Narinari.com - Plugin::mikan を含むブックマーク はてなブックマーク - Filter::EntryFullText Narinari.com - Plugin::mikan Filter::EntryFullText Narinari.com - Plugin::mikan のブックマークコメント

http://www.narinari.com/index.xml

Plagger/assets/plugins/Filter-EntryFullText/narinari.yaml

handle_force: http://www\.narinari\.com/Nd/\w+
extract: (<P>Web posted at: (\d{4}/\d\d/\d\d \d\d:\d\d)<br>.*?)<!
extract_capture: body date
extract_date_format: %y/%m/%d/ %H:%M

Plagger/assets/plugins/Filter-TruePermalink/xml.yaml

match: narinari\.com
rewrite: s/\?xml//g;

2006-11-23

[]Filter::EntryFullText Excite Bit コネタ Filter::EntryFullText Excite Bit コネタ - Plugin::mikan を含むブックマーク はてなブックマーク - Filter::EntryFullText Excite Bit コネタ - Plugin::mikan Filter::EntryFullText Excite Bit コネタ - Plugin::mikan のブックマークコメント

ExciteBit.yaml

handle_force: http://www\.excite\.co\.jp/News/bit/\w+
extract: (<font size=\-1>\[(.*?)\]</font>.*?)<br clear=left>
extract_capture: body date
extract_date_format: <font size=\-1>\[ %y年%m月%d日 %H時%M分 \]</font>

文字コードはShift_jis。

2006-11-15

[]Filter::EntryFullText 切込隊長BLOG Filter::EntryFullText 切込隊長BLOG - Plugin::mikan を含むブックマーク はてなブックマーク - Filter::EntryFullText 切込隊長BLOG - Plugin::mikan Filter::EntryFullText 切込隊長BLOG - Plugin::mikan のブックマークコメント

取得自体は簡単なのですが、RSSの古い記事が削除されないらしく、今のところ2005/03/31からのエントリ総数470件。これを毎回読み込むのはちょっと…(Ruleで何とか出来るのでしょうか)。

kirikomi.yaml regex版

handle_force: http://column.chbox.jp/home/kiri/archives/blog/main/¥w+
extract: <h3>(.*?)</h3>.*?<h2>(.*?)</h2>.*?<div class="content">(.*?)</div>
extract_capture: date title body

kirikomi.yaml Xpath版(死ぬほど時間がかかりますが、一応)

handle_force: http://column.chbox.jp/home/kiri/archives/blog/main/¥w+
extract_xpath:
  date: //h3
  title: //h2
  body: //div[@class="content"]

[]Filter::EntryFullText kajougenron(渦状言論) Filter::EntryFullText kajougenron(渦状言論) - Plugin::mikan を含むブックマーク はてなブックマーク - Filter::EntryFullText kajougenron(渦状言論) - Plugin::mikan Filter::EntryFullText kajougenron(渦状言論) - Plugin::mikan のブックマークコメント

ここは全文入りで配信してますが、改行が無くて読み辛いので。

/Plagger/assets/plugins/Filter-EntryFullText/hirokiazuma_com.yaml

handle_force: http://www¥.hirokiazuma¥.com/¥w+
extract_xpath:
  title: //h3[@class="entrytitle"]
  body: //div[@class="blogbody"]

ブログなど、構造が明確なものはXpathを使うと抽出が簡単です。

[]Filter::EntryFullText phpspot開発日誌 Filter::EntryFullText phpspot開発日誌 - Plugin::mikan を含むブックマーク はてなブックマーク - Filter::EntryFullText phpspot開発日誌 - Plugin::mikan Filter::EntryFullText phpspot開発日誌 - Plugin::mikan のブックマークコメント

/Plagger/assets/plugins/Filter-EntryFullText/phpspot_org.yaml

handle: http://phpspot.org/blog/archives/¥w+
extract_xpath:
  title: /html/body//div[@class='content']/h3
  body: /html/body//div[@class='entrybody']
  date: /html/body//div[@class='content']/h2

[]Filter::EntryFullText ネタフル Filter::EntryFullText ネタフル - Plugin::mikan を含むブックマーク はてなブックマーク - Filter::EntryFullText ネタフル - Plugin::mikan Filter::EntryFullText ネタフル - Plugin::mikan のブックマークコメント

/Plagger/assets/plugins/Filter-EntryFullText/netafull.yaml

handle: http://netafull.net/¥w+
extract: <h1>(.*?)</h1>(.*?)<div id="adsense">
extract_capture: title body

[]Filter::EntryFullText GIGAZINE Filter::EntryFullText GIGAZINE - Plugin::mikan を含むブックマーク はてなブックマーク - Filter::EntryFullText GIGAZINE - Plugin::mikan Filter::EntryFullText GIGAZINE - Plugin::mikan のブックマークコメント

GIGAZINEはRSSを全文配信してくれないよね。(´・ω・`) …というわけで、RSSからEFTで全文取得します。

/Plagger/assets/plugins/Filter-EntryFullText/gigazine.yaml

handle: http://gigazine.net/index.php¥?/news/comments/¥w+
extract: <h3 class="date">(.*?)</h3>.*?<h2 class="title">(.*?)</h2>(.*?)<br clear="all" />
extract_capture: date title body

f:id:acqua_alta:20061023225002j:image

全文取得できる上に、サイトのようにごちゃごちゃしてなくて圧倒的に見やすいです。これならGIGAZINEも悪くないかも?と思えてきます。ぜひお試しを。