motociclettaの日記

2007-03-18

EFT - asahi.com 16:34

asahi.comGoogle ニュースからとってくることになるはずで,asahi_com.yamlデフォルトのまま,「サイエンス」の場合がちょっと異なるパターンになるのか…

asahi_com.yaml

handle: http://www\.asahi\.com/*/update/
extract: <!-- End of Headline --><div class="day">(.*?)</div>(.*?)<!-- google_ad_section_end
extract_capture: date body
extract_date_format: %Y年%m月%d日%H時%M分

asahi_science.yaml

handle: http://www\.asahi\.com/science/
extract: <!-- End of Headline --><p class="day">(.*?)</p>?.*?<div class="wrapkiji">(.*?)<!-- End of Kiji -->
extract_capture: date body
extract_date_format: %Y年%m月%d日