|
|
||
asahi.com も Google ニュースからとってくることになるはずで,asahi_com.yaml はデフォルトのまま,「サイエンス」の場合がちょっと異なるパターンになるのか…
handle: http://www\.asahi\.com/*/update/ extract: <!-- End of Headline --><div class="day">(.*?)</div>(.*?)<!-- google_ad_section_end extract_capture: date body extract_date_format: %Y年%m月%d日%H時%M分
handle: http://www\.asahi\.com/science/ extract: <!-- End of Headline --><p class="day">(.*?)</p>?.*?<div class="wrapkiji">(.*?)<!-- End of Kiji --> extract_capture: date body extract_date_format: %Y年%m月%d日