EntryFullText: hk.dmz-plus
Posted by HoLY on 2006年09月11日23:59 (JST)
HK-DMZ PLUS.COM をPlaggerで扱いたくなったので,EntryFullTextを見よう見まねで書いてみた.
author: HORII Keima
custom_feed_handle: http://hk.dmz-plus.com/
custom_feed_follow_link: a-news.cgi
handle_force: http://hk.dmz-plus.com/
extract: <p class=date\d?>(.*?)</p>(.*?)<hr size=3>
extract_capture: title body
custom_feed_follow_link がこれでいいのかすこぶる不安です.
include:
- /path/to/configs/config.yaml
plugins:
- module: Subscription::Config
config:
feed:
- url: http://hk.dmz-plus.com/
meta:
follow_link: /
- module: Filter::Rule
rule:
- module: Deduped
path: /path/to/cache/hk.db
- module: Filter::ResolveRelativeLink
- module: Filter::EntryFullText
config:
store_html_on_failure: 1
- module: Filter::BreakEntriesToFeeds
$feed->meta->{follow_link} もこれでいいんかいなとか.
EntryFullTextのyamlでcustomfeed_follow_linkが書いてあれば、Subscription::Configでmeta: follow_linkは必要ないです。
機能的に同じ物がSubscription::ConfigとEntryFullTextに入っている感じですね。
余談ですが、a-News.cgi汎用のEFTを書けばHK.DMZ-PLUS以外にも使えそうですね。
コメントありがとうございます。参考になります。
a-news.cgi を使ってるところは HK-DMZ PLUS.COM 以外知らなかったりしますが、汎用化はやってみようかと思います。