- はてなアンテナの「管理」→「データの管理」からOPMLをダウンロードする
- OPMLをfirefoxなどで開いてデータが正常なXMLか確認する
- 正規表現で置換ができるテキストエディタでOPMLを開いて編集する
bodyの子、outlineがそれぞれのアイテム
type="link"になっているものはRSSを配信していないページなのでそれを書き換える必要がある
具体的には
htmlUrl="([^"]+)?" type="link"
↓
htmlUrl="\1" type="rss" xmlUrl="http://rss-er.appspot.com/rss\?url=\1"
に置換
- livedoor Readerに書き換えたOPMLをインポートする
インポートが終わったら順次クロールされるよう
なかなかの負荷
負荷対策とノイズ除去が次の課題だ
- 注記
RSSの示す先のURLが死んでるとインポートしてもチェックで弾かれる
あれれー少ないぞー?と悩む前に
#!-*- coding:utf-8 -*- import os from urllib2 import urlopen f = open( os.path.join(os.path.dirname(__file__), 'source.txt') ) total = 0 success = 0 for url in f: total += 1 print 'try: %s' % url try: u = urlopen(url) if 200 == u.code: success += 1 except: pass print 'success rate: %s/%s' % (success, total)
みたいにチェックしとくと安心
- …あれれー?
利用状況 次回更新時に解約予定です。
有料オプションの有効期限 2009-04-18
現在のはてなポイント 484 ポイント (はてなポイント購入)
有料オプション月額 120 ポイント
うん、一日遅かったね!
珍しくオチがついた