rsserを使って、はてなアンテナからlivedoor Readerへ移行してみた

bodyの子、outlineがそれぞれのアイテム
type="link"になっているものはRSSを配信していないページなのでそれを書き換える必要がある
具体的には

htmlUrl="([^"]+)?" type="link"

htmlUrl="\1" type="rss" xmlUrl="http://rss-er.appspot.com/rss\?url=\1"

に置換


インポートが終わったら順次クロールされるよう



なかなかの負荷
負荷対策とノイズ除去が次の課題だ



  • 注記

RSSの示す先のURLが死んでるとインポートしてもチェックで弾かれる
あれれー少ないぞー?と悩む前に

#!-*- coding:utf-8 -*-
import os
from urllib2 import urlopen
f = open( os.path.join(os.path.dirname(__file__), 'source.txt') )
total   = 0
success = 0
for url in f:
	total += 1
	print 'try: %s' % url
	try:
		u = urlopen(url)
		if 200 == u.code:
			success += 1
	except:
		pass
print 'success rate: %s/%s' % (success, total)

みたいにチェックしとくと安心

  • …あれれー?

利用状況 次回更新時に解約予定です。
有料オプションの有効期限 2009-04-18
現在のはてなポイント 484 ポイント (はてなポイント購入)
有料オプション月額 120 ポイント


うん、一日遅かったね!
珍しくオチがついた