FrontPage  Index  Search  Changes  RSS  Login

[python]RSS/Atom関連

Universal Feed Parser

インストール

$ wget http://nchc.dl.sourceforge.net/sourceforge/feedparser/feedparser-4.1.zip
$ unzip feedparser-4.1.zip -d feedparser
$ cd feedparser
$ sudo python setup.py install

サンプル

sample_feedparser.py
import feedparser

feeds = {
    'rss10': 'http://blog.koshigoe.jp/index.rdf',
    'rss20': 'http://blog.koshigoe.jp/index.xml',
    'atom':  'http://blog.koshigoe.jp/atom.xml',
    }

for name in feeds:
    print 'loading %s ...' % name
    data = feedparser.parse(feeds[name])
    print '\tdetected     => ', data.version
    print '\tencoding     => ', data.encoding
    print '\tcontent-type => ', data.headers.get('content-type')
    print '\tfeed title   => ', data.feed.title
    print '\tentry title  => ', data.entries[0].title

実行結果

$ python sample_feedparser.py
loading rss10 ...
        detected     =>  rss10
        encoding     =>  utf-8
        content-type =>  application/rdf+xml
        feed title   =>  KoshigoeBLOG
        entry title  =>  Djangoのチュートリアルをやってみた
loading atom ...
        detected     =>  atom10
        encoding     =>  utf-8
        content-type =>  application/xml
        feed title   =>  KoshigoeBLOG
        entry title  =>  Djangoのチュートリアルをやってみた
loading rss20 ...
        detected     =>  rss20
        encoding     =>  utf-8
        content-type =>  application/xml
        feed title   =>  KoshigoeBLOG
        entry title  =>  Djangoのチュートリアルをやってみた
Last modified:2007/02/17 00:24:02
Keyword(s):[python]
References: