]> git.decadent.org.uk Git - dak.git/blob - queue_rss.py
use python-debian for .changes parsing
[dak.git] / queue_rss.py
1 #!/usr/bin/python
2 # Generate two rss feeds for a directory with .changes file
3
4 # License: GPL v2 or later
5 # Author: Filippo Giunchedi <filippo@debian.org>
6 # Version: 0.4
7
8 import os
9 import os.path
10 import cPickle
11 import sys
12 import encodings.ascii
13 from email.Parser import HeaderParser
14 from optparse import OptionParser
15
16 import PyRSS2Gen
17
18 from debian_bundle.deb822 import Changes
19
20 inrss_filename = "changes_in.rss"
21 outrss_filename = "changes_out.rss"
22 db_filename = "status.db"
23
24 parser = OptionParser()
25 parser.set_defaults(queuedir="queue", outdir="out", datadir="status", max_entries="30")
26
27 parser.add_option("-q", "--queuedir", dest="queuedir",
28         help="The queue dir (%default)")
29 parser.add_option("-o", "--outdir", dest="outdir",
30         help="The output directory (%default)")
31 parser.add_option("-d", "--datadir", dest="datadir",
32         help="The data dir (%default)")
33 parser.add_option("-m", "--max-entries", dest="max_entries", type="int",
34         help="Max number of entries to keep (%default)")
35
36 class Status:
37     def __init__(self):
38         self.feed_in = PyRSS2Gen.RSS2(
39                        title = "Packages entering NEW",
40                        link = "http://ftp-master.debian.org/new.html",
41                        description = "Debian packages entering the NEW queue" )
42
43         self.feed_out = PyRSS2Gen.RSS2(
44                        title = "Packages leaving NEW",
45                        link = "http://ftp-master.debian.org/new.html",
46                        description = "Debian packages leaving the NEW queue" )
47
48         self.queue = {}
49
50 def utf2ascii(src):
51     """ Return an ASCII encoded copy of the input UTF-8 string """
52     try:
53         res = unicode(src, 'utf-8').encode('ascii', 'replace')
54     except UnicodeDecodeError:
55         res = None
56     return res
57
58 def purge_old_items(feed, max):
59     """ Purge RSSItem from feed, no more than max. """
60     if feed.items is None or len(feed.items) == 0:
61         return False
62
63     feed.items = feed.items[:max]
64     return True
65
66 def parse_changes(fname):
67     """ Parse a .changes file named fname.
68
69     Return {fname: parsed} """
70
71     m = Changes(open(fname))
72
73     wanted_fields = set(['Source', 'Version', 'Architecture', 'Distribution',
74                          'Date', 'Maintainer', 'Description', 'Changes'])
75
76     if not set(m.keys()).issuperset(wanted_fields):
77         return None
78
79     return {os.path.basename(fname): m}
80
81 def parse_queuedir(dir):
82     """ Parse dir for .changes files.
83
84     Return a dictionary {filename: parsed_file}"""
85
86     if not os.path.exists(dir):
87         return None
88
89     res = {}
90     for fname in os.listdir(dir):
91         if not fname.endswith(".changes"):
92             continue
93
94         parsed = parse_changes(os.path.join(dir, fname))
95         if parsed:
96             res.update(parsed)
97
98     return res
99
100 def add_rss_item(status, msg, direction):
101     if direction == "in":
102         feed = status.feed_in
103         title = "%s %s entered NEW" % (msg['Source'], msg['Version'])
104     elif direction == "out":
105         feed = status.feed_out
106         title = "%s %s left NEW" % (msg['Source'], msg['Version'])
107     else:
108         return False
109
110     description = "<pre>Description: %s\nChanges: %s\n</pre>" % \
111             (utf2ascii(msg['Description']), utf2ascii(msg['Changes']))
112
113     feed.items.insert(0,
114         PyRSS2Gen.RSSItem(
115             title,
116             pubDate = msg['Date'],
117 #            pubDate = now(),
118             description = description,
119             author = utf2ascii(msg['Maintainer']),
120             link = "http://ftp-master.debian.org/new/%s_%s.html" % \
121                     (msg['Source'], msg['Version'])
122         )
123     )
124
125 def update_feeds(curqueue, status):
126     # inrss -> append all items in curqueue not in status.queue
127     # outrss -> append all items in status.queue not in curqueue
128
129     for (name, parsed) in curqueue.items():
130         if not status.queue.has_key(name):
131             # new package
132             add_rss_item(status, parsed, "in")
133
134     for (name, parsed) in status.queue.items():
135         if not curqueue.has_key(name):
136             # removed package
137             add_rss_item(status, parsed, "out")
138
139
140
141 if __name__ == "__main__":
142
143     (settings, args) = parser.parse_args()
144
145     if not os.path.exists(settings.outdir):
146         sys.stderr.write("Outdir '%s' does not exists\n" % settings.outdir)
147         parser.print_help()
148         sys.exit(1)
149
150     if not os.path.exists(settings.datadir):
151         sys.stderr.write("Datadir '%s' does not exists\n" % settings.datadir)
152         parser.print_help()
153         sys.exit(1)
154
155     status_db = os.path.join(settings.datadir, db_filename)
156
157     try:
158         status = cPickle.load(open(status_db))
159     except IOError:
160         status = Status()
161
162     current_queue = parse_queuedir(settings.queuedir)
163     if not current_queue:
164         sys.stderr.write("Unable to scan queuedir '%s'\n" % settings.queuedir)
165         parser.print_help()
166         sys.exit(1)
167
168     update_feeds(current_queue, status)
169
170     purge_old_items(status.feed_in, settings.max_entries)
171     purge_old_items(status.feed_out, settings.max_entries)
172
173     feed_in_file = os.path.join(settings.outdir, inrss_filename)
174     feed_out_file = os.path.join(settings.outdir, outrss_filename)
175
176     try:
177         status.feed_in.write_xml(file(feed_in_file, "w+"), "utf-8")
178         status.feed_out.write_xml(file(feed_out_file, "w+"), "utf-8")
179     except IOError, why:
180         sys.stderr.write("Unable to write feeds: %s\n", why)
181         sys.exit(1)
182
183     status.queue = current_queue
184
185     try:
186         cPickle.dump(status, open(status_db, "w+"))
187     except IOError, why:
188         sys.stderr.write("Unable to save status: %s\n", why)
189         sys.exit(1)
190
191 # vim:et:ts=4