/ - Diff - BIEN 3 - NCEAS Projects

« Previous | Next »

Revision 1179

Added by Aaron Marcuse-Kubitza about 13 years ago

bin/map: DB, CSV inputs: Use column indexes instead of column names to look up each field (optimization to avoid repeated dict lookups of the same key)

                 in_pkeys = {}
                 cur = sql.select(in_db, table=in_root, fields=None, conds=None,
                     limit=end, start=0)
                 col_names = list(sql.col_names(cur))
                 col_idxs = util.list_flip(col_names)
                 mappings_new = []
                 for i, mapping in enumerate(mappings):
                     in_, out = mapping
                     if metadata_value(in_) == None:
                         try: mapping = (col_idxs[in_], out)
                         except KeyError: continue
                     mappings_new.append(mapping)
                 mappings = mappings_new
                 def get_value(in_, row):
                     try: return util.cast(str, row[in_])
                     except KeyError: return None
                 col_names = list(sql.col_names(cur))
                 col_idxs = util.list_flip(col_names)
                     try: return util.cast(str, row.list[in_])
                     except IndexError: return None
                 def wrap_row(row): return util.ListDict(row, col_names, col_idxs)
                 row_ct = map_rows(get_value, util.WrapIter(wrap_row, sql.rows(cur)))
-...
             else: # input is CSV
                 map_ = dict(mappings)
                 reader = csv.reader(sys.stdin)
                 col_names = reader.next()
                 col_idxs = util.list_flip(col_names)
                 mappings_new = []
                 for i, mapping in enumerate(mappings):
                     in_, out = mapping
                     if metadata_value(in_) == None:
                         try: mapping = (col_idxs[in_], out)
                         except KeyError: continue
                     mappings_new.append(mapping)
                 mappings = mappings_new
                 def get_value(in_, row):
                     try: return util.none_if(row[in_], '')
                     except KeyError: return None
                 col_names = reader.next()
                 col_idxs = util.list_flip(col_names)
                     try: return util.none_if(row.list[in_], '')
                     except IndexError: return None
                 def wrap_row(row): return util.ListDict(row, col_names, col_idxs)
                 row_ct = map_rows(get_value, util.WrapIter(wrap_row, reader))

Also available in: Unified diff

Project

General

Profile

Revision 1179

Added by Aaron Marcuse-Kubitza about 13 years ago