/ - Diff - BIEN 3 - NCEAS Projects

« Previous | Next »

Revision 177

Renamed join_maps to join

     #!/usr/bin/env python
     # Inner-joins two map spreadsheets A->B and B->C to A->C
     import csv
     import sys
     def main():
         try: _prog_name, map_1_path = sys.argv
         except ValueError:
             raise SystemExit('Usage: '+sys.argv[0]+' map_1 <map_0 >joined_map')
         # Get map 1
         map_1 = {}
         stream = open(map_1_path, 'rb')
         reader = csv.reader(stream)
         map_1_in, map_1_out = reader.next()[:2]
         for row in reader:
             if row[1] != '': map_1[row[0]] = row[1]
         stream.close()
         # Join map 1 to map 0
         reader = csv.reader(sys.stdin)
         writer = csv.writer(sys.stdout)
         cols = reader.next()
         if not cols[1] == map_1_in: raise SystemExit( 'Map error: '
             'Map 0 output column name doesn\'t match map 1 input column name')
         cols[1] = map_1_out
         writer.writerow(cols)
         for row in reader:
             try: row[1] = map_1[row[1]]
             except KeyError: continue # skip row
             writer.writerow(row)
     main()

     #!/usr/bin/env python
     # Inner-joins two map spreadsheets A->B and B->C to A->C
     import csv
     import sys
     def main():
         try: _prog_name, map_1_path = sys.argv
         except ValueError:
             raise SystemExit('Usage: '+sys.argv[0]+' map_1 <map_0 >joined_map')
         # Get map 1
         map_1 = {}
         stream = open(map_1_path, 'rb')
         reader = csv.reader(stream)
         map_1_in, map_1_out = reader.next()[:2]
         for row in reader:
             if row[1] != '': map_1[row[0]] = row[1]
         stream.close()
         # Join map 1 to map 0
         reader = csv.reader(sys.stdin)
         writer = csv.writer(sys.stdout)
         cols = reader.next()
         if not cols[1] == map_1_in: raise SystemExit('Map error: '
             'Map 0 output column name doesn\'t match map 1 input column name')
         cols[1] = map_1_out
         writer.writerow(cols)
         for row in reader:
             try: row[1] = map_1[row[1]]
             except KeyError: continue # skip row
             writer.writerow(row)
     main()

mappings/join_all_vegbank
7	7	for map in -VegX..csv; do
8	8	type="${map%.*}" # remove extension
9	9	type="${type#*.}" # remove up to last "."
10		../scripts/util/join_maps "VegX-VegBank.$type.csv" <"$map"\|\
	10	../scripts/util/join "VegX-VegBank.$type.csv" <"$map"\|\
11	11	../scripts/util/sort 1 >"${map/VegX/VegBank}" # sort on output col
12	12	done

Also available in: Unified diff