/ - Diff - BIEN 3 - NCEAS Projects

« Previous | Next »

Revision 18

Added by Aaron Marcuse-Kubitza about 13 years ago

Changed xml2db and data2xml to help standardize mapping to different XML formats

scripts/xml2db/xml_util.py
46	46	return True
47	47
48	48	def value(node):
49		if node.firstChild != None: return node.firstChild.nodeValue
	49	if node.firstChild != None: return node.firstChild.nodeValue.strip()
50	50	else: return None

scripts/data2xml/XpathParser.py
63	63
64	64	def _name(self): return self._match_re(r'[\w.]+', required=True)
65	65
66		def _value(self): return self._match_re(r'[\w\|]+', required=True)
	66	def _value(self): return self._match_re(r'[\w.\|]+', required=True)

             dest = sys.argv.pop(0)
             mappings_path = sys.argv.pop(0)
         except IndexError: raise Exception('Usage: '+prog_name
             +' dest_mappings_column mappings_path <dataset')
             +' dest_mappings_column mappings_path <dataset >output')
         # Get mappings
         mappings = {}
         has_type_containers = False # whether outer elements are type containiners
         stream = open(mappings_path, 'rb')
         reader = csv.reader(stream, delimiter=',', quotechar='"')
         fieldnames = reader.next()
-...
         for row in reader:
             name = row[0]
             path = row[dest_idx]
             if path != '':
             if name != '' and path != '':
                 if path.startswith('?'): path = path[1:]
                 path = path.replace('<name>', name)
                 path = re.sub(r'(?<=/)\*(?=s/(\w+))', r'\1', path)
                 path, repl_ct = re.subn(r'(?<=/)\*(?=s/(\w+))', r'\1', path)
                 if repl_ct > 0: has_type_containers = True # *s used for type elem
                 mappings[name] = XpathParser(path).parse()
         stream.close()
         if has_type_containers: id_level = 1
         else: id_level = 0
         # Process dataset
         doc = getDOMImplementation().createDocument(None, dest, None)
-...
         fieldnames = reader.next()
         row_idx = 0
         for row in reader:
             row_id = src+'_'+str(row_idx)
             row_id = str(row_idx)
             for idx, name in enumerate(fieldnames):
                 value = row[idx]
                 if value and name in mappings:
                 if value != '' and name in mappings:
                     path = deepcopy(mappings[name]) # don't modify main value!
                     path[1].attrs.append([XpathElem('id', row_id, is_attr=True)])
                     path[id_level].attrs.append([XpathElem('id', row_id,
                         is_attr=True)])
                     path[-1].value = value
                     by_path(doc, path, True)
             row_idx += 1

Also available in: Unified diff

Project

General

Profile

Revision 18

Added by Aaron Marcuse-Kubitza about 13 years ago