/ - Diff - BIEN 3 - NCEAS Projects

« Previous | Next »

Revision 5590

Added by Aaron Marcuse-Kubitza about 12 years ago

sql_io.py: append_csv(): Take a reader and header rather than a stream_info and stream to allow callers to use the simpler csvs.reader_and_header() function. This also allows callers to pass in a wrapped CSV reader for filtering, etc.

     row_num_col_def.name = 'row_num'
     row_num_col_def.type = 'integer'
     def append_csv(db, table, stream_info, stream):
         assert sql.table_col_names(db, table) == stream_info.header
     def append_csv(db, table, reader, header):
         assert sql.table_col_names(db, table) == header
         def log(msg, level=1): db.log_debug(msg, level)
         dialect = stream_info.dialect
         # Wrap in standardizing stream
         cols_ct = len(stream_info.header)
         cols_ct = len(header)
         stream = csvs.InputRewriter(streams.ProgressInputStream(csvs.StreamFilter(
             csvs.ColCtFilter(csvs.make_reader(stream, dialect), cols_ct)),
             sys.stderr, msg='Read %d row(s)', n=1000))
             csvs.ColCtFilter(reader, cols_ct)), sys.stderr, msg='Read %d row(s)',
             n=1000))
         dialect = stream.dialect # use default dialect
         # Create COPY FROM statement
-...
         def log(msg, level=1): db.log_debug(msg, level)
         # Get format info
         info = csvs.stream_info(stream, parse_header=True)
         col_names = map(strings.to_unicode, info.header)
         reader, header = csvs.reader_and_header(stream)
         col_names = map(strings.to_unicode, header)
         for i, col in enumerate(col_names): # replace empty column names
             if col == '': col_names[i] = 'column_'+str(i)
-...
         sql.truncate(db, table)
         # Load the data
         def load(): append_csv(db, table, info, stream)
         def load(): append_csv(db, table, reader, header)
         sql.with_savepoint(db, load)
         cleanup_table(db, table)

             except tnrs.InvalidResponse: pass # skip set in case it caused error
             else:
                 log('Storing TNRS response data')
                 stream_info = csvs.stream_info(stream, parse_header=True)
                 sql_io.append_csv(db, tnrs_data, stream_info, stream)
                 sql_io.append_csv(db, tnrs_data, *csvs.reader_and_header(stream))
     main()

Also available in: Unified diff

Project

General

Profile

Revision 5590

Added by Aaron Marcuse-Kubitza about 12 years ago