/ - Diff - BIEN 3 - NCEAS Projects

« Previous | Next »

Revision 4996

Added by Aaron Marcuse-Kubitza over 12 years ago

csv2db: Use new sql_io.import_csv()

     # When no command is specified, just cleans up the specified table.
     # The command may be run more than once.
     import csv
     import os.path
     import re
     import subprocess
     import sys
     sys.path.append(os.path.dirname(__file__)+"/../lib")
     import csvs
     import exc
     import opts
     import sql
-...
         table = sql_gen.Table(table, schema)
         use_copy_from = [True]
         use_copy_from = True
         # Loads data into the table using the currently-selected approach.
         def load():
             # Open input stream
             proc = subprocess.Popen(input_cmd, stdout=subprocess.PIPE, bufsize=-1)
             in_ = proc.stdout
             line_in = streams.ProgressInputStream(in_, sys.stderr, n=1000)
             # Get format info
             info = csvs.stream_info(in_, parse_header=True)
             dialect = info.dialect
             if csvs.is_tsv(dialect): use_copy_from[0] = False
             col_names = map(strings.to_unicode, info.header)
             for i, col in enumerate(col_names): # replace empty column names
                 if col == '': col_names[i] = 'column_'+str(i)
             # Select schema and escape names
             def esc_name(name): return db.esc_name(name)
             typed_cols = [sql_gen.TypedCol(v, 'text') for v in col_names]
             log('Creating table')
             sql.create_table(db, table, typed_cols, has_pkey=False,
                 col_indexes=False)
             def load_():
                 # Create COPY FROM statement
                 if use_copy_from[0]:
                     copy_from = ('COPY '+table.to_str(db)+' FROM STDIN DELIMITER '
                         +db.esc_value(dialect.delimiter)+' NULL '+db.esc_value(''))
                     assert not csvs.is_tsv(dialect)
                     copy_from += ' CSV'
                     if dialect.quoting != csv.QUOTE_NONE:
                         quote_str = db.esc_value(dialect.quotechar)
                         copy_from += ' QUOTE '+quote_str
                         if dialect.doublequote: copy_from += ' ESCAPE '+quote_str
                     copy_from += ';\n'
                 # Load the data
                 line_in = streams.ProgressInputStream(in_, sys.stderr, n=1000)
                 try:
                     if use_copy_from[0]:
                         log('Using COPY FROM')
                         log(copy_from, level=2)
                         db.db.cursor().copy_expert(copy_from, line_in)
                     else:
                         log('Using INSERT')
                         cols_ct = len(col_names)
                         for row in csvs.make_reader(line_in, dialect):
                             row = map(strings.to_unicode, row)
                             util.list_set_length(row, cols_ct) # truncate extra cols
                             sql.insert(db, table, row, cacheable=False, log_level=5)
                 finally:
                     line_in.close() # also closes proc.stdout
                     proc.wait()
                 if has_row_num: sql.add_row_num(db, table)
             sql.with_savepoint(db, load_)
             # Import data
             try: sql_io.import_csv(db, table, line_in, use_copy_from, has_row_num)
             finally:
                 line_in.close() # also closes proc.stdout
                 proc.wait()
         if input_cmd != []:
             try: load()
             except sql.DatabaseErrors, e:
                 if use_copy_from[0]: # first try
                 if use_copy_from: # first try
                     exc.print_ex(e, plain=True)
                     use_copy_from[0] = False
                     use_copy_from = False
                     load() # try again with different approach
                 else: raise
         sql_io.cleanup_table(db, table)
         else: sql_io.cleanup_table(db, table)
     main()

Also available in: Unified diff

Project

General

Profile

Revision 4996

Added by Aaron Marcuse-Kubitza over 12 years ago