/ - Diff - Environment and organisms - NCEAS Projects

« Previous | Next »

Revision 48e49857

Added by Benoit Parmentier about 12 years ago

ID 48e4985770371e7f35e1bf7125a9495c93d5c441
Parent 3e1b1ed4
Child 0f602e87

GAM fusion function, calculation of validation metrics to follow predictions

     ##VALIDATION-ACCURACY ASSESSMENT
     #The interpolation is done first at the monthly add delta.
     #AUTHOR: Benoit Parmentier
     #DATE: 02/13/2013
     #Change this to allow explicitly arguments...
     #Arguments:
     #1)list of climatology files for all models...(365*nb of models)
     #2)data_s:training
     #3)data_v:testing
     #4)list of dates??
     #5)stack of covariates: not needed at this this stage
     #6)dst: data at the monthly time scale
     #Function used in the script
     calculate_accuracy_metrics<-function(i){
       ### Caculate accuracy metrics
       calc_val_metrics<-function(x,y){
         #This functions calculates accurayc metrics on given two vectors.
         #Arguments: list of fitted models, raster stack of covariates
         #Output: spatial grid data frame of the subset of tiles
         #s_sgdf<-as(r_stack,"SpatialGridDataFrame") #Conversion to spatial grid data frame
         residuals<-x-y
         mae<-mean(abs(residuals),na.rm=T)
         rmse<-sqrt(mean((residuals)^2,na.rm=T))
         me<-mean(residuals,na.rm=T)
         r<-cor(x,y,use="complete")
         m50<-median(residuals,na.rm=T)
         metrics_dat<-as.data.frame(cbind(mae,rmse,me,r,m50))
         names(metrics_dat)<-c("mae","rmse","me","r","m50")
         metrics_obj<-list(metrics_dat,as.data.frame(residuals))
         names(metrics_obj)<-c("metrics_dat","residuals")
         return(metrics_obj)
+      }
       calc_val_metrics_rast <-function(df,y_ref,pred_names){
+        #
         list_metrics<-vector("list",length(pred_names))
         list_residuals<-vector("list",length(pred_names))
         names(list_metrics)<-pred_names
         names(list_residuals)<-pred_names
         for (j in 1:length(pred_names)){
           pred_var<-pred_names[j]
           metrics<-calc_val_metrics(df[[pred_var]],df[[y_ref]])
           list_metrics[[j]]<-metrics[[1]]
           list_residuals[[j]]<-metrics[[2]]
+        }
         metrics_df<-do.call(rbind,list_metrics)
         metrics_df$pred_mod <- pred_names #adding name column
         residuals_df<-do.call(cbind,list_residuals) #creating data frame for residuals
         names(residuals_df)<-paste("res",pred_names,sep="_")
         accuracy_obj<-list(metrics_df,residuals_df) #output object
         names(accuracy_obj)<-c("metrics","residuals")
         return(accuracy_obj)
+      }
       ## BEGIN ##
       day_list <-rast_day_yearlist[[i]] #list of prediction for the current date...
       names_mod<-names(day_list)
       #this needs to be changed...this must be assigned earlier
     #  names(day_list)<-c("mod1","mod2","mod3","mod4","mod_kr")
     #  obj_names<-c(y_var_name,"clim","delta","data_s","sampling_dat","data_v",
     #               ,model_name)
     #  names(gam_fus_mod[[i]])
+      #
       data_v <- gam_fus_mod[[i]]$data_v
       data_s <- gam_fus_mod[[i]]$data_s
       rast_day_mod <- stack(day_list)
       names(rast_day_mod) <- names(day_list)
       extract_data_v<-extract(rast_day_mod,data_v,df=TRUE)
       extract_data_s<-extract(rast_day_mod,data_s,df=TRUE)
       data_v <-spCbind(data_v,extract_data_v) #should match IDs before joining for good practice
       data_s <-spCbind(data_s,extract_data_s)
       ns<-nrow(data_s) # some loss of data might have happened because of the averaging...
       nv<-nrow(data_v)
       sampling_dat_day<-(gam_fus_mod[[i]])$sampling_dat
       metrics_v_obj<-calc_val_metrics_rast(data_v,y_var_name,names_mod)
       metrics_s_obj<-calc_val_metrics_rast(data_s,y_var_name,names_mod)
       #add sampling dat info...
       N=length(names_mod)
       run_info<-cbind(sampling_dat_day,n=nv)
       run_info[rep(seq_len(nrow(run_info)), each=N),] #repeating same row n times
       metrics_v_df<-cbind(metrics_v_obj$metrics,run_info)
       run_info<-cbind(sampling_dat_day,n=ns)
       run_info[rep(seq_len(nrow(run_info)), each=N),]
       metrics_s_df<-cbind(metrics_s_obj$metrics,run_info)
       data_v<-spCbind(data_v,metrics_v_obj$residuals)
       data_s<-spCbind(data_s,metrics_s_obj$residuals)
       validation_obj<-list(metrics_s_df,metrics_v_df,data_s,data_v)
       names(validation_obj)<-c("metrics_s","metrics_v","data_s","data_v")
       return(validation_obj)
+    }
     ####################################
     ############ END OF SCRIPT #########

Also available in: Unified diff

Project

General

Profile

Revision 48e49857

Added by Benoit Parmentier about 12 years ago