multiclass_classification.py

import logging
import sys
from pathlib import Path
import PIL
import torch
import torch.nn as nn
import torch.nn.functional as F
import wandb
import utils 
from torch import optim
from torch.utils.data import DataLoader, random_split
from tqdm import tqdm
import random
import numpy as np
import warnings
from sklearn.metrics import average_precision_score, accuracy_score, balanced_accuracy_score
warnings.filterwarnings("ignore")
import pdb


def train_multiclass_classifier(args,net, train_loader, val_loader, test_loader,
              epochs: int = 100,
              batch_size: int = 16,
              learning_rate: float = 0.01,
              save_checkpoint: bool = True, wandb_log = None, split = 1):


    dir_checkpoint = Path('./checkpoints/')
    scale = tuple(float(i) for i in args.scale.split(","))
    if min(scale) == 0:
        scale = None

    best_f1 = 0.0

    
    # 4. Set up the optimizer, the loss, the learning rate scheduler 
    # optimizer = optim.SGD(net.parameters(), lr=learning_rate, weight_decay=5e-4, momentum=0.9)
    optimizer = optim.Adam(net.parameters(), lr=learning_rate, weight_decay=5e-4)
    scheduler = torch.optim.lr_scheduler.CosineAnnealingLR(optimizer, T_max=epochs)
   
    criterion = nn.CrossEntropyLoss()
    global_step = 0
    

    # 5. Begin training
    for epoch in range(1, epochs+1):
        net.train()
        epoch_loss = 0
        with tqdm(total=len(train_loader)*args.batch_size, desc=f'Epoch {epoch}/{epochs}', unit='img') as pbar:
            for images, labels, masks in train_loader:

                
                images = images.to(device=args.device, dtype=torch.float32)
                labels = labels.to(device=args.device, dtype=torch.long)

            
                outputs = net(images)
                optimizer.zero_grad()
                loss = criterion(outputs, labels)
                loss.backward()
                optimizer.step()

                _, predicted_target = outputs.max(1)
                
                epoch_loss += loss.item()
                pbar.update(images.shape[0])
                global_step += 1
                wandb.log({
                    'train loss': loss.item(),
                    'step': global_step,
                    'epoch': epoch
                })
                pbar.set_postfix(**{'loss (batch)': loss.item()})

        ### Evaluation round
        val_acc,f1score, class_report_pdf = evaluate(net,val_loader, args.device, args)
        scheduler.step()

        logging.info('Validation Accuracy: {}'.format(val_acc))
        logging.info('Validation f1score: {}'.format(f1score))

        wandb_log.log({
            'learning rate': optimizer.param_groups[0]['lr'],
            'validation Accuracy': val_acc,
            'validation F1score': f1score,
            'step': global_step,
            'epoch': epoch
        })   

        if best_f1 < f1score:
            best_f1 = f1score
            if save_checkpoint:
                Path(str(dir_checkpoint)+'/'+args.expt).mkdir(parents=True, exist_ok=True)
                torch.save(net.state_dict(), str(dir_checkpoint)+'/'+args.expt + '/'+ 'checkpoint'+str(split)+'.pth')
                logging.info(f'Checkpoint {epoch} saved!')
            

    net.load_state_dict(torch.load(str(dir_checkpoint)+'/'+args.expt + '/'+ 'checkpoint'+str(split)+'.pth'))
    
    
    test_acc, test_f1score, test_class_report_pdf = evaluate(net,test_loader, args.device, args)
    wandb_log.log({
            'learning rate': optimizer.param_groups[0]['lr'],
            'Test Accuracy': test_acc,
            'Test F1score': test_f1score,
        })   

    wandb_log.log({"examples": wandb.Image(class_report_pdf)})  
    

def evaluate(net, dataloader, device,args):
    net.eval()
    num_val_batches = len(dataloader)
    all_targets = []
    all_predictions = []

    # iterate over the validation set
    for image,labels, _ in tqdm(dataloader, total=num_val_batches, desc='Validation round', unit='batch', leave=False):
        
        # move images and labels to correct device and type
        image = image.to(device=device, dtype=torch.float32)
        labels = labels.to(device=device, dtype=torch.double)
       

        with torch.no_grad():
            outputs = net(image)
            _, predicted_target = outputs.max(1)

            all_targets.extend((labels.detach().cpu().numpy()))
            all_predictions.extend((predicted_target.detach().cpu().numpy()))   


    all_predictions = np.array(all_predictions)
    all_targets = np.array(all_targets)


    # compute overall accuracy
    acc = utils.accuracy_score(all_targets, all_predictions)

    # compute F1score
    f1score = utils.get_f1_score(all_targets,all_predictions, average= "weighted")

    # classification report
    class_report_pdf = utils.class_report(all_targets,all_predictions)

    net.train()
    return acc, f1score, class_report_pdf