Spikey/main.py

import os
import torch
import torch.nn as nn
import numpy as np
import random, math
from utils import visualize_prediction, plot_delta_distribution
from data_processing import download_and_extract_data, load_all_wavs, split_data_by_time, compute_topology_metrics
from models import LatentFCProjector, LatentRNNProjector, LatentFourierProjector,MiddleOut, Predictor
from bitstream import IdentityEncoder, ArithmeticEncoder, Bzip2Encoder
import wandb
from pycallgraph2 import PyCallGraph
from pycallgraph2.output import GraphvizOutput
from slate import Slate, Slate_Runner

device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
#device = 'cpu'

class SpikeRunner(Slate_Runner):
    def setup(self, name):
        print("Setup SpikeRunner")

        self.name = name
        slate, config = self.slate, self.config

        training_config = slate.consume(config, 'training', expand=True)
        data_config = slate.consume(config, 'data', expand=True)

        data_url = slate.consume(data_config, 'url')
        cut_length = slate.consume(data_config, 'cut_length', None)
        download_and_extract_data(data_url)
        all_data = load_all_wavs('data', cut_length)

        split_ratio = slate.consume(data_config, 'split_ratio', 0.5)
        self.train_data, self.test_data = split_data_by_time(all_data, split_ratio)

        print("Reconstructing thread topology")
        self.topology_matrix = compute_topology_metrics(self.train_data)

        # Number of peers for message passing
        self.num_peers = slate.consume(config, 'middle_out.num_peers')

        # Precompute sorted indices for the top num_peers correlated leads
        print("Precomputing sorted peer indices")
        self.sorted_peer_indices = np.argsort(-self.topology_matrix, axis=1)[:, :self.num_peers]

        # Model setup
        print("Setting up models")
        latent_projector_type = slate.consume(config, 'latent_projector.type', default='fc')
        latent_size = slate.consume(config, 'latent_projector.latent_size')
        input_size = slate.consume(config, 'latent_projector.input_size')
        region_latent_size = slate.consume(config, 'middle_out.region_latent_size')

        if latent_projector_type == 'fc':
            self.projector = LatentFCProjector(latent_size=latent_size, input_size=input_size, **slate.consume(config, 'latent_projector', expand=True)).to(device)
        elif latent_projector_type == 'rnn':
            self.projector = LatentRNNProjector(latent_size=latent_size, input_size=input_size, **slate.consume(config, 'latent_projector', expand=True)).to(device)
        elif latent_projector_type == 'fourier':
            self.projector = LatentFourierProjector(latent_size=latent_size, input_size=input_size, **slate.consume(config, 'latent_projector', expand=True)).to(device)

        self.middle_out = MiddleOut(latent_size=latent_size, region_latent_size=region_latent_size, num_peers=self.num_peers, **slate.consume(config, 'middle_out', expand=True)).to(device)
        self.predictor = Predictor(region_latent_size=region_latent_size, **slate.consume(config, 'predictor', expand=True)).to(device)

        # Training parameters
        self.input_size = input_size
        self.epochs = slate.consume(training_config, 'epochs')
        self.batch_size = slate.consume(training_config, 'batch_size')
        self.num_batches = slate.consume(training_config, 'num_batches')
        self.learning_rate = slate.consume(training_config, 'learning_rate')
        self.eval_freq = slate.consume(training_config, 'eval_freq')
        self.save_path = slate.consume(training_config, 'save_path')

        # Evaluation parameter
        self.full_compression = slate.consume(config, 'evaluation.full_compression', default=False)

        # Bitstream encoding
        bitstream_type = slate.consume(config, 'bitstream_encoding.type', default='identity')
        if bitstream_type == 'identity':
            self.encoder = IdentityEncoder()
        elif bitstream_type == 'arithmetic':
            self.encoder = ArithmeticEncoder()
        elif bitstream_type == 'bzip2':
            self.encoder = Bzip2Encoder()

        # Optimizer
        self.optimizer = torch.optim.Adam(list(self.projector.parameters()) + list(self.middle_out.parameters()) + list(self.predictor.parameters()), lr=self.learning_rate)
        self.criterion = torch.nn.MSELoss()
        print("SpikeRunner initialization complete")

    def run(self, run, forceNoProfile=False):
        if self.slate.consume(self.config, 'profiler.enable', False) and not forceNoProfile:
            print('{PROFILER RUNNING}')
            with PyCallGraph(output=GraphvizOutput(output_file=f'./profiler/{self.name}.png')):
                self.run(run, forceNoProfile=True)
            print('{PROFILER DONE}')
            return
        
        self.train_model()

    def train_model(self):
        min_length = min([len(seq) for seq in self.train_data])
 
        best_test_score = float('inf')

        for epoch in range(self.epochs):
            total_loss = 0
            errs = []
            rels = []
            for batch_num in range(self.num_batches):

                # Create indices for training data and shuffle them
                indices = list(range(len(self.train_data)))
                random.shuffle(indices)

                stacked_segments = []
                peer_metrics = []
                targets = []

                for idx in indices[:self.batch_size]:
                    lead_data = self.train_data[idx][:min_length]

                    # Slide a window over the data with overlap
                    stride = max(1, self.input_size // 3)  # Ensuring stride is at least 1
                    for i in range(0, len(lead_data) - self.input_size-1, stride):
                        lead_segment = lead_data[i:i + self.input_size]
                        inputs = torch.tensor(lead_segment, dtype=torch.float32).to(device)

                        # Collect the segments for the current lead and its peers
                        peer_segments = []
                        for peer_idx in self.sorted_peer_indices[idx]:
                            peer_segment = self.train_data[peer_idx][i:i + self.input_size]
                            peer_segments.append(torch.tensor(peer_segment, dtype=torch.float32).to(device))
                        peer_metric = torch.tensor([self.topology_matrix[idx, peer_idx] for peer_idx in self.sorted_peer_indices[idx]], dtype=torch.float32).to(device)
                        peer_metrics.append(peer_metric)

                        # Stack the segments to form the batch
                        stacked_segment = torch.stack([inputs] + peer_segments).to(device)
                        stacked_segments.append(stacked_segment)
                        target = lead_data[i + self.input_size + 1]
                        targets.append(target)

                # Pass the batch through the projector
                latents = self.projector(torch.stack(stacked_segments))

                my_latent = latents[:, 0, :]
                peer_latents = latents[:, 1:, :]

                # Pass through MiddleOut
                new_latent = self.middle_out(my_latent, peer_latents, torch.stack(peer_metrics))
                prediction = self.predictor(new_latent)

                # Calculate loss and backpropagate
                tar = torch.tensor(targets, dtype=torch.float32).unsqueeze(-1).to(device)
                loss = self.criterion(prediction, tar)
                err = np.sum(np.abs(prediction.cpu().detach().numpy() - tar.cpu().detach().numpy()))
                rel = err / np.sum(tar.cpu().detach().numpy())
                total_loss += loss.item()
                errs.append(err.item())
                rels.append(rel.item())
                self.optimizer.zero_grad()
                loss.backward()
                self.optimizer.step()

            tot_err = sum(errs)/len(errs)
            tot_rel = sum(rels)/len(rels)
            wandb.log({"epoch": epoch, "loss": total_loss, "err": tot_err, "rel": tot_rel}, step=epoch)
            print(f'Epoch {epoch + 1}/{self.epochs}, Loss: {total_loss}')

            if self.eval_freq != -1 and (epoch + 1) % self.eval_freq == 0:
                print(f'Starting evaluation for epoch {epoch + 1}')
                test_loss = self.evaluate_model(epoch)
                if test_loss < best_test_score:
                    best_test_score = test_loss
                    self.save_models(epoch)
                print(f'Evaluation complete for epoch {epoch + 1}')


                wandb.log({"epoch": epoch, "loss": total_loss}, step=epoch)
                print(f'Epoch {epoch + 1}/{self.epochs}, Loss: {total_loss}')

                if (epoch + 1) % self.eval_freq == 0:
                    print(f'Starting evaluation for epoch {epoch + 1}')
                    test_loss = self.evaluate_model(epoch)
                    if test_loss < best_test_score:
                        best_test_score = test_loss
                        self.save_models(epoch)
                    print(f'Evaluation complete for epoch {epoch + 1}')


    def evaluate_model(self, epoch):
        print('Evaluating model...')
        self.projector.eval()
        self.middle_out.eval()
        self.predictor.eval()

        total_loss = 0
        all_true = []
        all_predicted = []
        all_deltas = []
        compression_ratios = []
        exact_matches = 0
        total_sequences = 0

        with torch.no_grad():
            for lead_idx in range(len(self.test_data[:8])):
                lead_data = self.test_data[lead_idx]
                true_data = []
                predicted_data = []
                delta_data = []
                targets = []

                min_length = min([len(seq) for seq in self.test_data])

                # Initialize lists to store segments and peer metrics
                stacked_segments = []
                peer_metrics = []

                for i in range(0, len(lead_data) - self.input_size-1, self.input_size // 8):
                    lead_segment = lead_data[i:i + self.input_size]
                    inputs = torch.tensor(lead_segment, dtype=torch.float32).to(device)

                    # Collect peer segments and metrics
                    peer_segments = []
                    for peer_idx in self.sorted_peer_indices[lead_idx]:
                        peer_segment = self.test_data[peer_idx][i:i + self.input_size][:min_length]
                        peer_segments.append(torch.tensor(peer_segment, dtype=torch.float32).to(device))
                    peer_metric = torch.tensor([self.topology_matrix[lead_idx, peer_idx] for peer_idx in self.sorted_peer_indices[lead_idx]], dtype=torch.float32).to(device)
                    peer_metrics.append(peer_metric)

                    # Stack segments to form the batch
                    stacked_segment = torch.stack([inputs] + peer_segments).to(device)
                    stacked_segments.append(stacked_segment)
                    target = lead_data[i + self.input_size + 1]
                    targets.append(target)

                # Pass the batch through the projector
                latents = self.projector(torch.stack(stacked_segments))

                my_latents = latents[:, 0, :]
                peer_latents = latents[:, 1:, :]

                # Pass through MiddleOut
                new_latents = self.middle_out(my_latents, peer_latents, torch.stack(peer_metrics))

                # Predict using the predictor
                predictions = self.predictor(new_latents)

                # Compute loss and store true and predicted data
                for i, segment in enumerate(stacked_segments):
                    for t in range(self.input_size):
                        target = torch.tensor(targets[i])
                        true_data.append(target.cpu().numpy())
                        predicted_data.append(predictions[i].cpu().numpy())
                        delta_data.append((target - predictions[i]).cpu().numpy())

                        loss = self.criterion(predictions[i].cpu(), target)
                        total_loss += loss.item()

                # Append true and predicted data for this lead sequence
                all_true.append(true_data)
                all_predicted.append(predicted_data)
                all_deltas.append(delta_data)

                if self.full_compression:
                    # Bitstream encoding
                    self.encoder.build_model(my_latents.cpu().numpy())
                    compressed_data = self.encoder.encode(my_latents.cpu().numpy())
                    decompressed_data = self.encoder.decode(compressed_data, len(my_latents))
                    compression_ratio = len(my_latents) / len(compressed_data)
                    compression_ratios.append(compression_ratio)

                    # Check if decompressed data matches the original data
                    if np.allclose(my_latents.cpu().numpy(), decompressed_data, atol=1e-5):
                        exact_matches += 1
                    total_sequences += 1

        avg_loss = total_loss / len(self.test_data)
        print(f'Epoch {epoch+1}, Evaluation Loss: {avg_loss}')
        wandb.log({"evaluation_loss": avg_loss}, step=epoch)

        # Visualize delta distribution
        delta_plot_path = plot_delta_distribution(np.concatenate(all_deltas), epoch)
        wandb.log({"delta_distribution": wandb.Image(delta_plot_path)}, step=epoch)

        if self.full_compression:
            avg_compression_ratio = sum(compression_ratios) / len(compression_ratios)
            exact_match_percentage = (exact_matches / total_sequences) * 100
            print(f'Epoch {epoch+1}, Average Compression Ratio: {avg_compression_ratio}')
            print(f'Epoch {epoch+1}, Exact Match Percentage: {exact_match_percentage}%')
            wandb.log({"average_compression_ratio": avg_compression_ratio}, step=epoch)
            wandb.log({"exact_match_percentage": exact_match_percentage}, step=epoch)

        print('Evaluation done for this epoch.')
        return avg_loss

    def save_models(self, epoch):
        return
        print('Saving models...')
        torch.save(self.projector.state_dict(), os.path.join(self.save_path, f"best_projector_epoch_{epoch+1}.pt"))
        torch.save(self.middle_out.state_dict(), os.path.join(self.save_path, f"best_middle_out_epoch_{epoch+1}.pt"))
        torch.save(self.predictor.state_dict(), os.path.join(self.save_path, f"best_predictor_epoch_{epoch+1}.pt"))
        print(f"New high score! Models saved at epoch {epoch+1}.")

if __name__ == '__main__':
    print('Initializing...')
    slate = Slate({'spikey': SpikeRunner})
    slate.from_args()
    print('Done.')
Changed everything 2024-05-25 17:31:08 +02:00			`import os`
			`import torch`
			`import torch.nn as nn`
			`import numpy as np`
Fixed bugs 2024-05-25 20:27:54 +02:00			`import random, math`
			`from utils import visualize_prediction, plot_delta_distribution`
Updated README and var names 2024-05-26 13:48:30 +02:00			`from data_processing import download_and_extract_data, load_all_wavs, split_data_by_time, compute_topology_metrics`
Implement Fourier Latent Projector 2024-05-26 15:40:00 +02:00			`from models import LatentFCProjector, LatentRNNProjector, LatentFourierProjector,MiddleOut, Predictor`
Changed everything 2024-05-25 17:31:08 +02:00			`from bitstream import IdentityEncoder, ArithmeticEncoder, Bzip2Encoder`
			`import wandb`
Fixed bugs 2024-05-25 20:27:54 +02:00			`from pycallgraph2 import PyCallGraph`
			`from pycallgraph2.output import GraphvizOutput`
			`from slate import Slate, Slate_Runner`
2nd commit 2024-05-24 23:02:24 +02:00
Changed everything 2024-05-25 17:31:08 +02:00			`device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')`
bug fixes 2024-05-26 00:28:18 +02:00			`#device = 'cpu'`
2nd commit 2024-05-24 23:02:24 +02:00
Fixed bugs 2024-05-25 20:27:54 +02:00			`class SpikeRunner(Slate_Runner):`
			`def setup(self, name):`
			`print("Setup SpikeRunner")`

			`self.name = name`
			`slate, config = self.slate, self.config`
initial commit 2024-05-24 22:01:59 +02:00
			`training_config = slate.consume(config, 'training', expand=True)`
			`data_config = slate.consume(config, 'data', expand=True)`

			`data_url = slate.consume(data_config, 'url')`
Changed everything 2024-05-25 17:31:08 +02:00			`cut_length = slate.consume(data_config, 'cut_length', None)`
Fixed data path 2024-05-25 17:44:12 +02:00			`download_and_extract_data(data_url)`
			`all_data = load_all_wavs('data', cut_length)`
Changed everything 2024-05-25 17:31:08 +02:00
			`split_ratio = slate.consume(data_config, 'split_ratio', 0.5)`
			`self.train_data, self.test_data = split_data_by_time(all_data, split_ratio)`

Updated README and var names 2024-05-26 13:48:30 +02:00			`print("Reconstructing thread topology")`
			`self.topology_matrix = compute_topology_metrics(self.train_data)`
Changed everything 2024-05-25 17:31:08 +02:00
Fixed bugs 2024-05-25 20:27:54 +02:00			`# Number of peers for message passing`
			`self.num_peers = slate.consume(config, 'middle_out.num_peers')`

			`# Precompute sorted indices for the top num_peers correlated leads`
			`print("Precomputing sorted peer indices")`
Updated README and var names 2024-05-26 13:48:30 +02:00			`self.sorted_peer_indices = np.argsort(-self.topology_matrix, axis=1)[:, :self.num_peers]`
Fixed bugs 2024-05-25 20:27:54 +02:00
Changed everything 2024-05-25 17:31:08 +02:00			`# Model setup`
Fixed bugs 2024-05-25 20:27:54 +02:00			`print("Setting up models")`
Changed everything 2024-05-25 17:31:08 +02:00			`latent_projector_type = slate.consume(config, 'latent_projector.type', default='fc')`
Fixed bugs 2024-05-25 20:27:54 +02:00			`latent_size = slate.consume(config, 'latent_projector.latent_size')`
			`input_size = slate.consume(config, 'latent_projector.input_size')`
README typos and smol refactor 2024-05-26 13:56:59 +02:00			`region_latent_size = slate.consume(config, 'middle_out.region_latent_size')`
Changed everything 2024-05-25 17:31:08 +02:00
			`if latent_projector_type == 'fc':`
Implement Fourier Latent Projector 2024-05-26 15:40:00 +02:00			`self.projector = LatentFCProjector(latent_size=latent_size, input_size=input_size, **slate.consume(config, 'latent_projector', expand=True)).to(device)`
Changed everything 2024-05-25 17:31:08 +02:00			`elif latent_projector_type == 'rnn':`
Fixed bugs 2024-05-25 20:27:54 +02:00			`self.projector = LatentRNNProjector(latent_size=latent_size, input_size=input_size, **slate.consume(config, 'latent_projector', expand=True)).to(device)`
Implement Fourier Latent Projector 2024-05-26 15:40:00 +02:00			`elif latent_projector_type == 'fourier':`
			`self.projector = LatentFourierProjector(latent_size=latent_size, input_size=input_size, **slate.consume(config, 'latent_projector', expand=True)).to(device)`
Changed everything 2024-05-25 17:31:08 +02:00
README typos and smol refactor 2024-05-26 13:56:59 +02:00			`self.middle_out = MiddleOut(latent_size=latent_size, region_latent_size=region_latent_size, num_peers=self.num_peers, **slate.consume(config, 'middle_out', expand=True)).to(device)`
			`self.predictor = Predictor(region_latent_size=region_latent_size, **slate.consume(config, 'predictor', expand=True)).to(device)`
Changed everything 2024-05-25 17:31:08 +02:00
			`# Training parameters`
Fixed bugs 2024-05-25 20:27:54 +02:00			`self.input_size = input_size`
2nd commit 2024-05-24 23:02:24 +02:00			`self.epochs = slate.consume(training_config, 'epochs')`
			`self.batch_size = slate.consume(training_config, 'batch_size')`
Fixed bugs 2024-05-25 20:27:54 +02:00			`self.num_batches = slate.consume(training_config, 'num_batches')`
2nd commit 2024-05-24 23:02:24 +02:00			`self.learning_rate = slate.consume(training_config, 'learning_rate')`
			`self.eval_freq = slate.consume(training_config, 'eval_freq')`
Changed everything 2024-05-25 17:31:08 +02:00			`self.save_path = slate.consume(training_config, 'save_path')`
2nd commit 2024-05-24 23:02:24 +02:00
Changed everything 2024-05-25 17:31:08 +02:00			`# Evaluation parameter`
			`self.full_compression = slate.consume(config, 'evaluation.full_compression', default=False)`
initial commit 2024-05-24 22:01:59 +02:00
Changed everything 2024-05-25 17:31:08 +02:00			`# Bitstream encoding`
			`bitstream_type = slate.consume(config, 'bitstream_encoding.type', default='identity')`
			`if bitstream_type == 'identity':`
			`self.encoder = IdentityEncoder()`
			`elif bitstream_type == 'arithmetic':`
			`self.encoder = ArithmeticEncoder()`
			`elif bitstream_type == 'bzip2':`
			`self.encoder = Bzip2Encoder()`

			`# Optimizer`
			`self.optimizer = torch.optim.Adam(list(self.projector.parameters()) + list(self.middle_out.parameters()) + list(self.predictor.parameters()), lr=self.learning_rate)`
			`self.criterion = torch.nn.MSELoss()`
Fixed bugs 2024-05-25 20:27:54 +02:00			`print("SpikeRunner initialization complete")`
initial commit 2024-05-24 22:01:59 +02:00
			`def run(self, run, forceNoProfile=False):`
2nd commit 2024-05-24 23:02:24 +02:00			`if self.slate.consume(self.config, 'profiler.enable', False) and not forceNoProfile:`
			`print('{PROFILER RUNNING}')`
			`with PyCallGraph(output=GraphvizOutput(output_file=f'./profiler/{self.name}.png')):`
			`self.run(run, forceNoProfile=True)`
			`print('{PROFILER DONE}')`
			`return`
Changed everything 2024-05-25 17:31:08 +02:00
			`self.train_model()`

			`def train_model(self):`
Fixed bugs 2024-05-25 20:27:54 +02:00			`min_length = min([len(seq) for seq in self.train_data])`

Changed everything 2024-05-25 17:31:08 +02:00			`best_test_score = float('inf')`

			`for epoch in range(self.epochs):`
			`total_loss = 0`
bug fixes 2024-05-26 00:28:18 +02:00			`errs = []`
			`rels = []`
Fixed bugs 2024-05-25 20:27:54 +02:00			`for batch_num in range(self.num_batches):`

			`# Create indices for training data and shuffle them`
			`indices = list(range(len(self.train_data)))`
			`random.shuffle(indices)`

			`stacked_segments = []`
Updated README and var names 2024-05-26 13:48:30 +02:00			`peer_metrics = []`
Fixed bugs 2024-05-25 20:27:54 +02:00			`targets = []`

			`for idx in indices[:self.batch_size]:`
			`lead_data = self.train_data[idx][:min_length]`

			`# Slide a window over the data with overlap`
bug fixes 2024-05-26 00:28:18 +02:00			`stride = max(1, self.input_size // 3) # Ensuring stride is at least 1`
Fixed bugs 2024-05-25 20:27:54 +02:00			`for i in range(0, len(lead_data) - self.input_size-1, stride):`
			`lead_segment = lead_data[i:i + self.input_size]`
			`inputs = torch.tensor(lead_segment, dtype=torch.float32).to(device)`

			`# Collect the segments for the current lead and its peers`
			`peer_segments = []`
			`for peer_idx in self.sorted_peer_indices[idx]:`
bug fixes 2024-05-26 00:28:18 +02:00			`peer_segment = self.train_data[peer_idx][i:i + self.input_size]`
Fixed bugs 2024-05-25 20:27:54 +02:00			`peer_segments.append(torch.tensor(peer_segment, dtype=torch.float32).to(device))`
Updated README and var names 2024-05-26 13:48:30 +02:00			`peer_metric = torch.tensor([self.topology_matrix[idx, peer_idx] for peer_idx in self.sorted_peer_indices[idx]], dtype=torch.float32).to(device)`
			`peer_metrics.append(peer_metric)`
Fixed bugs 2024-05-25 20:27:54 +02:00
			`# Stack the segments to form the batch`
			`stacked_segment = torch.stack([inputs] + peer_segments).to(device)`
			`stacked_segments.append(stacked_segment)`
			`target = lead_data[i + self.input_size + 1]`
			`targets.append(target)`

			`# Pass the batch through the projector`
			`latents = self.projector(torch.stack(stacked_segments))`

			`my_latent = latents[:, 0, :]`
			`peer_latents = latents[:, 1:, :]`

			`# Pass through MiddleOut`
Updated README and var names 2024-05-26 13:48:30 +02:00			`new_latent = self.middle_out(my_latent, peer_latents, torch.stack(peer_metrics))`
Fixed bugs 2024-05-25 20:27:54 +02:00			`prediction = self.predictor(new_latent)`

			`# Calculate loss and backpropagate`
bug fixes 2024-05-26 00:28:18 +02:00			`tar = torch.tensor(targets, dtype=torch.float32).unsqueeze(-1).to(device)`
			`loss = self.criterion(prediction, tar)`
			`err = np.sum(np.abs(prediction.cpu().detach().numpy() - tar.cpu().detach().numpy()))`
			`rel = err / np.sum(tar.cpu().detach().numpy())`
Fixed bugs 2024-05-25 20:27:54 +02:00			`total_loss += loss.item()`
bug fixes 2024-05-26 00:28:18 +02:00			`errs.append(err.item())`
			`rels.append(rel.item())`
Fixed bugs 2024-05-25 20:27:54 +02:00			`self.optimizer.zero_grad()`
			`loss.backward()`
			`self.optimizer.step()`

bug fixes 2024-05-26 00:28:18 +02:00			`tot_err = sum(errs)/len(errs)`
			`tot_rel = sum(rels)/len(rels)`
			`wandb.log({"epoch": epoch, "loss": total_loss, "err": tot_err, "rel": tot_rel}, step=epoch)`
Fixed bugs 2024-05-25 20:27:54 +02:00			`print(f'Epoch {epoch + 1}/{self.epochs}, Loss: {total_loss}')`

			`if self.eval_freq != -1 and (epoch + 1) % self.eval_freq == 0:`
			`print(f'Starting evaluation for epoch {epoch + 1}')`
Changed everything 2024-05-25 17:31:08 +02:00			`test_loss = self.evaluate_model(epoch)`
			`if test_loss < best_test_score:`
			`best_test_score = test_loss`
			`self.save_models(epoch)`
Fixed bugs 2024-05-25 20:27:54 +02:00			`print(f'Evaluation complete for epoch {epoch + 1}')`


			`wandb.log({"epoch": epoch, "loss": total_loss}, step=epoch)`
			`print(f'Epoch {epoch + 1}/{self.epochs}, Loss: {total_loss}')`

			`if (epoch + 1) % self.eval_freq == 0:`
			`print(f'Starting evaluation for epoch {epoch + 1}')`
			`test_loss = self.evaluate_model(epoch)`
			`if test_loss < best_test_score:`
			`best_test_score = test_loss`
			`self.save_models(epoch)`
			`print(f'Evaluation complete for epoch {epoch + 1}')`

Changed everything 2024-05-25 17:31:08 +02:00
			`def evaluate_model(self, epoch):`
Fixed bugs 2024-05-25 20:27:54 +02:00			`print('Evaluating model...')`
Changed everything 2024-05-25 17:31:08 +02:00			`self.projector.eval()`
			`self.middle_out.eval()`
			`self.predictor.eval()`

			`total_loss = 0`
			`all_true = []`
			`all_predicted = []`
			`all_deltas = []`
			`compression_ratios = []`
			`exact_matches = 0`
			`total_sequences = 0`

			`with torch.no_grad():`
README and bugfixes 2024-05-25 20:43:45 +02:00			`for lead_idx in range(len(self.test_data[:8])):`
Fixed bugs 2024-05-25 20:27:54 +02:00			`lead_data = self.test_data[lead_idx]`
Changed everything 2024-05-25 17:31:08 +02:00			`true_data = []`
			`predicted_data = []`
			`delta_data = []`
Fixed bugs 2024-05-25 20:27:54 +02:00			`targets = []`
Changed everything 2024-05-25 17:31:08 +02:00
Fixed bugs 2024-05-25 20:27:54 +02:00			`min_length = min([len(seq) for seq in self.test_data])`
Changed everything 2024-05-25 17:31:08 +02:00
Updated README and var names 2024-05-26 13:48:30 +02:00			`# Initialize lists to store segments and peer metrics`
Fixed bugs 2024-05-25 20:27:54 +02:00			`stacked_segments = []`
Updated README and var names 2024-05-26 13:48:30 +02:00			`peer_metrics = []`
Fixed bugs 2024-05-25 20:27:54 +02:00
			`for i in range(0, len(lead_data) - self.input_size-1, self.input_size // 8):`
			`lead_segment = lead_data[i:i + self.input_size]`
			`inputs = torch.tensor(lead_segment, dtype=torch.float32).to(device)`

Updated README and var names 2024-05-26 13:48:30 +02:00			`# Collect peer segments and metrics`
Fixed bugs 2024-05-25 20:27:54 +02:00			`peer_segments = []`
			`for peer_idx in self.sorted_peer_indices[lead_idx]:`
			`peer_segment = self.test_data[peer_idx][i:i + self.input_size][:min_length]`
			`peer_segments.append(torch.tensor(peer_segment, dtype=torch.float32).to(device))`
Updated README and var names 2024-05-26 13:48:30 +02:00			`peer_metric = torch.tensor([self.topology_matrix[lead_idx, peer_idx] for peer_idx in self.sorted_peer_indices[lead_idx]], dtype=torch.float32).to(device)`
			`peer_metrics.append(peer_metric)`
Changed everything 2024-05-25 17:31:08 +02:00
Fixed bugs 2024-05-25 20:27:54 +02:00			`# Stack segments to form the batch`
			`stacked_segment = torch.stack([inputs] + peer_segments).to(device)`
			`stacked_segments.append(stacked_segment)`
			`target = lead_data[i + self.input_size + 1]`
			`targets.append(target)`
Changed everything 2024-05-25 17:31:08 +02:00
Fixed bugs 2024-05-25 20:27:54 +02:00			`# Pass the batch through the projector`
			`latents = self.projector(torch.stack(stacked_segments))`
Changed everything 2024-05-25 17:31:08 +02:00
Fixed bugs 2024-05-25 20:27:54 +02:00			`my_latents = latents[:, 0, :]`
			`peer_latents = latents[:, 1:, :]`
Changed everything 2024-05-25 17:31:08 +02:00
Fixed bugs 2024-05-25 20:27:54 +02:00			`# Pass through MiddleOut`
Updated README and var names 2024-05-26 13:48:30 +02:00			`new_latents = self.middle_out(my_latents, peer_latents, torch.stack(peer_metrics))`
Fixed bugs 2024-05-25 20:27:54 +02:00
			`# Predict using the predictor`
			`predictions = self.predictor(new_latents)`

			`# Compute loss and store true and predicted data`
			`for i, segment in enumerate(stacked_segments):`
			`for t in range(self.input_size):`
			`target = torch.tensor(targets[i])`
			`true_data.append(target.cpu().numpy())`
README and bugfixes 2024-05-25 20:43:45 +02:00			`predicted_data.append(predictions[i].cpu().numpy())`
			`delta_data.append((target - predictions[i]).cpu().numpy())`
Fixed bugs 2024-05-25 20:27:54 +02:00
README and bugfixes 2024-05-25 20:43:45 +02:00			`loss = self.criterion(predictions[i].cpu(), target)`
Fixed bugs 2024-05-25 20:27:54 +02:00			`total_loss += loss.item()`

			`# Append true and predicted data for this lead sequence`
Changed everything 2024-05-25 17:31:08 +02:00			`all_true.append(true_data)`
			`all_predicted.append(predicted_data)`
			`all_deltas.append(delta_data)`

			`if self.full_compression:`
Fixed bugs 2024-05-25 20:27:54 +02:00			`# Bitstream encoding`
			`self.encoder.build_model(my_latents.cpu().numpy())`
			`compressed_data = self.encoder.encode(my_latents.cpu().numpy())`
			`decompressed_data = self.encoder.decode(compressed_data, len(my_latents))`
			`compression_ratio = len(my_latents) / len(compressed_data)`
Changed everything 2024-05-25 17:31:08 +02:00			`compression_ratios.append(compression_ratio)`

			`# Check if decompressed data matches the original data`
Fixed bugs 2024-05-25 20:27:54 +02:00			`if np.allclose(my_latents.cpu().numpy(), decompressed_data, atol=1e-5):`
Changed everything 2024-05-25 17:31:08 +02:00			`exact_matches += 1`
			`total_sequences += 1`

			`avg_loss = total_loss / len(self.test_data)`
			`print(f'Epoch {epoch+1}, Evaluation Loss: {avg_loss}')`
			`wandb.log({"evaluation_loss": avg_loss}, step=epoch)`

Fixed bugs 2024-05-25 20:27:54 +02:00			`# Visualize delta distribution`
Changed everything 2024-05-25 17:31:08 +02:00			`delta_plot_path = plot_delta_distribution(np.concatenate(all_deltas), epoch)`
			`wandb.log({"delta_distribution": wandb.Image(delta_plot_path)}, step=epoch)`

			`if self.full_compression:`
			`avg_compression_ratio = sum(compression_ratios) / len(compression_ratios)`
			`exact_match_percentage = (exact_matches / total_sequences) * 100`
			`print(f'Epoch {epoch+1}, Average Compression Ratio: {avg_compression_ratio}')`
			`print(f'Epoch {epoch+1}, Exact Match Percentage: {exact_match_percentage}%')`
			`wandb.log({"average_compression_ratio": avg_compression_ratio}, step=epoch)`
			`wandb.log({"exact_match_percentage": exact_match_percentage}, step=epoch)`

Fixed bugs 2024-05-25 20:27:54 +02:00			`print('Evaluation done for this epoch.')`
Changed everything 2024-05-25 17:31:08 +02:00			`return avg_loss`
2nd commit 2024-05-24 23:02:24 +02:00
Changed everything 2024-05-25 17:31:08 +02:00			`def save_models(self, epoch):`
README and bugfixes 2024-05-25 20:43:45 +02:00			`return`
Fixed bugs 2024-05-25 20:27:54 +02:00			`print('Saving models...')`
Changed everything 2024-05-25 17:31:08 +02:00			`torch.save(self.projector.state_dict(), os.path.join(self.save_path, f"best_projector_epoch_{epoch+1}.pt"))`
			`torch.save(self.middle_out.state_dict(), os.path.join(self.save_path, f"best_middle_out_epoch_{epoch+1}.pt"))`
			`torch.save(self.predictor.state_dict(), os.path.join(self.save_path, f"best_predictor_epoch_{epoch+1}.pt"))`
			`print(f"New high score! Models saved at epoch {epoch+1}.")`
initial commit 2024-05-24 22:01:59 +02:00
			`if __name__ == '__main__':`
Fixed bugs 2024-05-25 20:27:54 +02:00			`print('Initializing...')`
initial commit 2024-05-24 22:01:59 +02:00			`slate = Slate({'spikey': SpikeRunner})`
			`slate.from_args()`
Fixed bugs 2024-05-25 20:27:54 +02:00			`print('Done.')`