Spikey/main.py

import yaml
from slate import Slate, Slate_Runner
from data_processing import download_and_extract_data, load_all_wavs, delta_encode
from model import LSTMPredictor, FixedInputNNPredictor
from train import train_model
from bitstream import ArithmeticEncoder

class SpikeRunner(Slate_Runner):
    def setup(self, name):
        self.name = name
        slate, config = self.slate, self.config

        # Consume config sections
        preprocessing_config = slate.consume(config, 'preprocessing', expand=True)
        predictor_config = slate.consume(config, 'predictor', expand=True)
        training_config = slate.consume(config, 'training', expand=True)
        bitstream_config = slate.consume(config, 'bitstream_encoding', expand=True)
        data_config = slate.consume(config, 'data', expand=True)

        # Data setup
        data_url = slate.consume(data_config, 'url')
        data_dir = slate.consume(data_config, 'directory')
        download_and_extract_data(data_url, data_dir)
        all_data = load_all_wavs(data_dir)

        if slate.consume(preprocessing_config, 'use_delta_encoding'):
            all_data = [delta_encode(d) for d in all_data]

        # Split data into train and test sets
        split_ratio = slate.consume(data_config, 'split_ratio', 0.8)
        split_idx = int(len(all_data) * split_ratio)
        self.train_data = all_data[:split_idx]
        self.test_data = all_data[split_idx:]

        # Model setup
        self.model = self.get_model(predictor_config)
        self.encoder = self.get_encoder(bitstream_config)
        self.epochs = slate.consume(training_config, 'epochs')
        self.batch_size = slate.consume(training_config, 'batch_size')
        self.learning_rate = slate.consume(training_config, 'learning_rate')
        self.use_delta_encoding = slate.consume(preprocessing_config, 'use_delta_encoding')
        self.eval_freq = slate.consume(training_config, 'eval_freq')
        self.save_path = slate.consume(training_config, 'save_path', 'models')

    def get_model(self, config):
        model_type = self.slate.consume(config, 'type')
        if model_type == 'lstm':
            return LSTMPredictor(
                input_size=self.slate.consume(config, 'input_size'),
                hidden_size=self.slate.consume(config, 'hidden_size'),
                num_layers=self.slate.consume(config, 'num_layers')
            )
        elif model_type == 'fixed_input_nn':
            return FixedInputNNPredictor(
                input_size=self.slate.consume(config, 'fixed_input_size'),
                hidden_size=self.slate.consume(config, 'hidden_size')
            )
        else:
            raise ValueError(f"Unknown model type: {model_type}")

    def get_encoder(self, config):
        return ArithmeticEncoder()

    def run(self, run, forceNoProfile=False):
        train_model(self.model, self.train_data, self.test_data, self.epochs, self.batch_size, self.learning_rate, self.use_delta_encoding, self.encoder, self.eval_freq, self.save_path)

if __name__ == '__main__':
    slate = Slate({'spikey': SpikeRunner})
    slate.from_args()