DatasetsPickles.py - создает в папке myPickler файлы
- channelsDict.train.txt - структуру данных словарь, где ключом выступает номер канала, а значением - list из числа сессий и скачиваний; сформирован по train;
- channelsNumbers.train.txt - номера каналов в train;
- channelsDict.train_sample.txt - структуру данных словарь, где ключом выступает номер канала, а значением - list из числа сессий и скачиваний; сформирован по train_sample;
- channelsNumbers.train_sample.txt - номера каналов в train_sample;
Все файлы сохранены с помощью pickle, так как сохранены в виде структур данных dict (для первого и треьего) и set (для второго и четвертого)
Также в папке myPickler сохранен protocol.txt - текстовый файл вывода в консоль работы DatasetsPickles.py. Представляет собой список типа ключ-значение из channelsDict.train.txt
train.txt содержит 184.903.891 строк
train_sample.txt содержит 100.001 строк
merged содержит 185.003.891 строк
test - 18.790.469 строк