Логика подсказывает, что следующий этап — это сортировка и обработка именно таких файлов. Но пока у меня только один такой документ в наличии, а чтобы набрать хотя бы полсотни подобных, придется возиться несколько дней. И наверное лучше обрабатывать свежие массивы данных, а не повторно тоже самое. Самообучающаяся система на однотипных заданиях сильно не разовьется. Нельзя выучить кандидата наук из троечника, если он в школе круглый год на уроке труда напильником уголок вытачивает. Надо иногда и табуретки чтобы мастерил, для расширения кругозора.