В статье приведены методы предварительной обработки данных. Рассмотрены основные проблемы, которые встречаются при предобработке и пути их устранения. Обосновано приведение данных к формату пригодному для дальнейшего анализа массивов текстовых данных.