ivdon3@bk.ru
В данной статье рассматриваются статистические методы, а также методы машинного обучения для выбора оптимального способа установить авторство по отрывку произведения. Авторы создают датасет из отрывков соответствующих авторов, создают набор численных признаков, соответствующий каждому отрывку и применяют различные подходы для анализа авторства, такие как корреляция, сходство, t-test. Предпринимается попытка найти оптимальный метод для выходного слоя графовой сверточной нейросети, используемой для предварительной обработки данных. Осуществляется тренировка нейросети.
Ключевые слова: t-test, косинусное сходство, корреляция, графовые сверточные нейросети, анализ естесственного языка