Определение авторства литературных произведений с помощью нейросетей (на материале французской поэзии)
Аннотация
Дата поступления статьи: 30.09.2024В данной статье рассматриваются статистические методы, а также методы машинного обучения для выбора оптимального способа установить авторство по отрывку произведения. Авторы создают датасет из отрывков соответствующих авторов, создают набор численных признаков, соответствующий каждому отрывку и применяют различные подходы для анализа авторства, такие как корреляция, сходство, t-test. Предпринимается попытка найти оптимальный метод для выходного слоя графовой сверточной нейросети, используемой для предварительной обработки данных. Осуществляется тренировка нейросети.
Ключевые слова: t-test, косинусное сходство, корреляция, графовые сверточные нейросети, анализ естесственного языка
.