1. Вероятностно-статистические модели в производстве автороведческой экспертизы русскоязычных текстов
- Subjects
АВТОРОВЕДЧЕСКИЕ МЕТОДИКИ ,ГОГОЛЬ НИКОЛАЙ ВАСИЛЬЕВИЧ ,RUSSIAN LANGUAGE ,лингвистическая экспертиза ,Computer science ,ХУДОЖЕСТВЕННЫЕ ТЕКСТЫ ,автороведческая экспертиза ,computer.software_genre ,АВТОРСКИЙ СТИЛЬ ,Field (computer science) ,law.invention ,Documentation ,TEXT AUTHORING ,вероятностно-статистические методики ,Text processing ,law ,РУССКАЯ ЛИТЕРАТУРА XIX В ,automatic text procession ,ЛИТЕРАТУРОВЕДЕНИЕ ,АВТОМАТИЧЕСКАЯ ОБРАБОТКА ТЕКСТОВ ,ТУРГЕНЕВ ИВАН СЕРГЕЕВИЧ ,ЛИНГВИСТИКА ТЕКСТА ,media_common ,probabilistic-statistical method ,authoring expertise ,экспертные исследования ,ЛИНГВИСТИЧЕСКАЯ ЭКСПЕРТИЗА ,русский язык ,автоматическая обработка текстов ,FORENSIC AUTHORING ,Certainty ,автороведческие методики ,Identification (information) ,автороведческие исследования ,идентификационные исследования ,РУССКИЙ ЯЗЫК ,авторский стиль ,Natural language processing ,КОМПЬЮТЕРНЫЕ МОДЕЛИ ,ВЕРОЯТНОСТНО-СТАТИСТИЧЕСКИЕ МЕТОДИКИ ,media_common.quotation_subject ,text authoring ,Set (abstract data type) ,ИДЕНТИФИКАЦИОННЫЕ ИССЛЕДОВАНИЯ ,МЕТОДЫ ИССЛЕДОВАНИЯ ,СУДЕБНОЕ АВТОРОВЕДЕНИЕ ,компьютерные модели ,AUTHORING EXPERTISE ,методы исследования ,forensic authoring ,business.industry ,ТОЛСТОЙ ЛЕВ НИКОЛАЕВИЧ ,АВТОРОВЕДЧЕСКАЯ ЭКСПЕРТИЗА ,АВТОРОВЕДЧЕСКИЕ ИССЛЕДОВАНИЯ ,Russian language ,AUTOMATIC TEXT PROCESSION ,PROBABILISTIC-STATISTICAL METHOD ,компьютерные технологии ,РУССКИЕ ПИСАТЕЛИ ,АВТОРИЗАЦИЯ ТЕКСТОВ ,Index (publishing) ,судебное автороведение ,авторизация текстов ,КОМПЬЮТЕРНЫЕ ТЕХНОЛОГИИ ,CLARITY ,русские писатели ,Artificial intelligence ,ЭКСПЕРТНЫЕ ИССЛЕДОВАНИЯ ,business ,computer ,ЯЗЫКОЗНАНИЕ ,художественные тексты - Abstract
В статье рассматриваются возможности идентификационного автороведческого экспертного исследования текстов посредством автоматической обработки на основе комплексного применения вероятностно-статистических методов. Материалом исследования являются произведения Л. Н. Толстого, Н. В. Гоголя, И. С. Тургенева., The article presents the experience of developing a computerized text authorization model and its adaptation to the needs of identification and diagnostic authoring expertise of Russian texts. The purpose of the study is to demonstrate the possibilities of identification authoring expert examination of texts through automatic text processing based on the integrated application of probabilistic-statistical methods. The article describes one more stage of testing an improved version of the CAT program (computerized text authorization) - an experiment to determine the relative frequencies of the ratio of certain linguistic elements (calculation of correlation coefficients) in several samples of compared texts using a set of different-level parameters - B. N. Golovin's coefficients, supplemented by the text clarity indexes existing in scientific prac-tice and applied field ("Flesch-Kincaid Index", "FOG-Index") and a number of other parameters. The research materials consist of primary databases of texts of Russian classics (works by L. N. Tolstoy, N. V. Gogol, I. S. Turgenev., Политическая лингвистика, Issue № 2 (74), Pages 156-166
- Published
- 2019
- Full Text
- View/download PDF