МЕТОДЫ ВЫДЕЛЕНИЯ КЛЮЧЕВЫХ СЛОВ ПРИ РЕФЕРИРОВАНИИ НАУЧНОГО ТЕКСТА
DOI: 10.23951/1609-624X-2018-8-45-50
Рассматривается вопрос о методиках выделения ключевых слов в научных текстах юридического дискурса в процессе создания вторичных документов (рефератов) для обеспечения быстрого и эффективного поиска необходимой информации. Представлен обзор современных подходов к извлечению ключевых слов в тексте отечественной и зарубежной литературы. Во второй части работы предложена методика, сочетающая элементы статистических, эвристических, лингвистических методов для выделения ключевых (опорных) слов научного текста. Акцент делается на том, что формальных признаков (частотность, совместная встречаемость) слов недостаточно для того, чтобы быть отнесенными к категории ключевых, позволяющих эффективно передать смысл реферируемого текста. Обосновывается необходимость лингвистического анализа лексических единиц, выделенных на основе формальных признаков, позволяющего раскрыть концептуальную структуру слова и выделить категорематические компоненты его значения, позволяющие составить метаязык для описания смысла реферируемого научного текста и способствовать передаче максимального количества информации минимальным набором ключевых слов. Приводятся результаты анализа вторичных текстов юридического содержания, содержащих набор категорематичеcких элементов ключевых слов текста, позволяющих описать смысл реферируемого текста.
Ключевые слова: реферирование, научный дискурс, категорематический компонент значения слова, понимание текста
Библиография:
1. Моль А. Социодинамика культуры. М.: КомКнига, 2005. 416 с.
2. Bharti Santosh Kumar, Babu Korra Sathya, Pradhan Anima. Automatic Keyword Extraction for Text Summarizationin Multi-document e-Newspapers Articles // European Journal of Advances in Engineering and Technology. 2017. Vol. 4, is. 6. Р. 410–427. URL: http://www.ejaet.com/PDF/4-6/EJAET-4-6-410-427.pdf (дата обращения: 15.08.2018).
3. Haggag, Mohamed H. Keyword Extraction using Semantic Analysis // International Journal of Computer Applications (0975 – 8887). January 2013. Vol. 61, № 1. URL: https://pdfs.semanticscholar.org/1b09/c3dc05e4c19c44969a06c5509123ad2f5158.pdf (дата обращения: 13.08.2018).
4. Hulth Anette. Improved Automatic Keyword Extraction Given More Linguistic Knowledge // EMNLP ‘03 Proceedings of the 2003 conference on Empirical methods in natural language processing, Association for Computational Linguistics. 2003. Р. 216–223. URL: http://www.aclweb.org/anthology/W03-1028 (дата обращения: 12.08.2018).
5. Костомаров В. Г., Бурвикова Н. Д. Прецедентный текст как редуцированный дискурс // Язык как творчество. К 70-летию В. П. Григорьева: сб. науч. тр. М.: ИРЯ РАН, 1996. С. 297–302.
6. Яцко В. А. Симметричное реферирование: теоретические основы и методика // НТИ. 2002. Сер. 2. № 5. С. 18–27.
7. Блюменау Д. И. Информационный анализ/синтез для формирования вторичного потока документов. СПб.: Профессия, 2002. 235 с.
8. Разинкина Н. М. Функциональная стилистика (на материале английского и русского языков): учеб. пособие. М.: Высшая школа, 2004. 271 с.
9. Ercan G., Cicekli. I. Using lexical chains for keyword extraction // Information Processing & Management. 2007. Vol. 43 (6). Р. 1705–1714. URL:https://www.sciencedirect.com/science/article/abs/pii/S0306457307000398 (дата обращения: 19.08.2018).
10. Шехтман Н. А. Системность лексики и семантика слова: учеб. пособие к спецкурсу. Куйбышев: Куйбышев, 1988. 84 с.
11. Чёрч А. Введение в математическую логику. М.: Либроком, 2009. Т. 1. 482 с.
12. Гуссерль Э. Логические исследования. СПб.: Академический проект, 2011. Т. 2. 576 с.
13. Longman Dictionary of Contemporary English. Harlow, Pearson Education Ltd., 2005. 1950 p.
Выпуск: 8, 2018
Серия выпуска: Выпуск № 8
Рубрика: СОПОСТАВИТЕЛЬНАЯ ЛИНГВИСТИКА И ЛИНГВИСТИКА ТЕКСТА
Страницы: 45 — 50
Скачиваний: 1049