Вид документа:

Кваліфікаційна робота здобувача вищої освіти рівня магістр
ШІ
Брилевська О. В. Формування анотацій електронних текстів на основі множин зв'язних концептів : магістерська атестаційна робота, пояснювальна записка / О. В. Брилевська ; кер. роботи доц. Чала Л.Е. ; ХНУРЕ, Кафедра Штучного інтелекту. – Харків, 2015. – 99 с. : CD


Статистика використання: Видач: 0

Анотація:
Об'єктом дослідження є сучасні методи семантичного аналізу текстової інформації на основі виділення ключових слів у тексті, що дозволяє створювати анотації певного об'єму.
Метою даної магістерської атестаційної роботи є аналіз, реалізація та тестування розробленого методу створення анотацій тексту на основі визначених ключових слів за допомогою метода Гінзбурга.
Методами дослідження є вивчення основних рис відомих методів визначення семантичної близькості природно-мовних текстів за ближнім контекстом та визначення ключових слів, понять інформаційного пошуку та передобробки текстової інформації, а також методів та інформаційних технологій семантичного стиску текстової інформації по заданому рівню з метою створення анотацій. Використання теоретичних знань та практичних навичок проектування та реалізації програмних продуктів під платформу .NET.

ІНФОРМАЦІЙНИЙ ПОШУК, БЛИЖНІЙ КОНТЕКСТ, СЕМАНТИЧНА БЛИЗЬКІСТЬ, КЛЮЧОВІ СЛОВА, РЕЛЕВАНТНІСТЬ, МЕТОД ГІНЗБУРГА, АНОТАЦІЯ, СЕМАНТИЧНЕ СТИСНЕННЯ

Объектом исследования являются современные методы семантического анализа текстовой информации на основе определенных ключевых слов в тексте, что позволяет создавать аннотации определенного объема.
Целью данной магистерской аттестационной работы является анализ, реализация и тестирование разработанного метода создания аннотаций текста на основе определенных ключевых слов с помощью метода Гинзбурга.
Методами исследования являются изучение основных черт известных методов определения семантической близости естественно-языковых тестов по ближнему контексту и определение ключевых слов, понятий информационного поиска и предобработки текстовой информации, а также методов и информационных технологий семантического сжатия текстовой информации с заданным уровнем с целью создания аннотаций. Использование теоретических знаний и практических навыков проектирования и реализации программных продуктов под платформу .NET.

ИНФОРМАЦИОННЫЙ ПОИСК, БЛИЖНИЙ КОНТЕКСТ, СЕМАНТИЧЕСКАЯ БЛИЗОСТЬ, КЛЮЧЕВЫЕ СЛОВА, РЕЛЕВАНТНОСТЬ, МЕТОД ГИНЗБУРГА, АННОТАЦИЯ, СЕМАНТИЧЕСКОЕ СЖАТИЕ

The object of research are the modern methods of semantic analysis of the textual information based on certain key words in the text, allowing creating a certain amount of the annotations.
The purpose of this thesis is the analysis, implementation and testing of the developed annotation method of text, based on the certain keywords using the Ginsburg's method.
The methods of research are studying of the basic features of the known methods for determining semantic proximity of the natural language texts by neighbor context and selection of the keywords, concepts of the information retrieval and pre-processing of the text information, and the methods and information technologies of the semantic compression of text data with a predetermined level to create annotations. Using the theoretical knowledge and practical skills to design and implement software for the platform .NET.

INFORMATION RETRIEVAL, MIDDLE CONTEXT, SEMANTIC PROXIMITY, KEYWORDS, RELEVANCE, GINZBURG'S METHOD, ANNOTATION, SEMANTIC COMPRESSION