Вид документа:

Автореферат дисертації

УДК:

004.91
Шифр: 004.9 Л22
Лан Чуньлінь. Методології та програмні засоби класифікації природомовних текстових документів : автореф. дис. ... канд. техн. наук : 05.13.05 "Комп'ютерні системи та компоненти" / Лан Чуньлінь ; Нац. техн. ун-т України "Київ. політехн. ін-т". – Київ, 2012. – 20 с.


Статистика використання: Видач: 0

Анотація:
В дисертації запропоновано метод автоматичної ідентифікації мови з використянням статистик N-грам, проведено порівняльний аналіз різних способів
класифікації текстових документів з метою вибору оптимальних за точністю і
повнотою, запропонована класифікація природомовних текстових документів з
використанням розробленого методу. Розвинуто метод автоматичного створення
багатотемної класифікації текстових документів в реальному часі, створено
програмний модуль для ідентифікації мови та класифікації багатотемних
текстових документів. Таким чином, за допомогою цих методів,підвищена точність і швидкість класифікації, розроблені відповідні програмні засоби для використання в системах автоматичної обробки текстів в багатомовних інформаційних системах.