Вид документа:

Стаття періодики

УДК:

004.6

Губин В. А. Слабоструктурированные текстовые документы как источники данных / В. А. Губин // Бионика интеллекта. – 2010. – №3 (74). – С. 109–111.



Складова документа:
Бионика интеллекта : научно-технический журнал. №3 (74) / Мин-во образования и науки Украины ХНУРЭ // Бионика интеллекта. – Харьков : ХНУРЕ, 2010


Анотація:
Исследованы возможности и предпосылки автоматизированной идентификации данных в электронных текстовых документах, размещенных в корпоративных сетях и в сети Интернет. Выделен класс слабоструктурированных текстовых документов, представлены их основные признаки и свойства как источник данных. Приведены различные сценарии взаимного расположения в таких документах текстовых фрагментов, соответствующих атрибутам и значениям данных.