|
||||||||||||||
|
||||||||||||||
![]() | |||||||
|
|
Современное общество в основном перешло от бумажных документов к электронным. Этот шаг дал многочисленные преимущества. Теперь намного проще обмениваться документами, копировать и редактировать их. Настало время сделать следующий шаг - извлечь из документов те данные, которые могут быть использованы аналитическими приложениями. Например:
Сам процесс ручного извлечения данных из документов медленен, требует больших трудовых затрат. Кроме того результаты извлечения данных сделанного непрофессионально часто содержат ошибки и разночтения. Это является главной причиной, по которой довольно часто компании предпочитают оставить ценную информацию погибать в документах вместо того чтобы использовать ее на благо бизнеса. Мы предлагаем недорогое решение этой проблемы. Мы берем на себя бремя извлечения данных из документов. Вы только должны рассказать нам какие именно данные вы хотите извлечь из документов каждого типа и затем можете просто посылать документы к нам и через несколько часов Вы получите структуру содержащую все извлеченные данные. Вместе с структурами содержащими данные Вы получите формы показывающие место каждого элемента данных в исходном документе для того чтобы Вы могли удостовериться в правильности результата.
Цены
Технология
Коротко DEP - это совокупность уникальных решений в областях Text Mining и Data Processing поддержанная к тому же базой знаний в форме семантической онтологии. Модели отражают семантические и форматные отношения между элементами документов. Еще один важный элемент нашего решения - команда проверки и очистки результатов. Мы используем высоко образованных экспертов в каждой прикладной области для проверки и окончательной чистки результатов после автоматического выделения данных.
Документооборот
После этого Вам нужно будет просто копировать исходные документы на тот FTP site, который Вы выберете. Мы возьмем документы, обработаем их и положим результат на тот же FTP site. Или еще проще - email документ нашему представителю и мы вернем Вам результат тоже с помощью email.
Запрос на Извлечение Даных
После того как примеры разметки посланы нашему представителю мы попытаемся разработать шаблон для извлечения данных который по сути представляет из себя древовиную структуру которая служит контейнером для хранения извлеченных данных.
Затем мы сделаем пробные извлечения и пошлем их клиенту для исправления или подтверждения. После нескольких подобных итераций мы разработаем модели для автоматического извлечения данных и начнем обработку данных.
Форматы результатов Важным свойством нашей технологии извлечения данных является сохранение связи каждого элемента извлеченных данных с соответствуюцим ему местом в исходном документе. Это позволяет нам не только показать пользователю результат извлечения но и место в документе в котором оно было найдено. Таким образом пользователь не обязан слепо верить результатам извлечения данных, он может перепроверить каждый найденный результат просто кликнув на нем в одном из демонстрационных форматов. Мы предлагаем 2 демонстрационных формата, которые могут быть использованы в дополнение к XML структуре. Первый это PDF подобный показанному ниже. Левая панель содержит результирующее дерево с извлеченными данными в то время как правая панель представляет исходный документ. Пользователь может просто кликнуть на любом извлеченном значении в левой анели и правая панель прокрутится до места извлечения данных. Кроме того мы подсветим место извлечения данных в правой панели для облегчения визуального распознавания. ![]() Вторая демонстрационная форма с похожим поведением это HTML. Мы ее разработали как альтернативу PDF для пользователей, у которых на компьютере не установлен Adobe Acrobat. Она выглядит следующим образом: ![]() Здесь также пользователь может кликнуть на извлеченном значении в левой панели и правые панели прокрутятся до соответствующего места в правой панели и подсветят данные в тексте исходного документа. Мы не ограничиваемся описанными выше выходными форматами и можем добавить дополнительный фомат по запросу пользователя.
Как сделать первый шаг
|

|
|