Статья добавлена 22 сентября 2010, в среду, в 03:18. С того момента...
3003 |
просмотра |
0 | добавлений в избранное |
0 | комментариев |
Представлена в разделах:
Что такое OCR-системы?
OCR - система оптического распознавания текста, которая помогает быстро проводить трудоемкую работу по обработке различной документации в бумажном виде.
Аббревиатура OCR переводится с английского языка как оптическое распознавание символов - optical character recognition.
Как работает OCR?
Для того, чтобы приступить к обработке бумажного документа необходим сканер или цифровой фотоаппарат. Документ сканируется или фотографируется, после чего система OCR распознает символы документа и вводит текст в компьютер в текстовом редакторе, позволяющем редактировать документ и осуществлять поиск по документу.
Первые OCR - системы появились в тридцатых годах прошлого века и представляли собой устройства, использующие фоторедактор и шаблоны. В пятидесятые годы были разработаны интеллектуальные машины, которые преборазовывали тексты в машинный язык для обработки на компьютере. Приблизительно в этоже время появились коммерческие версии системы OCR. В дальнейшем системы OCR стали разрабатываться для решения различных задач: работа с чеками, оцифровка серийных номеров купонов, чтение кредитных карт, сортировка почты и многое другое.
Какие программы?
В настоящее время в организациях любого масштаба, а также в домашних условиях OCR-системы имеют широкое применение. Ведь они позволяют обрабатывать различные документы, таблицы, картинки, фотографии, журнальные, книжные, газетные страницы и прочее. Ниболее популярными программами являются:
OmniPage Professional - OCR программа. Программа подерживает более 100 языков. Обрабатывает изображения, преобразовывает бумажные формы в электронные документы, в документе можно осуществлять поиск. Файлы также можно преобразовывать в формат PDF и редактируемые форматы doc, rtf, wpd, xls (такую возможность дают утилиты, которые прилагаются к комплекту бесплатно).
ABBYY FineReader 10 - OCR программа. Распознает и обрабатывает тексты, поддерживает 180 языков. Подходит для текстов со сложным форматированием, для документов плохого качества, для таблиц, картинок, фото. Введеный в компьютер текст можно форматировать, осуществлять поиск по тексту.
CuneiForm - OCR программа. Распознает и преобразовывает бумажные документы, электронные и графические файлы. Подходит для документов низкого качества.