Як розпізнати текст.

Відскановані сторінки книги, журналу або важливого документа іноді необхідно перевести в звичайний текст. Зробити це не складе великої праці - достатньо мати під рукою Інтернет.
Інструкція
1
Отже, у вас є відсканована книга або просто якісне фото документа, і перед вами стоїть завдання звернути файл зображення в текстовий документ. За звичкою багато хто починає шукати спеціальні програми, за допомогою яких можна розпізнати текст. Але ми живемо в століття високих технологій, і прогрес не стоїть на місці, пропонуючи користувачам мережі Інтернет дивовижні можливості по розпізнаванню тексту з наступним збереженням його в файл. Зробити це можна, використовуючи онлайн-сервіси розпізнавання тексту.
2
Щоб розпізнати текст за допомогою спеціальних сервісів, існує декілька варіантів: 1.Перейдіте за адресою http://finereader.abbyyonline.com/ru/Account/Welcome, де після реєстрації ви зможете перевести потрібні зображення в текст.2 .Перейдіте за адресою http://www.onlineocr.ru/, де розпізнати текст і зберегти отриманий результат вам допоможуть без регістраціі.3.Перейдіте за адресою http://www.ocronline.com/де перші 100 сторінок можна перевести в текстовий файл бесплатно.4.Перейдіте за адресою http://www.free-ocr.com/, де без реєстрації і дуже швидко ви отримаєте потрібний вам результат з переведення в текст відсканованих сторінок.
3
Якщо з якоїсь причини вам не сподобалася робота вищевказаних ресурсів, ви можете використовувати одну з численних програм по розпізнаванню тексту, таких як OCR CUNEIFORM, ABBYY Finereader, OmniPage, Readiris, Microsoft Office Document Imaging та багатьох інших. Деякі з них безкоштовні, а за використання інших доведеться платити, але ви напевно зможете вибрати ту, яка буде зручна саме вам.
В pdf-форматі зазвичай розміщуються електронні книги, інструкції та інші документи. Деякі з них захищені від копіювання, то є інформація в них міститься у вигляді картинки і «витягнути» з неї текст можна тільки шляхом розпізнавання.
Вам знадобиться
  • - Abbyy FineReader;
  • - Abbyy Screenshot Reader.
Інструкція
1
Скачайте і встановіть на комп'ютер програму Abbyy FineReader, для цього перейдіть на офіційний сайт додатки http://www.abbyy.ua/download/, виберіть потрібний продукт і клацніть по посиланню «Завантажити». Дана програма призначена для сканування паперових документів, але ви можете з її допомогою розпізнати файл в форматі Pdf. Для цього запустіть програму, далі виберіть меню «Файл» - «Відкрити». Оберіть з комп'ютера файл , який необхідно розпізнати.
2
Встановіть настройки розпізнавання: мова (можливий вибір кілька мов, наприклад, коли текст російською мовою, але в ньому зустрічаються слова англійською мовою); поділ тексту на блоки (текстові блоки, зображення), дозвіл. Виділіть потрібну ділянку тексту, клацніть правою кнопкою миші і виберіть тип блоку (текст, картинка або таблиця).
3
Далі клацніть «Розпізнати». Після цього ви можете зберегти отриманий текст за допомогою копіювання в документ Word. Розпізнавання pdf- файл а можна виконати як посторінково, так і для всього документа відразу.
4
Встановіть програму Abbyy Screenshot Reader. Після цього в треї з'явиться значок програми. Цей додаток дозволяє розпізнати текст з pdf-документа, відкритого на екрані. Це стосується також будь-яких зображень, і всього, що взагалі відображається на моніторі.
5
Відкрийте документ, клацніть по значку програми, виберіть тип джерела (зображення, текст) і тип даних, які необхідно отримати. Ви можете вибрати текст, таблицю або зображення. Приміром, якщо необхідно розпізнати табличні дані, виберіть напрям «Текст» - «Таблиця».
6
Далі на екрані з'явиться курсор у вигляді хрестика, виділіть потрібну інформацію. Після розпізнавання з'явиться таблиця MS Excel із вставленої інформацією з документа. Щоб розбити отриманий текст за стовпцями таблиці використовуйте меню «Сервис» - «Розділити за стовпцями», виберіть роздільник (пробіл або табуляція) і клацніть «ОК».