Як розпізнати файл pdf.

В pdf-форматі зазвичай розміщуються електронні книги, інструкції та інші документи. Деякі з них захищені від копіювання, то є інформація в них міститься у вигляді картинки і «витягнути» з неї текст можна тільки шляхом розпізнавання.
Вам знадобиться
  • - Abbyy FineReader;
  • - Abbyy Screenshot Reader.
Інструкція
1
Скачайте і встановіть на комп'ютер програму Abbyy FineReader, для цього перейдіть на офіційний сайт додатки http://www.abbyy.ua/download/, виберіть потрібний продукт і клацніть по посиланню «Завантажити». Дана програма призначена для сканування паперових документів, але ви можете з її допомогою розпізнати файл в форматі Pdf. Для цього запустіть програму, далі виберіть меню «Файл» - «Відкрити». Оберіть з комп'ютера файл , який необхідно розпізнати.
2
Встановіть настройки розпізнавання: мова (можливий вибір кілька мов, наприклад, коли текст російською мовою, але в ньому зустрічаються слова англійською мовою); поділ тексту на блоки (текстові блоки, зображення), дозвіл. Виділіть потрібну ділянку тексту, клацніть правою кнопкою миші і виберіть тип блоку (текст, картинка або таблиця).
3
Далі клацніть «Розпізнати». Після цього ви можете зберегти отриманий текст за допомогою копіювання в документ Word. Розпізнавання pdf- файл а можна виконати як посторінково, так і для всього документа відразу.
4
Встановіть програму Abbyy Screenshot Reader. Після цього в треї з'явиться значок програми. Цей додаток дозволяє розпізнати текст з pdf-документа, відкритого на екрані. Це стосується також будь-яких зображень, і всього, що взагалі відображається на моніторі.
5
Відкрийте документ, клацніть по значку програми, виберіть тип джерела (зображення, текст) і тип даних, які необхідно отримати. Ви можете вибрати текст, таблицю або зображення. Приміром, якщо необхідно розпізнати табличні дані, виберіть напрям «Текст» - «Таблиця».
6
Далі на екрані з'явиться курсор у вигляді хрестика, виділіть потрібну інформацію. Після розпізнавання з'явиться таблиця MS Excel із вставленої інформацією з документа. Щоб розбити отриманий текст за стовпцями таблиці використовуйте меню «Сервис» - «Розділити за стовпцями», виберіть роздільник (пробіл або табуляція) і клацніть «ОК».