Выделить файл из pdf. Как удалить страницу в PDF файле

Будем использовать программу Foxit Reader. Она более удобна и менее тяжеловесна, чем Adobe Reader. Скачать программу можно с сайта разработчика http://www.foxitsoftware.com/downloads/
Существует версия для Linux.

Выберите язык Russian, вашу операционную систему (OS) и нажмите кнопку Download.

Откройте в Foxit Reader pdf - файл и выберите страницу, которую хотите сохранить как картинку. Страница должна отобразиться на экране монитора. Для сохранения картинки удобно использовать функцию Снимок.

Сначала щелкните по кнопке Истинный размер, чтобы страница предстала в максимальном размере. В меню выберите вкладку Главная и затем щелкните по значку Снимок (значок с изображением фотоаппарата). Подведите курсор мыши к левому верхнему углу страницы. Нажмите левую кнопку мыши (ЛКМ) и, не отпуская кнопку, перемещайте курсор по диагонали к нижнему правому углу страницы. Картинка выделится контуром из тонких пунктирных линий. Отпустите кнопку. Или просто щелкните по странице ЛКМ. Страница выделится синим цветом. Появится окно с сообщением о том, что выделенная область скопирована в буфер обмена. Нажимаем кнопку Ok. Можно выделить только часть страницы.

Если вы используете англоязычную версию, то для получения снимка пройдите в меню по пути Tools -> Snapshot.

Щелкнем по значку Вставить. Картинка из буфера обмена будет вставлена в окно Paint"а. Внизу в строке состояния Paint"а проверьте размеры картинки в пикселях. Обычно требуется изменить размеры картинки, например, для вставки на сайт. В меню выберем вкладку Главная и щелкнем Изменить размер. По умолчанию стоит флажок Проценты. Это не очень удобно, установите флажок на пиксели. Отобразятся размеры картинки в пикселях. Введите желаемый размер по горизонтали или вертикали. Второй размер корректируется автоматически, если стоит галка Сохранить пропорции. Щелкаем Ok для сохранения изменений. Осталось самое простое - сохранить картинку в нужном формате. В меню выбираем Файл - Сохранить как. В правой части окна выбираем нужный формат. Я выбираю Изображение в формате JPEG.

Если вы вырезали только часть картинки, то в Paint"е большая часть листа может оказаться незанятой, чисто белой. Это легко исправить. После кнопки Вставить становится доступной кнопка Обрезать. Щелкните по ней и незаполненная часть листа автоматически обрежется до краев изображения. Или подведите курсор к правому нижнему углу незаполненной части листа. Как только появится двунаправленная стрелка, нажмите ЛКМ и, не отпуская кнопки, перемещайте границу листа по диагонали до края изображения. Отпустите кнопку. Теперь откадрированное изображение можно сохранить.

Также и в самом Paint"е есть возможность обрезать картинку. Нажмите ЛКМ и, не отпуская, выделите нужную часть картинки. Станет доступна кнопка Обрезать. Нажмите ее и картинка обрежется до нужных размеров. Останется сохранить ее, как описано выше.
Также есть возможность Вырезать, Копировать и Повернуть и переместить картинку.

Установка Foxit Reader в Linux

С официального сайта скачайте версию для Linux, например FoxitReader.enu.setup.2.4.4.0911.x64.run.tar.gz. Распакуйте скачанный архив. Для этого щелкните ПКМ по значку архива и в меню выберите Распаковать.

Полученный файл FoxitReader.enu.setup.2.4.4.0911(r057d814).x64.run — это установщик программы Foxit Reader, щелкните по значку и запустится установка Foxit Reader. Затем надо принять лицензию и установка завершится. После установки на рабочем столе появится ярлык программы. Щелкнув по ярлыку, можно запустить программу.

Пришло время рассказать, как произвести обратное действие.

Рассмотрим, как вытащить из PDF-документа текст, так чтобы можно было потом его редактировать в Word и подобных ему текстовых редакторах. То есть, попросту говоря, будем конвертировать PDF-файлы в Word.

Adobe Reader и аналоги

Самый простой, быстрый и бесплатный вариант:
Открываем нужный PDF-документ в Adobe Reader. Заходим в меню Редактировать, потом выбираем команду “Копировать файл в буфер обмена”



Все, можно спокойно редактировать полученный текст.

Обратите внимание, при использовании данного метода не сохраняется форматирование текста и нет возможности вытащить изображения!!!

Если вам, все таки, во что бы то ни стало нужно извлечь изображение из PDF-документа,чтобы не использовать какие-нибудь программы, сделайте скриншот с экрана на котором открыт PDF-файл, из которого вы скопировали текст, но не получилось скопировать картинку.


И полученное изображение вставьте в Word. Должно получиться вот так:


Понятно, что качество изображения будет оставлять желать лучшего, но как запасной вариант вполне подойдет.

В других просмотрщиках нужно будет сделать несколько иное действие.

Вот так в Foxit Reader (меню инструменты –> команда Выделить текст):


А вот так в PDF-XChange Viewer (меню Инструменты –> Основные –> Выделение):


Затем выделяем нужный текст и производим стандартные действия с буфером обмена, для тех кто не догадался: Копировать (Ctrl+C) и в Word — Вставить (Ctrl+V).

Система оптического распознавания текста (OCR)

При всей прелести этой методики у нее есть недостаток. Конвертировать PDF в Word не получиться, если PDF-документ создан сканированием с бумажного носителя или защищен от редактирования.

Поэтому будем использовать другой метод. А имено, с помощью специальной программы оптического распознавания текста.

Программа называется ABBYY FineReader и, к сожалению, является платной. Но зато функционал этой программы позволит перекрыть любые требования по созданию и конвертированию PDF-файлов.

Вот, например, имеем отсканированный текст в PDF формате


Запускаем ABBYY FineReader и в стартовом окне выбираем Файл в Microsoft Word


И все! Система сама распознает текст и отправляет его в Word



И опять же, ни один из онлайн-сервисов не работает с изображениями, и если текст у вас отсканирован и сохранен в формате PDF, то ничего не получится. Необходимо будет рассматривать вариант OCR.

Резюмируем

Как обычно, самым удобным оказался платный вариант, но остальные имеют право на существование, потому что не каждый день требуется преобразовывать файлы PDF. А на один раз можно или скачать демо-версию или воспользоваться онлайн-сервисом.

Если нельзя, но сильно надо, то способ всегда найдется.

Да, и еще, если Вы знаете еще какой-нибудь способ преобразования PDF-файлов, напишите мне в комментариях.

Спасибо за внимание!

P.S. Лирическое отступление :

Разделение PDF файла на отдельные страницы с помощью Google Chrome

Как разделить PDF файл на отдельные страницы

Нажмите правую кнопку, наведя курсор на тот PDF файл, с которым будете работать, и ответьте - открыть в браузере Google Chrome. Можно также запустить браузер Google Chrome и из него найти PDF файл и открыть этот файл в окне браузера.

Открытие PDF файла с помощью Google Chrome

После того, как PDF файл откроется в окне браузера, переведите курсор на нижнее правое поле в окне браузера. Здесь перечислено несколько опций, включая Print. Кликните на кнопку Print, или нажмите одновременно клавиши Ctrl + P на клавиатуре.

Печать PDF файла

Сейчас вы должны увидеть страницу с установками принтера в вашем браузере. Кликните кнопку “Change” (Изменить) и выберете из листа Local Destinations - “Save as PDF” (Сохранить как PDF). А из Pages option определите страницу для сохранения. Нажав на кнопку “Save”, вы выделите одну страницу из многостраничного PDF документа.

Для тех, кто занимается документооборотом, набором текстовых материалов или полиграфией, специализированные средства редактирования, заточенные под определенный вид работ — головная боль.

Иногда Word и Excel на все случаи достаточно, а бывает, например, требуется вносить мультимедийные вставки, рисунки, чертежи, да еще с различными дизайнерскими наворотами, с которыми даже многофункциональные редакторы не всегда справляются из-за разнообразия возникающих задач.

Универсальным редактором для полиграфии считается пакет Adobe Acrobat, работающий с PDF-документами. Комплект этого программного обеспечения непрерывно пополняется новыми приложе­ниями, которые улучшают пакет в вечном круговороте обновлений или же упрощают жизнь тем, кто не работает с этим форматом постоянно.

По этой причине всегда имеется потреб­ность в небольших программках, которые могут выполнять только просмотр и самые простые правки.

Рассмотрим редактирование PDF-документов в среде распространенного программного обеспече­ния. Манипуляции с текстом при редактировании позволяют преобразовать его для новых применений, изменить вставленные изображения, внести правки или исправить ошибки.

Удаляем страницу с использованием PDF XChange Viewer

XChange Viewer – простенький и эффективный редактор PDF-файлов. Допускает изменять текст, графику, видоизменять элементы документа. Весит всего-то около 30 Мб и размещается в любом компьютере, планшете или мобильном гаджете, где стараются экономить память.

Ко всему про­чему, эта прога еще и бесплатная.


Удаление страниц с помощью Foxit Advanced PDF Editor

Среди множества аналогичных редакторов Foxit Advanced PDF Editor – очень удачный, быстро работающий и компактный. С его помощью можно просматривать и редактировать их, включая преобразования отдельных частей, текстовых массивов и графики.

Здесь предусмотрены масштабирование, изменение формата, печать и конвертация файлов doc и xls в PDF формат. Большим преимуществом Foxit Advanced является компактность. Эти достоинства позволяют использовать его в компьютерах, где придают значение экономии памяти.


Удаление страниц с помощью Adobe Acrobat DC

Adobe Acrobat DC представляет на рынке полновесный программный пакет, позволяющий работать с PDF-документами, в том числе удалять, вставлять, извлекать или поворачивать страницы.

Кроме того, эта программа платная, и здесь используется версия условно доступная в течение нескольких дней, после чего ее необходимо покупать. Рассмотрим процесс удаления страницы средствами программы Adobe Acrobat DC.


Вышеприведенные программы служат только примерами для демонстрации возможностей существующих веб-приложений, умеющих работать с PDF-файлами. Они позволяют как удалить лист из pdf файла, так и добавить новые страницы, разбить документы на файлы, например, постранично, добавлять комментарии, медиаприложения, аннотации, изображения.

Умение выполнять правки в pdf-документах путем преобразования страничных массивов - обязательный навык для пользователя, работающего в области редактирования. Владея несколькими нехитрыми приемами, он всегда может воспользоваться одним из приложений для редактирования текстово-графических массивов информации.

  1. Всегда следует помнить, что команда Удалить невозвратная, поэтому перед ее исполнением обязательно следует убедиться в ее правильности.
  2. После удаления страниц их нумерация остается прежней с пропуском на месте удаленной. Поэтому, если в этом есть необходимость, нумерацию восстанавливают отдельно.

Хотя PDF-формат и является универсальным текстовым документом, содержащим графику, и наиболее распространенным типом всякого рода инструкций, иногда возникает необходимость редактирования, скажем, при создании собственного документа такого типа или при удалении ненужной информации. Сейчас мы посмотрим, как в PDF удалить страницу, лист или несколько объектов.

Как редактировать PDF-файлы?

На первый взгляд, многим пользователям может показаться, что PDF-файлы являются, так сказать, цельными и корректированию не поддаются. Это абсолютное заблуждение. Сегодня существует достаточно много утилит, позволяющих не только удалить страницу PDF документе любого типа, куда она была вставлена, но и произвести полное редактирование исходного файла.

На самом деле структура файла такова, что в нем присутствует разбивка на текстовую и графическую часть. Именно поэтому получается, что некоторые данный формат называют текстовым, а другие - графическим. Оба утверждения неверны. По сути, это совмещение обоих форматов.

Можно ли удалить лист из PDF-файла?

Исходя из вышесказанного, наверное, уже понятно, что существуют специальные редакторы, позволяющие произвести любые операции над текстом и графикой, которые присутствуют в искомом файле.

Само собой разумеется, что более или менее серьезный документ включает в себя не одну страницу. Приступим к решению вопроса, как удалить листы из PDF-файла (подразумевается готовый файл без разверстки).

Простейший метод удаления страницы при помощи «родных» утилит

Как все знают, для чтения файлов данного формата создано достаточно много утилит. Однако не все они (даже «родные» программы чтения типа ридеров) позволяют, скажем, удалить страницу в файле PDF.

Здесь нужно отталкиваться от версии самого приложения. Допустим, стандартный Adobe Reader способен только читать файлы такого типа, а версии X или Pro могут их еще и редактировать.

В сборке Adobe Reader Pro вопрос, как в PDF удалить страницу, решается просто элементарно. Для этого нужно задействовать меню инструментов при нахождении на выбранной странице, после чего перейти к разделу манипулирования страницами. При удалении программа выдаст запрос в виде окошка, в котором будет указан весь диапазон присутствующих в документе страниц (листов). Тут можно выбрать несколько листов (с такого-то по такой-то) или указать страницы с совпадающими начальными и конечными значениями (например, с 2 до 2). Как понятно из примера, будут удалены либо все страницы указанного диапазона, либо второй лист. Собственно, вопрос, как в PDF удалить страницу, в этом случае решается достаточно просто.

Использование CutePDF в Windows

Приложение CutePDF относится к разряду одних из тех немногочисленных программ, которые позволяют творить с файлами формата PDF что угодно.

Сам вопрос, как в PDF удалить страницу, тут имеет наиболее простое и практичное решение. Правда, сначала потребуется установка дополнения в виде Cute Writer после чего можно будет открыть нужный документ в любой читающей программе, а затем задать документ на печать с использованием нового устройства.

Тут есть один нюанс. При задаче на печать, скажем, диапазона 1-2,5 третья и четвертая страницы будут пропущены. Данный документ (без пропущенных страниц) надо будет сохранить под новым именем.

в файле PDF на «маках»

С компьютерами, работающими под управлением «яблочных» операционных систем, тоже можно разобраться без особого труда.

Для редактирования понадобится утилита под названием Preview, которая интегрируется в контекстное меню. В данном случае проблема, как в PDF удалить страницу, решается через открытие искомого файла при помощи именно этой утилиты с последующим переходом в раздел миниатюр. Теперь нужно просто отметить станицы или листы, подлежащие удалению, и подтвердить выполнение операции (для выделения нескольких страниц нужно навести на них курсор и зажать клавишу CMD).

Итог

Конечно, можно использовать не только программы и утилиты, описанные в данной статье. Существует еще немало онлайн-сервисов, которые предполагают прямое редактирование загруженных на сайт пользователем документов. Однако такой вариант кажется самым простым только для тех юзеров, которые по сути своей являются обычными лентяями.

Насколько ведь проще без всяких поисков в Интернете редактировать файлы при помощи подручных средств. Хотелось бы, конечно, посоветовать еще и Word, входящий в состав пакета Microsoft Office, но, к великому сожалению, как показывает практика, документы программа открывает и редактирует, а вот с кодировкой у нее неважно. Никогда не знаешь, что именно удаляешь. Правда, если использовать дополнительные плагины, проблема решаема на все сто.

Как уже понятно, само редактирование файлов с расширением.pdf ничего сложного из себя не представляет. Не нужно пугаться. По сути своей, этот формат можно сравнить с тем же текстовым документом, созданным в Word, где вставлена графика. Другое дело, что он имеет целостный формат для просмотрщика, но при наличии любой программы, способной его редактировать, ситуация становится проще. Тут не то что листы удалять можно будет, так еще и корректировать графические изображения собственными средствами или же внешними, заданными в настройках программами. В общем, при желании средств для извлечения страниц или удаления листов из файлов PDF можно найти сколько угодно.

Впрочем, и не каждая утилита способна производить качественное редактирование файлов такого формата. Отдельно стоит остановить внимание именно на программах, изначально предназначенных не для просмотра, а для обрезки и редактирования.