вторник, 4 июня 2019 г.

Извлечь и сохранить изображения из PDF файла в Linux

Чтобы извлечь изображения из файла PDF вы можете использовать инструмент командной строки под названием pdfimages.

Инструмент pdfimages является частью пакета poppler-utils. Вы можете проверить установлен ли он в вашей системе и при необходимости установить его выполнив команду в терминале:

sudo apt-get install poppler-utils

Чтобы извлечь изображения из файла PDF с помощью pdfimages нажмите Ctrl + Alt + T, чтобы открыть окно терминала. Введите в командной строке следующую команду.

pdfimages discovery.pdf /home/lubuntu/image


Для всех команд показанных в этой статье введите первый путь к файлу PDF и имя файла PDF. Второй путь должен содержать путь к папке в которую вы хотите сохранить извлеченные изображения. Слово image в конце второго пути представляет имя файла. Имена файлов изображений нумеруются автоматически (000, 001, 002, 003 и т. Д.). В нашем примере каждое имя файла изображения будет начинаться с image например, image-001.ppm, image-002.ppm и т. Д. Между указанным вами текстом и номером добавляется тире.

Формат изображения по умолчанию - PPM для немонохромных изображений или PBM для монохромных изображений.

Чтобы извлечь файлы изображений в формате .jpg добавьте в команду параметр -j как показано ниже.

 pdfimages -j discovery.pdf /home/lubuntu/image



Вы также можете изменить формат на PNG используя опцию -png или TIFF используя опцию -tiff.