Como criar e mesclar arquivos PDF na linha de comando do Linux

0
13


Jane Kelly / Shutterstock.com

Os arquivos PDF foram projetados para promover o compartilhamento. Todos podem abri-los, em seu navegador da Web, se não tiverem mais nada. O Linux permite manipular, mesclar e dividir arquivos PDF na linha de comando.

Formato de Documento Portátil

Portable Document Format (PDF) resolveu um problema. Quando você criava um documento em um computador e queria compartilhá-lo com outra pessoa, enviar o documento nem sempre funcionava.

Mesmo que eles tenham o mesmo pacote de software que você usou para criar seu documento, eles podem não ter as mesmas fontes instaladas em seu computador que você tinha no seu. Eles poderiam abrir o documento, mas ficaria ruim.

Se eles não tivessem uma cópia do software que você usou para criar o pacote, eles não poderiam abri-lo. Se você usava software que só estava disponível no Linux, não fazia sentido enviar esse documento para alguém que só usava o Windows.

A Adobe criou um novo formato de arquivo em 1992 e o chamou de Portable Document Format. Os documentos criados usando esse padrão, ISO 32000, contêm as imagens e fontes necessárias para representar corretamente o conteúdo do arquivo. Os visualizadores de PDF podem abrir arquivos PDF em qualquer plataforma. Era uma solução multiplataforma, simples e elegante.

Um arquivo PDF não foi projetado para ser maleável como um documento de processamento de texto. Eles não se prestam facilmente à edição. Se você precisar alterar o conteúdo de um PDF, é sempre melhor voltar ao material de origem, editá-lo e gerar um novo PDF. Ao contrário de tentar mudar o conteúdo, estrutural manipulações podem ser realizadas em arquivos PDF com relativa facilidade.

Aqui estão algumas maneiras de criar arquivos PDF no Linux e como realizar algumas das transformações que podem ser aplicadas a eles.

Criando arquivos PDF no Linux

Muitos dos aplicativos disponíveis no Linux podem gerar arquivos PDF diretamente. O LibreOffice possui um botão da barra de ferramentas que gera um PDF do documento atual. Não poderia ser mais fácil.

Botão PDF do LibreOffice Writer

Para controle detalhado da criação de PDF, o aplicativo de editoração eletrônica Scribus é difícil de superar.

Se você precisa criar documentos com conteúdo científico ou matemático, talvez para enviar para revistas acadêmicas, um aplicativo que usa LaTeX, como o Texmaker, será perfeito para você.

Se você preferir um fluxo de trabalho de texto simples, talvez usando Markdown, você pode usar pandoc para converter de e para um grande número de formatos de arquivo, incluindo PDF. Temos um guia dedicado a pandoc mas um exemplo simples mostrará como é fácil de usar.

Instale o Texmaker primeiro. pandoc ele se baseia em algumas bibliotecas LaTeX para geração de PDF. Instalar o Texmaker é uma maneira conveniente de preencher essas dependências.

a -o A opção (saída) é utilizada para especificar o tipo de arquivo a ser criado. O arquivo “raw-notes.md” é um arquivo Markdown de texto simples.

pandoc -o new.pdf raw-notes.md

Usando o pandoc para criar um PDF a partir de um arquivo Markdown

Se abrirmos o arquivo “new.pdf” em um visualizador de PDF, veremos que é um PDF formado corretamente.

Abrindo o PDF criado pelo pandoc

O comando qpdf

a qpdf O comando permite manipular arquivos PDF existentes, preservando seu conteúdo. As alterações que você pode fazer são estrutural. Com qpdf você pode executar tarefas como mesclar arquivos PDF, extrair páginas, girar páginas e definir e remover criptografia.

Instalar qpdf no Ubuntu use este comando:

sudo apt install qpdf

Instalando qpdf no Ubuntu

O comando no Fedora é:

sudo dnf install qpdf

Instalando qpdf no Fedora

Em Manjaro você deve escrever:

sudo pacman -S qpdf

Instalando qpdf no Manjaro

Combinar arquivos PDF

A princípio, alguns dos qpdf A sintaxe da linha de comando pode parecer confusa. Por exemplo, muitos dos comandos esperam um arquivo PDF de entrada.

Se um comando não requer um, você precisa usar o --empty opção em vez disso. isso diz qpdf não espere por um arquivo de entrada. a --pages A opção permite que você escolha as páginas. Se você fornecer apenas os nomes dos PDFs, todas as páginas serão usadas.

Para combinar dois arquivos PDF para formar um novo arquivo PDF, use este comando de formato.

qpdf --empty --pages first.pdf second.pdf -- combined.pdf

Combine dois arquivos PDF para criar um novo arquivo PDF

Este comando é composto por:

  • qpdf: ligar para qpdf domínio.
  • -Vazio: Ele diz qpdf sem entrada de PDF. Você poderia argumentar que “first.pdf” e “second.pdf” são arquivos de entrada, mas qpdf os considera como parâmetros de linha de comando.
  • -Páginas: Ele diz qpdf vamos trabalhar com páginas.
  • primeiro.pdf segundo.pdf: Os dois arquivos dos quais vamos extrair as páginas. Não usamos intervalos de páginas, portanto, todas as páginas serão usadas.
  • : Indica o fim das opções de comando.
  • combinado.pdf: O nome do PDF a ser criado.

Se pesquisarmos arquivos PDF com lsveremos nossos dois arquivos originais, intactos, e o novo PDF chamado “combined.pdf”.

ls -hl first.pdf second.pdf combined.pdf

Usando ls para listar arquivos PDF novos e existentes

Existem duas páginas em “first.pdf” e uma página em “second.pdf”. O novo arquivo PDF tem três páginas.

O novo arquivo PDF tem todas as páginas dos dois arquivos PDF originais

Você pode usar curingas em vez de listar um grande número de arquivos de origem. Este comando cria um novo arquivo chamado “all.pdf” que contém todos os arquivos PDF no diretório atual.

qpdf --empty --pages *.pdf -- all.pdf

Usando curingas na linha de comando qpdf

Podemos usar intervalos de páginas adicionando os números de página ou intervalos após os nomes dos arquivos dos quais as páginas serão extraídas.

Isso extrairá as páginas um e dois de “first.pdf” e a página dois de “second.pdf”. Observe que, se “combined.pdf” já existir, ele não será substituído. Tem as páginas selecionadas adicional isto.

qpdf --empty --pages first.pdf 1-2 second.pdf 1 -- combined.pdf

Usando intervalos de páginas para selecionar as páginas a serem adicionadas ao novo arquivo

Os intervalos de páginas podem ser tão detalhados quanto você desejar. Aqui, estamos solicitando um conjunto muito específico de páginas de um arquivo PDF grande e criando um arquivo PDF de resumo.

qpdf --empty --pages large.pdf 1-3,7,11,18-21,55 -- summary.pdf

Usando um conjunto complicado de intervalos de páginas

O arquivo de saída, “summary.pdf” contém as páginas 1 a 3, 7, 11, 18 a 21 e 55 do arquivo PDF de entrada. Isso significa que há 10 páginas em “summary.pdf”

A página 10 do novo PDF é a página 55 do arquivo de origem

Podemos ver que a página 10 é a página 55 do PDF de origem.

Dividir arquivos PDF

O oposto de mesclar arquivos PDF é dividir arquivos PDF. Para dividir um PDF em arquivos PDF separados, cada um com uma única página, a sintaxe é simples.

O arquivo que estamos dividindo é “summary.pdf”, e o arquivo de saída é fornecido como “page.pdf”. Isso é usado como o nome base. Cada novo arquivo tem um número adicionado ao nome base. a --split-pages opção diz qpdf que tipo de ação estamos fazendo?

qpdf summary.pdf page.pdf --split-pages

Divida um arquivo PDF em vários arquivos PDF de uma página cada

A saída é uma série de arquivos PDF numerados sequencialmente.

ls page*.pdf

usando ls para listar arquivos PDF numerados

Se você não quiser dividir cada página, use intervalos de páginas para selecionar as páginas desejadas.

Se emitirmos este comando a seguir, dividiremos uma coleção de arquivos PDF de página única. Os intervalos de páginas são usados ​​para especificar as páginas ou intervalos que desejamos, mas cada página ainda é armazenada em um único PDF.

qpdf large.pdf section.pdf --pages large.pdf 1-5,11-14,60,70-100 -- --split-pages

Dividir um PDF com intervalos de páginas

As páginas extraídas têm nomes baseados em “section.pdf” com um número sequencial adicionado.

ls section*.pdf

usando ls para listar arquivos PDF numerados

Se você deseja extrair um intervalo de páginas e armazená-lo em um único PDF, use um comando deste formulário. Observe que não incluímos o --split-pages opção. Efetivamente, o que estamos fazendo aqui é uma mesclagem de PDF, mas estamos apenas “mesclando” páginas de um arquivo de origem.

qpdf --empty --pages large.pdf 8-13 -- chapter2.pdf

Extraia um intervalo de páginas de um arquivo PDF e armazene-as em um novo arquivo PDF

Isso cria um único PDF de várias páginas chamado “capítulo2.pdf”.

virando páginas

Para girar uma página, criamos um novo PDF que é igual ao PDF de entrada com a página especificada girada.

nós usamos o --rotate opção para fazer isso. a +90 significa virar a página 90 graus no sentido horário. Você pode girar uma página em 90, 180 ou 270 graus. Você também pode especificar a rotação em graus no sentido anti-horário, usando um número negativo, mas não é necessário. Uma rotação de -90 é o mesmo que uma rotação de +270.

O número separado da rotação por dois pontos “:“Este é o número da página que você deseja girar. Pode ser uma lista de números de página e intervalos de páginas, mas estamos girando apenas a primeira página. Para girar todas as páginas, use um intervalo de páginas de 1-z.

qpdf --rotate=+90:1 summary.pdf rotated1.pdf

Rotação da primeira página de um PDF

A primeira página foi girada para nós.

Um arquivo PDF com a primeira página girada 90 graus no sentido horário

criptografia e descriptografia

Os documentos PDF podem ser criptografados para que exijam uma senha para abri-los. Essa senha se chama senha do usuário. Há outra senha necessária para alterar a segurança e outras configurações de permissão de um PDF. é chamado de senha do proprietário.

Para criptografar um PDF, precisamos usar o --encrypt e forneça ambas as senhas. A senha do usuário vem primeiro na linha de comando.

Também especificamos a força da criptografia a ser usada. Você só precisa passar da criptografia de 256 bits para 128 bits se quiser oferecer suporte a visualizadores de PDF muito antigos. Sugerimos que você mantenha a criptografia de 256 bits.

Vamos criar uma versão criptografada de “summary.pdf” chamada “secret.pdf”.

qpdf --encrypt hen.rat.squid goose.goat.gibbon 256 -- summary.pdf secret.pdf

Criando um PDF criptografado

Quando tentamos abrir o PDF, o visualizador de PDF solicita uma senha. A inserção da senha do usuário autoriza o visualizador a abrir o arquivo.

Um visualizador de PDF que solicita a senha para abrir um arquivo PDF criptografado

Lembre se qpdf ele não altera o PDF existente. Crie um novo com as alterações que pedimos para você fazer. Portanto, se você criar um PDF criptografado, ainda terá a versão original não criptografada. Dependendo das suas circunstâncias, você pode querer excluir o PDF original ou mantê-lo seguro.

Para descriptografar um arquivo, use o --decrypt opção. Obviamente, você precisa conhecer o proprietário senha para que isso funcione. Precisamos usar o --password opção para identificar a senha.

qpdf --decrypt --password=goose.goat.gibbon secret.pdf unlocked.pdf

Criando um PDF descriptografado a partir de um PDF criptografado

O “unlocked.pdf” pode ser aberto sem senha.

qpdf é uma excelente ferramenta

Estamos profundamente impressionados com qpdf. Ele fornece um conjunto de ferramentas flexível e rico em recursos para trabalhar com arquivos PDF. E é muito rápido também.

Confira sua documentação bem escrita e detalhada para ver o quanto mais ele pode fazer.