Unix maneira de extrair imagem vetorizada e seu gráfico a partir de um arquivo PDF?

4

Dados: uma tese do LHC na página 16 , em que a imagem é vetorizada ( mais provavelmente .eps). Estou revendo a resposta aqui do tópico Software necessário para extrair dados do gráfico . Não consigo encontrar nenhuma ferramenta que seja feita para extrair a imagem .eps de um arquivo PDF. Pseudocódigo do meu sistema inteiro

  1. Neutralizar o arquivo PDF por gs -dSAFER -dBATCH -dNOPAUSE -sDEVICE=pdfwrite -sOutputFile=newfile.pdf badfile.pdf ( source )
  2. Encontre a resolução nativa para a extração da imagem vetorizada a partir de um arquivo pdf. ( não tenho certeza sobre isso porque não é necessário fazer zoom; o nível de zoom de 100% da visualização da Adobe não pode ser otimizado com uma captura de tela)
  3. extrair imagem vetorizada de um arquivo pdf ( objetivo atual )
  4. extrair gráfico da imagem .eps

onde fazer tudo no mesmo sistema seria ótimo.

Abrir ferramentas com (3)

Possíveis formatos de imagem: png / xpm / jpeg / tiff / pnm / ras / bmp / gif

  • g3data mas não formato .eps
  • O Engaude-digitizer está ativo aqui e é mais popular que R digitize .
  • R digitize foi removido do CRAN , porque não há poder de manutenção; mas agora no Github do tpoisot aqui e sua revisão no blog de Luke Digitalizar dados de gráficos antigos usando 'digitize' mas eles estão tentando voltar para o CRAN aqui um ticket. Eu experimentei uma sequência de problemas com o software aqui . Uma grande fraqueza é que eles detectam seu github e nenhum feedback é bem-vindo.

Sistemas com (3) e (4)

  • provavelmente o pacote R que pode fazer as duas coisas:

Ferramentas apenas com (3) ou (4) ou nenhuma

  • A tarefa (4) pode ser feita no Mathematica conforme descrito aqui sobre É possível extrair dados de um gráfico de eps não gerados no Mathematica . No entanto, o Mathematica não é adequado para a tarefa (3) de acordo com o devtalk.
  • Adobe Acrobat > Edição Não encontrei nenhum método adequado para isso. Parece que não há versão Linux no Ubuntu 16.04.

Do vetorizado e Passos (1-2)

O arrastar e soltar da figura não funciona aqui. Então, deve extrair programaticamente a figura do pdf. Existe uma ferramenta terminal para o que extrai todas as imagens / eps / ... do documento, mas não tenho idéia de como elas fazem o que fazem. Eu gostaria de encontrar aqui algo que é bom em extrair a imagem .eps de um arquivo pdf.

Do Rasterizado ao Vectorizado e Passos (1-2)

Exemplo de imagem de DavidLeBauer sobre a inserção do gráfico com o eixo x para a discussão aqui

esegundoexemplosobrepontosquecruzamdoiseixosaquiparaDavid

Código

%https://unix.stackexchange.com/q/281211/16920gs-dSAFER-dBATCH-dNOPAUSE-sDEVICE=pdfwrite-sOutputFile=data_clean.pdfbadfile.pdf%draganddroppicturefromdata_clean.pdftoyourfolderinUbuntu16.04byhavingthedefaultzoomlevel;Ithinkzoomshouldnotaffectheretheresultofdrag-and-drop%Result:image.png%g3dataimage.png%bugin16.04:http://askubuntu.com/q/767982/25388%openfigureinubuntu-PrinttoFile>Ps.%Result:image.png.psps2epsimage.png.ps%Result:image.png.eps%https://mathematica.stackexchange.com/q/85320/9815%%Mathematicastartshere(*WolframLanguageTestfile*)fig=Import["image.png.eps"]

Import["http://raw.github.com/AlexeyPopkov/shortInputForm/master/shortInputForm.m"]

fig // shortInputForm

% Run but get error: http://askubuntu.com/q/767992/25388
% NB this error comes too if I have no code in the editor. So something wrong in my way of doing this. I am amateur in Mathematica. 

Como você pode extrair a imagem .eps e seu gráfico de um arquivo pdf no modo Unix?

    
por Léo Léopold Hertz 준영 05.05.2016 / 11:06

1 resposta

0

Não existe solução suportada suficiente para o caso porque o problema é problema-inverso difícil na realidade. As soluções do Mathematica também têm problemas significativos com aplicativos do mundo real.

    
por 30.12.2016 / 15:04

Tags