Trekke String data fra PDF flersidige kolonner med Python

stemmer
0

Jeg har noen PDF-filer som er organisert i kolonner som jeg trenger å skrape. Problemet er at hver kolonne er flere sider, og er ikke i typisk oppsett for kolonner, for eksempel:

******Column 1******************Column 2*************

Sombody once told me Finger and her thumb The world was gonna In the shape of an L Roll me. I ain't the On her forehead. Well *******************NEXT PAGE************************** Sharpest tool in the The years start coming Shed. She was looking And they don't stop coming Kind of dumb with her

Jeg har prøvd å bruke standard PDF skrapere som PDFMiner men det vil bare returnere en streng som leser som:

Sombody gang fortalte meg
Verdens var skal
rulle meg. Jeg er ikke den
Finger og hennes tommelen

Eventuelle hjelpe ville være verdsatt!

Publisert på 02/09/2018 klokken 05:04
kilden bruker
På andre språk...                            

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more