PDF

Kā iegūt tabulas no PDF dokumentiem

Kā iegūt tabulas no PDF dokumentiem

Šis raksts jums parādīs, kā to izdarīt izvilkt tabulas no PDF dokumentiem. Jums var būt daudz PDF failu, kas satur vairākas tabulas, kuras vēlaties izmantot atsevišķi. Šo tabulu kopēšana un ielīmēšana nav laba iespēja, jo tā var nedot gaidīto iznākumu, tāpēc jums ir nepieciešamas dažas citas vienkāršas iespējas, kas var izvilkt tabulas no PDF faila un saglabāt šīs tabulas kā atsevišķus failus.

Lielākā daļa no tām PDF tabulas nosūcēja rīki nevar palīdzēt, ja tiek skenēta PDF tabula. Šādā gadījumā vispirms vajadzētu padarīt PDF failu meklējamu un pēc tam izmēģināt šīs iespējas.

Izvelciet tabulas no PDF dokumentiem

Šajā amatā mēs esam pievienojuši 2 bezmaksas tiešsaistes pakalpojumus un 3 bezmaksas programmatūru, lai no PDF faila izvilktu tabulas:

  1. PDF uz XLS
  2. PDFtoExcel.com
  3. Tabula
  4. ByteScout PDF daudzfunkciju rīks
  5. Sejda PDF darbvirsma.

1] PDF uz XLS

PDF uz XLS ir viena no labākajām iespējām tabulu iegūšanai no PDF. Tam ir divas funkcijas, kas padara to parocīgu. Jūs varat atnest tabulas no 20 PDF dokumentus kopā. Arī PDF tabulas ieguve notiek automātiski. Tas ģenerē izvadi kā XLSX failu. Ja PDF failam ir vairākas tabulas, katra tabula tiek glabāta atsevišķi dažādās XLSX izvades faila lapās.

Atveriet šī pakalpojuma sākumlapu. Pēc tam velciet n drop PDF failus vai izmantojiet Augšupielādējiet datnes pogu. Katrs augšupielādētais PDF tiek automātiski pārveidots par XLSX formāta failu. Kad izvades faili ir gatavi, varat tos lejupielādēt pa vienam vai lejupielādēt ZIP failu, kurā būs visi izvades faili.

2] PDFtoExcel.com

PDFtoExcel.com pakalpojums var vienlaikus iegūt tabulas no viena PDF faila, taču tas atbalsta vairākas platformas, lai augšupielādētu PDF failu. Tas atbalsta OneDrive, darbvirsma, Google disks, un Dropbox platformām, lai augšupielādētu PDF failu. Arī pārveidošanas process ir automātisks.

Šī pakalpojuma sākumlapa ir šeit. Tur atlasiet augšupielādes opciju, lai pievienotu PDF. Pēc tam tas automātiski augšupielādē un pārveido PDF failu Excel (XLSX) failā. Kad izeja ir gatava, jūs saņemsit lejupielādes saiti, lai saglabātu izvades failu, kurā ir PDF tabula (-as).

Piezīme: Lai gan šajā pakalpojumā ir minēts, ka tas var arī iegūt tabulas no skenētiem PDF failiem, tas man nedarbojās. Jūs joprojām varat to izmēģināt skenēta PDF faila iegūšanai.

3] Tabula

Tabula ir spēcīga programmatūra, kas var automātiski noteikt tabulas, kas atrodas PDF failā, un pēc tam ļauj šīs tabulas saglabāt kā TSV, JSON, vai CSV failu. Varat izvēlēties opciju saglabāt atsevišķus CSV failus katrai PDF tabulai vai saglabāt visas tabulas vienā CSV failā.

Lai to lejupielādētu atvērtais avots PDF tabulas nosūcējs, noklikšķiniet šeit. Tas arī nepieciešama Java lai to veiksmīgi palaistu un izmantotu.

Izvelciet lejupielādēto ZIP failu un palaidiet to tabula.exe failu. Tas atvērs lapu noklusējuma pārlūkprogrammā. Ja lapa nav atvērta, pārlūkprogrammā pievienojiet vietni http: // localhost: 8080 un nospiediet Enter.

Tagad jūs redzēsiet tā saskarni, kurā varat izmantot Pārlūkot iespēja pievienot PDF. Pēc tam nospiediet Importēt pogu. Kad PDF ir pievienots, tā saskarnē varat redzēt PDF lapas.

Izmantot Automātiskās noteikšanas tabulas pogu, un tā automātiski iezīmēs visas tabulas, kas atrodas šajā PDF failā. Varat arī manuāli izcelt tabulu, atlasot konkrētu tabulu. Ja vēlaties, varat arī noņemt atlasītās tabulas pēc jūsu izvēles.

Tas palīdzēs jums saglabāt tikai tās tabulas, kuras vēlaties. Kad PDF tabulas ir iezīmētas, noklikšķiniet uz Priekšskatīt un eksportēt iegūtos datus pogu.

Visbeidzot, izmantojiet augšdaļā pieejamo nolaižamo izvēlni, lai atlasītu izvades formātu, un nospiediet Eksportēt pogu. Tas saglabās PDF tabulas jūsu izvēlētajā izvades formāta failā.

4] ByteScout PDF daudzfunkciju rīks

Kā norāda nosaukums, šai programmatūrai ir vairāki rīki. Tam ir tādi rīki kā konvertēt PDF uz daudzlapu TIFF, pagriezt PDF dokumentu, padarīt PDF failu nemeklējamu, optimizēt PDF, pievienojiet attēlu PDF failam, un vēl. Ir arī PDF tabulas detektora funkcija, kas ir diezgan lieliska. Šī rīka priekšrocība ir tā, ka jūs varat izvilkt tabulas no skenēta PDF arī. Jūs varat noteikt tabulas vairākās lapās un pēc tam iegūt šīs tabulas kā CSV, XLS, XML, TXT, vai JSON formāta fails. Pirms ekstrakcijas tas arī ļauj iestatīt a lappušu diapazons lai izvilktu tabulas tikai no norādītajām lappusēm.

Jūs varat paķert šo programmatūru šeit. Tas ir bez maksas nekomerciālai lietošanai tikai. Pēc instalēšanas palaidiet šo programmatūru un izmantojiet Atvērt dokumentu iespēja pievienot PDF. Pēc tam noklikšķiniet uz Noteikt tabulas rīks, kā izcelts attēlā iepriekš. Šis rīks atrodas zem Datu ieguve kategorijā.

Tas atvērs lodziņu, kurā varat iestatīt nosacījumus tabulu noteikšanai. Piemēram, jūs varat iestatīt minimālo kolonnu, rindu skaitu, minimālo līniju pārtraukumu starp tabulām, iestatīt tabulas noteikšanas režīmu uz tabulas apmali vai bez robežas utt. Izmantojiet opcijas vai saglabājiet noklusējuma iestatījumus.

Pēc tam nospiediet Noteikt nākamo tabulu pogu šajā lodziņā. Tas identificēs un atlasīs tabulu pašreizējā lapā. Tādā veidā jūs varat pāriet uz citu lapu un noteikt vairāk tabulu.

Kad esat pabeidzis, izmantojiet Pāriet uz ekstrakciju un atlasiet izvades formātu. Visbeidzot, varat izmantot opcijas, lai saglabātu tabulas no pašreizējās lapas vai definētu lappušu diapazonu un saglabātu izvadi.

Šis rīks nodrošina apmierinošu rezultātu. Bet dažreiz tas var atklāt citu saturu PDF formātā un, iespējams, nevarēs izvilkt tabulas no vairākām lapām. Tādā gadījumā jums tas jāizmanto, lai pa vienam ienesītu un saglabātu tabulas.

5] Sejda PDF darbvirsma

Sejda PDF Desktop ir arī daudzfunkcionāla programmatūra. Tas var optimizēt vai saspiest PDF, pievienot ūdenszīmi PDF failam, noņemt ierobežojumus no PDF, rediģēt PDF dokumentu utt. Tomēr tā bezmaksas plānam ir ierobežojumi. Bezmaksas plānā dienā var veikt tikai 3 uzdevumus. Arī PDF lieluma ierobežojums ir 50 MB vai 10 lappuses.

Jūs varat to izmantot PDF uz Excel konvertēšanas rīks, lai iegūtu PDF tabulas. Tas automātiski nosaka tabulas PDF lapās un ļauj saglabāt šīs tabulas kā XLSX vai CSV.

Tās lejupielādes saite ir šeit. Pēc instalēšanas izmantojiet rīku PDF uz Excel no tā galvenā interfeisa. Pēc šī rīka izvēles izmantojiet Izvēlieties PDF failus pogu. Bezmaksas plānam var pievienot tikai vienu PDF failu.

Kad PDF tiks pievienots, tas nodrošinās Konvertēt PDF uz CSV un Konvertēt PDF uz Excel pogas. Izmantojiet pogu, un pēc tam jūs varat saglabāt izvadi vajadzīgajā datora vietā.

Tā PDF tabulas noteikšanas rīks ir labs. Jums nav manuāli jānosaka tabulas. Tomēr dažreiz tas var ietvert citu teksta saturu kā PDF tabulu un saglabāt to izvadē. Bet kopumā rezultāti ir labi.

Tas ir viss.

Šie ir daži labi rīki tabulu iegūšanai no PDF. Tabula programmatūra ir efektīvāka nekā citi rīki. Tomēr jūs varat izmēģināt visus rīkus un pārbaudīt, kas palīdz.

Līdzīgi skan:

OpenTTD apmācība
OpenTTD ir viena no populārākajām biznesa simulācijas spēlēm. Šajā spēlē jums ir jāizveido brīnišķīgs transporta bizness. Tomēr jūs sāksit sākumā apmē...
SuperTuxKart operētājsistēmai Linux
SuperTuxKart ir lielisks nosaukums, kas paredzēts, lai sniegtu jums Mario Kart pieredzi bez maksas jūsu Linux sistēmā. Tas ir diezgan izaicinoši un ja...
Cīņa par Vesnota apmācību
Cīņa par Vesnotu ir viena no populārākajām atvērtā koda stratēģijas spēlēm, kuru jūs varat spēlēt šajā laikā. Šī spēle ir izstrādāta ne tikai ļoti ilg...