Bezmaksas programmatūra

Izvilkt tekstu no PDF failiem

Izvilkt tekstu no PDF failiem

Strādājot ar PDF vai Portable Document Format failiem, dažreiz jūs to varētu vēlēties izvilkt visu tekstu no PDF faila. Šajā rokasgrāmatā mēs parādīsim, kā jūs varat viegli iegūt tekstu no PDF failiem vai pārveidot PDF failus par teksta failiem sistēmā Windows ar vai bez tiešsaistes rīku palīdzības.

Vienkāršākais un ātrākais veids, kā iegūt tekstu no PDF failiem, ir izmantot bezmaksas tiešsaistes pakalpojumus. Šiem tiešsaistes pakalpojumiem nav nepieciešama papildu programmatūra, kas nozīmē, ka jūs varat paveikt savu darbu bez papildu programmatūras instalēšanas datorā.

Ja zemāk minētie tiešsaistes pakalpojumi nesniedz vēlamos rezultātus vai vēlaties izvilkt tekstu no sensitīva rakstura, kuru nevēlaties augšupielādēt attālajā serverī, varat pārbaudīt bezmaksas Windows programmatūru, kas minēta 3. līdz 5. metodē. Izlasiet arī mūsu 6 veidus, kā saspiest PDF failus.

1. metode no 6

ExtractPDF

ExtractPDF ir bezmaksas tiešsaistes pakalpojums, lai tekstu un attēlus pilnveidotu no PDF failiem. Pakalpojums piedāvā viegli saprotamu izkārtojumu. Pēc tīmekļa pārlūkprogrammas ExtractPDF lapas atvēršanas noklikšķiniet uz pogas Pārlūkot, lai atlasītu PDF failu, noklikšķiniet uz pogas Augšupielādēt, lai augšupielādētu atlasīto failu ExtractPDF serverī un sāktu ekstrakciju.

Kad darbs ir pabeigts, jūs redzēsit iespējas lejupielādēt teksta kontekstu, fontus un attēlus no augšupielādētā PDF faila. Lai lejupielādētu izvilkto tekstu kā .txt fails (lai atvērtu Notepad vai Word), pārslēdzieties uz cilni Teksts un pēc tam noklikšķiniet uz pogas Lejupielādēt rezultātu kā failu.

Kā redzat augšējā attēlā, pakalpojums neatbalsta failus, kuru lielums pārsniedz 12 MB. Šim ierobežojumam nevajadzētu būt programmai, jo lielākā daļa PDF failu būs mazāki par 12 MB.

Pārbaudes laikā mēs pamanījām, ka dažiem PDF failiem pakalpojums nesniedz vēlamo rezultātu. Ja jums ir kādas problēmas ar šo pakalpojumu, pārbaudiet nākamo.

2. metode no 6

Tiešsaistes OCR

Tiešsaistes OCR ir tiešsaistes rīks, kas palīdz jums iegūt tekstu no PDF failiem, kuru izmērs ir mazāks par 5 MB. Pakalpojums pārveido PDF failus rediģējamā Microsoft Word (.docx) vai Teksts (.txt) faili.

3. metode no 6

STDU skatītājs

Būtībā STDU Viewer ir bezmaksas programmatūra, kas paredzēta vairāku failu formātu atvēršanai un skatīšanai. Papildus tam STDU Viewer bezmaksas versija atbalsta teksta satura eksportēšanu no PDF failiem.

Lai eksportētu PDF faila teksta saturu, atveriet PDF failu, izmantojot STDU Viewer, noklikšķiniet uz izvēlnes Fails, noklikšķiniet uz Eksportēt, noklikšķiniet uz Teksts, atlasiet vietu, kur saglabāt jauno teksta failu, un pēc tam noklikšķiniet uz pogas Labi.

Eksportēšanas opcija ļauj iegūt tekstu no vienas, vairākām vai visām lapām. STDU Viewer lejupielādes lielums ir mazāks par 3 MB. STDU Viewer bezmaksas versija ir paredzēta tikai personīgai un nekomerciālai lietošanai.

4. metode no 6

PDF2Text Pilot

PDF2Text Pilot ir bezmaksas programmatūra Windows, kas ar peles klikšķi var konvertēt PDF failus teksta failos. Pēc programmatūras instalēšanas un palaišanas jums vienkārši jāizvēlas PDF fails (-i), kuru (-s) vēlaties redzēt kā teksta failus, un pēc tam noklikšķiniet uz pogas Konvertēt. Jūsu konvertētie faili būs gatavi pēc dažām sekundēm.

PDF2Text Pilot stiprā puse ir tā vienkāršā saskarne un spēja vienlaikus pārveidot vairākus PDF failus.

5. metode no 6

A PDF teksta nosūcējs

A PDF Text Extractor ir vēl viena Windows programmatūra, kas paredzēta teksta iegūšanai no PDF failiem. Programmatūra ir pilnīgi bez maksas gan personīgai, gan komerciālai lietošanai.

Pēc A-PDF Text Extractor instalēšanas (instalētāja izmērs ir mazāks par 1 MB), palaidiet A-PDF Text Extractor. Noklikšķiniet uz pogas Atvērt, lai atvērtu PDF failu, un pēc tam noklikšķiniet uz pogas Izvilkt tekstu, lai sāktu no tā izvilkt tekstu.

6. metode no 6

Gaaiho PDF lasītājs

Gaaiho PDF Reader ir lieliska programmatūras daļa, kas paredzēta, lai apstrādātu PDF failus. Šī bezmaksas programmatūra piedāvā daudzas funkcijas, kuras nevarat atrast citu bezmaksas PDF lasītāju programmatūru. Viena no funkcijām ir spēja viegli iegūt tekstu no PDF failiem.

Lai saglabātu PDF failu kā teksta failu, pēc PDF faila atvēršanas Gaaiho Reader noklikšķiniet uz izvēlnes Fails, noklikšķiniet uz Saglabāt kā un pēc tam nolaižamajā izvēlnē blakus opcijai Saglabāt kā atlasiet opciju PDF uz tekstu.

Ko jūs domājat par šiem rīkiem? Vai jūs zināt labāku bezmaksas rīku tam pašam darbam? Informējiet mūs komentāros.

SuperTuxKart operētājsistēmai Linux
SuperTuxKart ir lielisks nosaukums, kas paredzēts, lai sniegtu jums Mario Kart pieredzi bez maksas jūsu Linux sistēmā. Tas ir diezgan izaicinoši un ja...
Cīņa par Vesnota apmācību
Cīņa par Vesnotu ir viena no populārākajām atvērtā koda stratēģijas spēlēm, kuru jūs varat spēlēt šajā laikā. Šī spēle ir izstrādāta ne tikai ļoti ilg...
0 A.D. Apmācība
No daudzajām stratēģijas spēlēm 0 A.D. izdodas izcelties kā visaptverošs nosaukums un ļoti dziļa, taktiska spēle, neskatoties uz to, ka tā ir atvērtā ...