Εξαγωγή κειμένου από αρχεία PDF

Ενώ ασχολείστε με αρχεία μορφής PDF ή φορητού εγγράφου μορφής, κατά καιρούς, ίσως θελήσετε να εξαγάγετε όλο το κείμενο από ένα αρχείο PDF . Σε αυτόν τον οδηγό θα δείξουμε πώς μπορείτε εύκολα να εξαγάγετε κείμενο από αρχεία PDF ή να μετατρέψετε αρχεία PDF σε αρχεία κειμένου στα Windows με ή χωρίς τη βοήθεια ηλεκτρονικών εργαλείων.

Ο ευκολότερος και ταχύτερος τρόπος για να εξαγάγετε κείμενο από αρχεία PDF είναι να χρησιμοποιήσετε δωρεάν ηλεκτρονικές υπηρεσίες. Αυτές οι ηλεκτρονικές υπηρεσίες δεν απαιτούν πρόσθετο λογισμικό, που σημαίνει ότι μπορείτε να κάνετε τη δουλειά σας χωρίς να χρειάζεται να εγκαταστήσετε οποιοδήποτε πρόσθετο λογισμικό στον υπολογιστή σας.

Εάν οι παρακάτω ηλεκτρονικές υπηρεσίες δεν δίνουν τα επιθυμητά αποτελέσματα ή θέλετε να εξαγάγετε κείμενο από ένα ευαίσθητο που δεν θέλετε να μεταφορτώσετε σε έναν απομακρυσμένο διακομιστή, μπορείτε να δείτε το δωρεάν λογισμικό των Windows που αναφέρεται στη Μέθοδο 3 έως 5. Επίσης, διαβάστε τους 6 τρόπους συμπίεσης του οδηγού αρχείων PDF.

Μέθοδος 1 από 6

ExtractPDF

Το ExtractPDF είναι μια δωρεάν ηλεκτρονική υπηρεσία για την πλήρη αποτύπωση κειμένου και εικόνων από αρχεία PDF. Η υπηρεσία προσφέρει μια εύκολη στη διάγνωση διάταξη. Μετά το άνοιγμα της σελίδας ExtractPDF στο πρόγραμμα περιήγησης ιστού, κάντε κλικ στο κουμπί Αναζήτηση για να επιλέξετε το αρχείο PDF, κάντε κλικ στο κουμπί Upload (Μεταφόρτωση) για να μεταφορτώσετε το επιλεγμένο αρχείο στο διακομιστή του ExtractPDF και να ξεκινήσετε την εξαγωγή.

Μόλις τελειώσει η εργασία, θα δείτε επιλογές για λήψη πλαισίου κειμένου, γραμματοσειρών και εικόνων από το αρχείο PDF που έχει μεταφορτωθεί. Για να κάνετε λήψη του εξαγόμενου κειμένου ως αρχείο .txt (για να το ανοίξετε στο Notepad ή στο Word), μεταβείτε στην καρτέλα Κείμενο και, στη συνέχεια, κάντε κλικ στην επιλογή Λήψη αποτελεσμάτων ως κουμπί αρχείου.

Όπως μπορείτε να δείτε στην παραπάνω εικόνα, η υπηρεσία δεν υποστηρίζει αρχεία μεγαλύτερα των 12 MB. Αυτός ο περιορισμός δεν πρέπει να είναι ένα πρόγραμμα, καθώς τα περισσότερα αρχεία PDF θα είναι κάτω από 12 MB.

Κατά τη διάρκεια της δοκιμής μας, παρατηρήσαμε ότι για ορισμένα αρχεία PDF η υπηρεσία δεν δίνει την επιθυμητή έξοδο. Αν αντιμετωπίζετε προβλήματα με αυτήν την υπηρεσία, ελέγξτε την επόμενη.

Μέθοδος 2 από 6

Online OCR

Το online OCR είναι ένα ηλεκτρονικό εργαλείο που σας βοηθά να εξάγετε κείμενο από αρχεία PDF μικρότερα των 5 MB. Η υπηρεσία μετατρέπει τα αρχεία PDF σε επεξεργάσιμα αρχεία Microsoft Word (.docx) ή Text (.txt).

Μέθοδος 3 από 6

STDU Viewer

Βασικά, το STDU Viewer είναι ένα ελεύθερο λογισμικό που έχει σχεδιαστεί για να ανοίγει και να προβάλλει πολλαπλές μορφές αρχείων. Εκτός αυτού, η δωρεάν έκδοση του STDU Viewer υποστηρίζει την εξαγωγή περιεχομένων κειμένου από αρχεία PDF.

Για να εξαγάγετε τα περιεχόμενα κειμένου ενός αρχείου PDF, ανοίξτε το αρχείο PDF με το πρόγραμμα STDU Viewer, κάντε κλικ στο μενού Αρχείο, κάντε κλικ στην επιλογή Εξαγωγή, κάντε κλικ στο κουμπί Για να κειμένου, επιλέξτε μια θέση για να αποθηκεύσετε το νέο αρχείο κειμένου και, στη συνέχεια, κάντε κλικ στο κουμπί OK.

Η επιλογή εξαγωγής σάς επιτρέπει να εξάγετε κείμενο από μία, πολλαπλές ή όλες τις σελίδες. Το μέγεθος λήψης του προγράμματος STDU Viewer είναι μικρότερο από 3 MB. Η δωρεάν έκδοση του STDU Viewer είναι μόνο για προσωπική και μη εμπορική χρήση.

Μέθοδος 4 από 6

PDF2Text Pilot

Το PDF2Text Pilot είναι ένα δωρεάν λογισμικό για Windows για τη μετατροπή αρχείων PDF σε αρχεία κειμένου με το πάτημα του ποντικιού. Αφού εγκαταστήσετε και εκτελέσετε το λογισμικό, απλά πρέπει να επιλέξετε τα αρχεία PDF που θέλετε να δείτε ως αρχεία κειμένου και στη συνέχεια κάντε κλικ στο κουμπί Μετατροπή. Τα αρχεία που έχετε μετατρέψει θα είναι έτοιμα σε λίγα δευτερόλεπτα.

Η δύναμη του PDF2Text Pilot είναι η απλή διεπαφή του και η δυνατότητα μετατροπής πολλαπλών αρχείων PDF ταυτόχρονα.

Μέθοδος 5 από 6

A-PDF Extractor κειμένου

Το A-PDF Text Extractor είναι ένα άλλο λογισμικό των Windows σχεδιασμένο να εξάγει κείμενο από αρχεία PDF. Το λογισμικό είναι απολύτως δωρεάν τόσο για προσωπική όσο και για εμπορική χρήση.

Μετά την εγκατάσταση του A-PDF Text Extractor (μέγεθος εγκατάστασης κάτω από 1 MB), ξεκινήστε τον A-PDF Extractor κειμένου. Κάντε κλικ στο κουμπί Άνοιγμα για να ανοίξετε το αρχείο PDF και στη συνέχεια κάντε κλικ στο κουμπί Εξαγωγή κειμένου για να ξεκινήσετε την εξαγωγή κειμένου από αυτό.

Μέθοδος 6 από 6

Gaaiho PDF Reader

Το Gaaiho PDF Reader είναι ένα εξαιρετικό λογισμικό που σχεδιάστηκε για να ασχολείται με αρχεία PDF. Αυτό το ελεύθερο λογισμικό προσφέρει μια πληθώρα χαρακτηριστικών που δεν μπορείτε να βρείτε άλλα δωρεάν λογισμικό ανάγνωσης PDF. Ένα από τα χαρακτηριστικά είναι η δυνατότητα να εξάγετε κείμενο από αρχεία PDF με ευκολία.

Για να αποθηκεύσετε ένα αρχείο PDF ως αρχείο κειμένου, μετά το άνοιγμα του αρχείου PDF στο Gaaiho Reader, κάντε κλικ στο μενού Αρχείο, κάντε κλικ στην επιλογή Αποθήκευση ως και στη συνέχεια επιλέξτε Επιλογή PDF σε κείμενο από το αναπτυσσόμενο μενού δίπλα στην επιλογή Αποθήκευση ως τύπος.

Τι νομίζετε σχετικά με αυτά τα εργαλεία; Γνωρίζετε ένα καλύτερο δωρεάν εργαλείο για την ίδια δουλειά; Ενημερώστε μας στα σχόλια.