Διαφήμιση

Εάν θέλετε να μετατρέψετε οποιοδήποτε τυπωμένο κείμενο σε ψηφιακό κείμενο που μπορείτε να αντιγράψετε, επικολλήσετε, επεξεργαστείτε και αναζητήσετε, θα πρέπει να χρησιμοποιήσετε σαρωτές οπτικής αναγνώρισης χαρακτήρων (OCR).

Όταν επιλέγετε να σαρώσετε ή να τραβήξετε μια φωτογραφία ενός εγγράφου, αυτό θα αποθηκευτεί σε μορφή όπως JPEG ή PDF. Λογισμικό OCR μπορεί να αναγνωρίσει τα γράμματα και τους αριθμούς μέσα σε αυτά τα έγγραφα και να τα μετατρέψει σε a PDF που μπορεί να αναζητηθεί 4 Μέθοδοι δημιουργίας και επεξεργασίας αρχείων PDF δωρεάνΑπό όλους τους κοινούς τύπους αρχείων που βρέθηκαν στον κόσμο των υπολογιστών μας, το PDF είναι ίσως ένα από τα πιο περιοριστικά, ενώ ταυτόχρονα είναι διαθέσιμο για χρήση από όλους (κυρίως για ανάγνωση) ... Διαβάστε περισσότερα , ή σε ένα αρχείο που μπορείτε να επεξεργαστείτε σε προγράμματα όπως το Microsoft Word.

Το πρόβλημα είναι ότι ορισμένοι σαρωτές OCR λειτουργούν πολύ καλύτερα από τους άλλους, με το καλύτερο να είναι πολύ βαρύ στο πορτοφόλι.

instagram viewer

Omnipage18 για παράδειγμα, κοστίζει $ 150, αλλά είναι ιδιαίτερα καλό στην αναγνώριση διαφορετικών γλωσσών. Adobe Acrobat Pro DC κοστίζει $ 400, αλλά έχει απίστευτη ακρίβεια. ABBYY FineReader κοστίζει $ 150, αλλά είναι φανταστικό στη μετατροπή εγγράφων όπως περιοδικά και φυλλάδια σε κείμενο με δυνατότητα αναζήτησης. Θα δοκιμάσουμε online την ABBYY για αργότερα σε αυτό το άρθρο.

Ωστόσο, αν είστε μετά από δωρεάν εναλλακτικές λύσεις που μπορείτε Κατεβάστε και χρήση σε Windows ή OS X, πρέπει δοκιμάστε αυτά τα εργαλεία OCR Τα 5 καλύτερα εργαλεία OCR για την εξαγωγή κειμένου από εικόνεςΌταν έχετε δεσμίδες χαρτιού, πώς μπορείτε να μετατρέψετε όλο αυτό το τυπωμένο κείμενο σε κάτι που ένα ψηφιακό πρόγραμμα θα είναι σε θέση να αναγνωρίσει και να δείξει; Κρατήστε ένα καλό λογισμικό OCR κοντά. Διαβάστε περισσότερα . Αλλά αν προτιμάτε να χρησιμοποιήσετε ένα δωρεάν, Σε σύνδεση OCR, συνεχίστε να διαβάζετε, καθώς δοκιμάσαμε τα κορυφαία μερικά, με τα παρακάτω αποτελέσματα.

Το τέστ

Φαίνεται ότι οι περισσότεροι άνθρωποι χρησιμοποιούν τώρα τους smartphones για να κάνουν τη σάρωση τους για αυτούς Σάρωση & διαχείριση των εσόδων σας, εξοικονόμηση χώρου, χαρτιού & ώραςΟι αποδείξεις χαρτιού χάνονται εύκολα και είναι δύσκολο να εντοπιστούν όταν τις χρειάζεστε περισσότερο. Ευτυχώς, η ψηφιακή επίλυση και των δύο αυτών προβλημάτων. Διαβάστε περισσότερα , Αποφάσισα να το χρησιμοποιήσω Η εφαρμογή Scannable της Evernote (Δωρεάν σε iOS και Android). Σάρωσα την πρώτη σελίδα του Richard Dawkin Ανεβαίνοντας Όρος απίθανη, για να δούμε τι αποτελέσματα θα μπορούσαμε να πάρουμε με πολύ βασικό μορφοποίηση. Έχω επίσης σαρώνει μια σελίδα του Tim Ferriss ' Ο 4ωρος σεφ για να δοκιμάσετε τους σαρωτές με λίγο πιο περίπλοκη μορφοποίηση. Έχω αποθηκεύσει κάθε ένα από αυτά τα αρχεία ως PDF.

Δοκιμάστε τα online OCR

Αυτά τα έγγραφα στη συνέχεια εκτελέστηκαν μερικά από τα υποτιθέμενα καλύτερα εργαλεία OCR online για να δουν πόσο καλά τα κατάφεραν.

Δωρεάν OCR σε σύνδεση [δεν διατίθεται πλέον]

Ευτυχώς, δεν απαιτείται εγγραφή για τη χρήση του Free Online OCR. Και ήμουν εντυπωσιασμένος διπλά όταν έβλεπα την αξίωσή τους να διατηρήσω τη μορφοποίηση και τη διάταξη του εγγράφου μου.

Δωρεάν OCR στο διαδίκτυο

Ο ιστότοπος ισχυρίζεται ότι είναι σε θέση να υποστηρίξει τα PDF, GIF, BMP, JPEG, TIFF και PNG ως εισροή. Οι εξόδους μπορούν να είναι είτε DOC, έγγραφο κειμένου PDF, RTF και TXT. Δυστυχώς, δεν μπορούσα να μάθω εάν είχαν ένα όριο μεγέθους αρχείου.

Βασικό έγγραφο σε μορφή PDF
Μετατραπεί απολύτως τέλεια. Δεν υπάρχει τίποτα περισσότερο να πω! Είμαστε ανοικτοί σε ένα πολύ καλή αρχή.

Βασικό έγγραφο στο DOC
Οι πραγματικές λέξεις φαίνεται να έχουν μετατραπεί άψογα, εκτός από το "ount" από το "Mount Rushmore" με κάποιο τρόπο AWOL. Η μορφοποίηση είναι μια διαφορετική ιστορία, όμως. Πολλά κόμματα αντικαταστάθηκαν με υπογράμμισες και τυχαία κενά εισήχθησαν σε σημεία σε όλο το έγγραφο. Όταν θα δείτε αργότερα πώς το λογισμικό ασφάλιστρα ταιριάζει σε αυτό το τεστ όμως, αυτό δεν είναι μια κακή προσπάθεια καθόλου.

Σύνθετο έγγραφο σε μορφή PDF
Η μετατροπή του εγγράφου απέτυχε 120 δευτερόλεπτα! Αφού ολοκληρωθεί, όλο το κείμενο είχε μετατραπεί με ακρίβεια 95%, αν και το κείμενο στο ξεχωριστό πλαίσιο στο επάνω δεξιό μέρος της σελίδας ήταν ακατάλληλο. Λίγοι άλλοι χαρακτήρες σε όλο το PDF ήταν επίσης εσφαλμένοι.

Σύνθετο έγγραφο σε DOC
Αυτή τη φορά, η μετατροπή χρειάστηκε μόνο 10 δευτερόλεπτα, με το κείμενο να μετατρέπεται και πάλι με ακρίβεια 95%. Υπήρχαν κάποιες περίεργες αποστάσεις και το λογισμικό αντιμετώπιζε πρόβλημα στη μετατροπή της γραμματοσειράς στο πάνω δεξιά μέρος του εγγράφου και έχασε μερικούς χαρακτήρες εδώ και εκεί.

Ετυμηγορία
Εάν θέλετε να μετατρέψετε απλά μορφοποιημένα έγγραφα σε PDF, αυτό είναι ένα φανταστικό εργαλείο. Όσον αφορά τη μετατροπή σε DOC, τα αποτελέσματα δεν ήταν τίποτα για να γράψουμε στο σπίτι.

Το i2OCR κάνει κάποιες εντυπωσιακές αξιώσεις. Το εργαλείο αναγνωρίζει πάνω από 60 γλώσσες, μπορεί να χειριστεί διατάξεις πολλαπλών στηλών (αφαιρώντας τη μορφοποίηση), δεν έχει όρια μεγέθους αρχείου, μπορεί να μετατρέψει αρχεία που έχουν μεταφορτωθεί και από τις διευθύνσεις URL. Και δεν χρειάζεται να εγγραφείτε για να χρησιμοποιήσετε αυτό το εργαλείο.

Η υπηρεσία λειτουργεί απλά αφαιρώντας το κείμενο από την εικόνα σας και στη συνέχεια εκτυπώνοντας μη μορφοποιημένο κείμενο. Μπορείτε να διορθώσετε γρήγορα τυχόν λάθη στην προβολή δίπλα-δίπλα, προτού αντιγράψετε το κείμενο σε άλλα προγράμματα ή μεταφορτώσετε ως DOC, PDF ή HTML.

Σημείωση: όταν προσπάθησα να ανεβάσω τα έγγραφά μου στο PDF, αυτά απορρίφθηκαν από το i2OCR, οπότε έπρεπε να τα μετατρέψω σε JPEG (τραβώντας ένα στιγμιότυπο οθόνης από αυτά, φορτώνοντας τα αρχεία).

Βασικό έγγραφο σε απλό κείμενοΣτιγμιότυπο οθόνης 2016-02-11 στις 12.30.28
Λόγω του τρόπου με τον οποίο λειτουργεί αυτό το εργαλείο, χάνονται όλες οι μορφοποιήσεις, αν και η μετατροπή από εικόνα σε κείμενο ήταν σχεδόν τέλεια. Υπήρξαν μερικά μικρά σφάλματα, όπως η απόσταση μεταξύ των παραγράφων, και μερικά κόμματα αντικαταστάθηκαν με περιόδους, αλλά αυτά είναι μικρά niggles.

Σύνθετο έγγραφο σε απλό κείμενοScreen Shot 2016-02-11 στις 12.39.48
Η πλειοψηφία του κειμένου μετατράπηκε χωρίς πάρα πολλά λάθη, εκτός από τον τίτλο και τη συνταγή στην πάνω δεξιά γωνία, η οποία ήταν δυσανάγνωστη για αυτό το εργαλείο. Ο τρόπος με τον οποίο οι κίονες μετατράπηκαν σε απλό κείμενο δεν ήταν ιδανικός. Εάν θέλετε να καταστήσετε τη μετατροπή αυτή εφικτή, θα χρειαστεί πολύς χρόνος για την αναδιάταξη των γραμμών σε συνεκτικές προτάσεις.

Ετυμηγορία
Για βασικά έγγραφα, το i2OCR λειτουργεί εξαιρετικά. Η δυνατότητα επεξεργασίας του κειμένου πριν από τη λήψη είναι επίσης μια πολύ ωραία πινελιά. Για πιο περίπλοκα έγγραφα, ωστόσο, η μετατροπή εξακολουθεί να είναι αρκετά ακριβής, αλλά ο τρόπος με τον οποίο το κείμενο εξάγεται δεν θα κάνει τη ζωή σας πολύ πιο εύκολη.

Το online OCR υποστηρίζει επί του παρόντος 46 διαφορετικές γλώσσες και μπορεί να μετατρέψει PDF, JPG, BMP, TIFF και GIF σε μορφή Word, Excel ή απλού κειμένου. Ο ιστότοπος ισχυρίζεται ότι τα "μετατρεπόμενα έγγραφα φαίνονται ακριβώς όπως τα πρωτότυπα - πίνακες, στήλες και γραφικά".

Η έκδοση που μπορείτε να χρησιμοποιήσετε χωρίς εγγραφή σας επιτρέπει να μετατρέψετε μέχρι 15 εικόνες ανά ώρα (όριο 5mb). Αν εγγραφείτε για λογαριασμό, μπορείτε να αγοράσετε περισσότερες σελίδες πάνω από αυτό το όριο, ενώ παράλληλα μπορείτε να μετατρέπετε έγγραφα πολλών σελίδων και αρχεία ZIP επίσης.

Αποτελέσματα OCR online

Βασικό έγγραφο στο DOC
Το βασικό έγγραφο μετατράπηκε άψογα εκτός του ρωμαϊκού αριθμού Εγώ δεν έχει ληφθεί. Όπως υποσχέθηκε η τοποθεσία, η μορφοποίηση ήταν ακριβώς όπως ήταν στο βιβλίο. Kudos σε αυτό το εργαλείο.

Σύνθετο έγγραφο σε DOC
Αφού απογοητευτήκαμε από τα προηγούμενα εργαλεία OCR για τη μετατροπή του περίπλοκου εγγράφου, ήμουν εντυπωσιασμένος μαζικά από το Online OCR. Η διάταξη ήταν σχεδόν τέλεια, όπως μπορείτε να δείτε παραπάνω. Για άλλη μια φορά, η συνταγή δεν λήφθηκε πολύ καλά, αλλά οποιαδήποτε άλλα μικρά λάθη ήταν αμελητέα.

Ετυμηγορία

Απόλυτα φανταστικά αποτελέσματα από το online OCR. Το μόνο μειονέκτημα που βλέπω είναι ότι δεν υπάρχει τρόπος να κατεβάσετε τα μετατραποντα έγγραφα ως PDF, καθώς οι μορφές εξόδου που αναφέρονται περιλαμβάνουν μόνο DOCX, XLSX και TXT μόνο.

Όπως αναφέρθηκε προηγουμένως, η ABBYY είναι ένας από τους ηγέτες της αγοράς στο λογισμικό OCR, κοστίζοντας περίπου $ 150 για το πλήρες, downloadable πρόγραμμα. Προσφέρουν ένα Δωρεάν δοκιμή 10 σελίδων για το ηλεκτρονικό εργαλείο τους, αν και απαιτείται εγγραφή. Για συνδρομή $ 5, το ηλεκτρονικό εργαλείο τους θα σας επιτρέψει να μετατρέψετε 200 σελίδες κάθε μήνα.

ABBYY FineReader Online

Τα αρχεία που γίνονται αποδεκτά μπορούν να φτάσουν μέχρι και 100mb, σε οποιαδήποτε από αυτές τις μορφές: PDF, JPG, JPEG, TIF, TIFF, PCX, DCX, BMP και PNG. Η ABBYY αναγνωρίζει επίσης περίπου 200 γλώσσες. Οι έξοδοι είναι ιδιαίτερα εντυπωσιακές, με δυνατότητα επιλογής μεταξύ DOCX, XLSX, RTF, TXT, PPTX, ODT, PDF, FB2 και EPUB.

Μπορείτε να δοκιμάσετε ακόμη και μερικά χαρακτηριστικά BETA κατά τη διάρκεια της δοκιμής σας. Η πρώτη είναι η επιλογή να μεταφράσετε το έγγραφό σας σε άλλη γλώσσα. Το άλλο είναι να εξαγάγετε το έγγραφο που έχετε μετατρέψει στο λογαριασμό αποθήκευσης του cloud, είτε πρόκειται για το Dropbox, το Google Drive, το Evernote, το Microsoft OneDrive ή το Box.

Βασικό έγγραφο στο DOCX
Τα συνολικά αποτελέσματα ήταν καλά, αλλά όχι εκπληκτικά, δεδομένου ότι πρόκειται για ένα προϊόν υψηλής ποιότητας. Πολλαπλά κόμματα και περιόδους ανταλλάχθηκαν, διάφορα ανεστραμμένα κόμματα αντικαταστάθηκαν με ένα αστέρι, λείπουν δυο κεφαλαία γράμματα και μια λέξη (literalist) γράφτηκε λανθασμένα.

Σύνθετο έγγραφο στο DOCX
Μόλις μετατραπούν υπήρχαν πολύ λίγα λάθη στο κείμενο μέσα στο έγγραφο (εκτός από το OCR που αγωνίζεται με τη γραμματοσειρά αυτής της συνταγής πάλι!), Αλλά η μορφοποίηση άφησε πολλά να είναι επιθυμητό.

Αποτέλεσμα του ABBYY

Οι τρεις στήλες κατά κάποιο τρόπο ανέλαβαν δύο σελίδες, με την κεντρική στήλη μόνο που εμφανίζεται στη δεύτερη σελίδα. Αν θέλατε πραγματικά κάνω οτιδήποτε με αυτό το μετατρεπόμενο έγγραφο, θα καταλήγατε να τραβάτε τα μαλλιά σας έξω.

Βασικό έγγραφο σε μορφή PDF
Κατά την εξέταση του PDF που μετατράπηκε, δεν μπορούσα να βρω κανένα λάθος. Ίσως βρήκαμε πού υπερέχει η ABBYY. Φανταστικά αποτελέσματα.

Σύνθετο έγγραφο σε μορφή PDF
Και πάλι, δεν μπορώ να βρω σφάλματα σε αυτό το μετατρεπόμενο αρχείο. Το ABBYY γνωρίζει σαφώς πώς να μετατρέψει σε PDF εξαιρετικά καλά.

Ετυμηγορία
Αν είστε ευτυχείς να πληρώσετε μερικά δολάρια, η μετατροπή σε PDF φαίνεται να λειτουργεί φαινομενικά καλά με αυτή την υπηρεσία και την ύπαρξη ο οποίος είναι σε θέση να συγχρονίσει τα αρχεία που έχουν μετατραπεί στο αποθηκευτικό σας χώρο στο σύννεφο, είναι ιδιαίτερα χρήσιμο αν πραγματοποιείτε σάρωση μεγάλου όγκου έγγραφα. Όπως και με τις άλλες επιλογές, όμως, η ABBYY δεν έχει ακόμα καταλάβει πώς να μετατρέψει άψογα τα έγγραφα σε DOC για εύκολη επεξεργασία.

Το τελικό αποτέλεσμα

Εάν, όπως οι περισσότεροι άνθρωποι, απλώς ψάχνετε να σαρώσετε μερικά άρθρα περιοδικών και μερικούς λογαριασμούς νοικοκυριών, δεν θα χρειαστεί να επεξεργαστείτε τα έγγραφα αυτά. Επομένως, η μετατροπή απευθείας σε PDF θα είναι κατάλληλη για εσάς, επειδή θα μπορείτε να αναζητήσετε τα έγγραφα αυτά. Για αυτό, το Free Online OCR ήταν σίγουρα το καλύτερο δωρεάν εργαλείο που δοκιμάσαμε. Τούτου λεχθέντος, αν είστε πρόθυμοι να πληρώσετε 5 δολάρια το μήνα για σχεδόν τέλεια, Το FineReader Online της ABBYY ήταν λίγο πιο ακριβής.

Όταν πρόκειται να μετατρέψουμε τα έγγραφα σε DOC, δεν καταφέραμε να βρούμε καμία λύση που να ήταν τέλεια, αλλά μακράν τα καλύτερα αποτελέσματα προήλθαν από Online OCR. Η μετατροπή δεν ήταν τέλεια, αλλά η ακεραιότητα της μορφοποίησης διατηρήθηκε σε μεγάλο βαθμό άθικτη και τα λάθη ήταν αμελητέα. Όταν συγκρίνουμε αυτά τα αποτελέσματα με την προσφορά "premium" από την ABBYY, δεν μπορείτε να βοηθήσετε παρά να εντυπωσιαστείτε μαζικά.

Δεν συμπεριλάβαμε Οι δυνατότητες OCR του Google Drive σε αυτή τη θέση. λίγο για την καθετοποίηση της Google, αλλά περισσότερο για το γεγονός ότι θέλαμε να δοκιμάσουμε μερικές άλλες δωρεάν υπηρεσίες OCR online εκεί έξω.

Πάνω σε σας: Ποια άλλα εργαλεία OCR online θα συνιστούσατε στους αναγνώστες μας; Και που προσπαθήσατε να μην ξαναχρησιμοποιήσετε;

Ο Rob Nightingale έχει πτυχίο Φιλοσοφίας από το Πανεπιστήμιο του York, Ηνωμένο Βασίλειο. Έχει εργαστεί ως διευθυντής και σύμβουλος κοινωνικών μέσων μαζικής ενημέρωσης για πάνω από πέντε χρόνια, ενώ παράλληλα πραγματοποιεί εργαστήρια σε διάφορες χώρες. Για τα τελευταία δύο χρόνια, ο Rob ήταν επίσης συγγραφέας τεχνολογίας και είναι ο Social Media Manager της MakeUseOf και ο Επεξεργαστής Newsletter. Συνήθως θα τον βρείτε να ταξιδεύει...