UneDose | Jaki jest najlepszy darmowy program OCR lub ICR do transkrypcji rękopisów?

Lesley Fowler
0
2730
213

Reklama

Javier pyta:
Jestem pisarzem opowiadań i opowieści. Szukam darmowego programu do optycznego rozpoznawania znaków (OCR) lub inteligentnego rozpoznawania znaków (ICR) do skanowania moich starych rękopisów z obrazów lub fotografii, aby móc je przekonwertować na pliki Microsoft Word.

Czy są dostępne jakieś bezpłatne i dokładne programy? Niestety nie mam skanera, ale mam dostęp do aparatu cyfrowego o rozdzielczości 20 megapikseli.

Odpowiedź Kannona:

Jak już wspomniano, istnieje kilka rodzajów technologii rozpoznawania znaków, które mogą automatycznie konwertować pismo odręczne lub pisanie na maszynie na znaki cyfrowe. Poziom dokładności tego rodzaju oprogramowania różni się znacznie między poszczególnymi implementacjami. Niektóre konwertują na zasadzie litera za literę, a inne mogą konwertować całe słowa. Istnieją trzy ogólne kategorie tego oprogramowania:

Optyczne rozpoznawanie znaków (OCR)
Inteligentne rozpoznawanie znaków (ICR)
Inteligentne rozpoznawanie słów (IWR)

Optyczne rozpoznawanie znaków

Prawdę mówiąc, OCR jest terminem ogólnym i często wszystkie metody opisane w tym artykule są nazywane OCR - Wikipedia jednak przyznaje OCR własną klasyfikację, ale współczesne implementacje mają tendencję do łączenia wielu metod. Co to robi? OCR konwertuje pojedyncze lub ręcznie pisane litery na znaki cyfrowe. Oprogramowanie sprawdza dokument, a następnie próbuje go przekonwertować na zwykły tekst, zgadując, co to za znak.

Oprogramowanie nie jest idealne. Oprogramowanie OCR może błędnie interpretować pojedyncze znaki o podobnym wyglądzie, co prowadzi do błędnych słów i niedokładnych wyników. Przez większość czasu użytkownicy mogą kopiować tekst generowany przez program OCR do edytora tekstu i automatycznie naprawiać błędy ortograficzne. Często błędy pojawiają się jako podobne znaki. Na przykład list “re” może być reprezentowany jako “kl”.

Ale jeśli chodzi o odręczne teksty, OCR nie radzi sobie zbyt dobrze. Przynajmniej większość bezpłatnych wdrożeń jest tragicznie zła. Istnieje kilka komercyjnych produktów, które mogą naprawdę ręcznie napisana transkrypcja paznokci, ale ich cena sprawia, że są one całkowicie niedostępne dla ogółu społeczeństwa. Na przykład istnieje oprogramowanie ReadSoft OCR firmy Lexmark. To oprogramowanie tylko dla przedsiębiorstw kosztuje tysiące dolarów.

Inteligentne rozpoznawanie postaci

ICR to podzbiór OCR, który specjalizuje się w konwertowaniu odręcznego tekstu na pojedyncze znaki cyfrowe. Biorąc pod uwagę, że twoje notatki i rękopisy są odręczne, najbardziej przydatny jest program ICR. Nie jestem jednak pewien, jak dokładnie potrafią konwertować teksty napisane w językach obcych, takich jak hiszpański. Podobnie jak w przypadku OCR, użytkownicy mogą poprawić jakość drukowanych tekstów, kopiując je do edytora tekstu z włączoną korekcją pisowni, a następnie ręcznie sprawdzając.

Inteligentne rozpoznawanie słów

Najnowsza ewolucja OCR i ICR to oprogramowanie do inteligentnego rozpoznawania słów. Zamiast rozpoznawać poszczególne znaki, próbuje tłumaczyć całe ręcznie napisane słowa. Podobnie jak OCR i ICR, inteligentne rozpoznawanie słów często błędnie tłumaczy słowa i wymaga ręcznego poprawienia popełnionych błędów.

Jakie jest najlepsze bezpłatne oprogramowanie OCR?

Tesseract

Dostępnych jest wiele opcji. Tesseract jest prawdopodobnie najlepszy otwarte źródło (i darmowe) oprogramowanie OCR. O ile mi wiadomo, patrzy tylko na pojedyncze znaki, a nie na całe słowa.

Ponieważ używasz programu Microsoft Word (który ma najlepsze, najbardziej konfigurowalne sprawdzanie pisowni Jak sprawdzać pisownię i gramatykę w programie Microsoft Word Jak sprawdzać pisownię i gramatykę w programie Microsoft Word Możesz dostosować wbudowane narzędzia sprawdzania pisowni i gramatyki w programie Microsoft Word, aby spełnić swoich potrzeb. Możesz nawet użyć Autokorekty, aby przyspieszyć pisanie. w firmach), możesz po prostu skopiować cały tekst do Worda, a następnie uruchomić sprawdzanie pisowni, aby usunąć błędy pisowni.

Tesseract to tak naprawdę silnik OCR, który działa z wiersza poleceń. Jeśli nie masz ochoty poradzić sobie z trudnością posługiwania się narzędziem wiersza poleceń, prawdopodobnie będziesz chciał zainstalować coś bardziej przyjaznego dla użytkownika. Jest do pobrania “front-end” (lub graficzny interfejs użytkownika), który pozwala używać Tesseract jako narzędzia przeciągania i upuszczania: PDF OCR X. Najpierw zainstaluj pakiet oprogramowania, a następnie uruchom go. Zobaczysz wtedy okno:

Następnie po prostu przeciągnij i upuść plik obrazu do okna. Po załadowaniu obrazu uruchom oprogramowanie do transkrypcji OCR. Może to potrwać około minuty.

Niestety okazało się to całkowicie nieodpowiednie do obsługi tekstu. Oto jak to wygląda po wypakowaniu tekstu z dokumentu:

Microsoft OneNote

Ponieważ wygląda na to, że już korzystasz z pakietu Microsoft Office, najlepszą opcją jest prawdopodobnie również Microsoft. Zgaduję, że posiadasz kopię pakietu Microsoft Office, która zawiera OneNote. Jest wyposażony w dość zaawansowaną technologię OCR.

Ponadto, zarówno na iOS, jak i na Androidzie, jest też całkowicie bezpłatny Microsoft Office Lens, który może konwertować JPEG (i inne formaty obrazów) bezpośrednio na tekst. Wersje mobilne są tak wspaniałe, że można zrobić zdjęcie, przesłać go do systemu przetwarzania w chmurze Microsoft, a następnie uruchomić ekstrakcję tekstu z OneNote na komputerze.

Proces jest dość prosty. Najpierw zrób zdjęcie swojego tekstu. Jeśli zdecydowałeś się użyć aplikacji OneNote, musisz tylko zapisać plik na koncie OneDrive. W przeciwnym razie przenieś obraz do komputera i upuść na OneNote.

Następnie kliknij obraz prawym przyciskiem myszy i wybierz Kopiuj Tekst z obrazka z menu kontekstowego.

Następnie kliknij prawym przyciskiem myszy pustą część OneNote (lub w aplikacji do czytania tekstu) i wklej tekst. Tekst wyjściowy z dokumentu wygląda następująco:

Niestety wyniki OneNote nie działają gdziekolwiek blisko dobrej pracy, produkując kompletne bzdury. Może to być spowodowane kombinacją czynników, takich jak zniekształcony obraz lub zapis, który nie jest wykonywany w linii prostej, lub po prostu dlatego, że oprogramowanie nie jest wystarczająco dobre.

Google Keep

W tej chwili najlepsze rozwiązanie dla OCR na dokumentach odręcznych dotyczy uczenia maszynowego: w szczególności uczenia głębokiego. Głębokie uczenie się to wyrafinowana metoda szkolenia komputera w wykonywaniu zadań, które wcześniej wyróżniały się tylko człowiekiem, takich jak rozpoznawanie twarzy (Picasa robi rozpoznawanie twarzy Jak korzystać z rozpoznawania twarzy w Picasa Web Albums Jak wierzyć, jak korzystać z rozpoznawania twarzy w Picasa Web Albums to czy nie). Google niedawno kupił DeepMind, który opracowuje technologię głębokiego uczenia się Cool projekty badawcze, które mogą zmienić przyszłość Cool projekty badawcze, które mogą zmienić przyszłość Czy wielkie korporacje, takie jak Google, Microsoft, IBM i Intel, zapewnią przyszłym pokoleniom świat, który możemy wyobraź sobie teraz? Te ekscytujące projekty badawcze mówią, że dotrzymają obietnicy. . Ta kluczowa akwizycja miała duży wpływ: Microsoft przegrywa z Google w OCR Microsoft vs Google - Kto prowadzi wyścig sztucznej inteligencji? Microsoft vs Google - Kto prowadzi wyścig sztucznej inteligencji? Badacze sztucznej inteligencji robią namacalne postępy, a ludzie znów zaczynają poważnie mówić o sztucznej inteligencji. Dwaj tytani prowadzący wyścig sztucznej inteligencji to Google i Microsoft. . Obecnie Google oferuje jedną z najbardziej zaawansowanych (i bezpłatnych) metod: Google Keep.

Google Keep (który po raz pierwszy sprawdziliśmy w 2013 r. Proste notatki w podróży: Google Keep na Androida recenzowane Proste notatki w podróży: Google Keep na Androida recenzowane Istnieją niesamowite aplikacje do robienia notatek, ale oto jedna z nich, która zasługuje na bliższe spojrzenie : Google Keep, narzędzie do przechowywania notatek, które ma zarówno świetnie wyglądającą aplikację na Androida, jak i elegancką aplikację internetową.) Oferuje także mobilną wersję swojej aplikacji na Androida. Podobnie jak w OneNote, możesz zrobić zdjęcie i przenieść je bezpośrednio do chmury Google. Po prostu przeciągnij obraz do okna Google Keep. Następnie kliknij przycisk menu (trzy pionowe kropki) i wybierz Chwyć tekst obrazu z menu kontekstowego.

Oto jak to wygląda po rozpakowaniu tekstu:

Google Keep wygrywa

Jak widać, Google Keep dominuje w konkurencji. Wyniki można jeszcze bardziej poprawić za pomocą narzędzia do edycji zdjęć. 10 darmowych narzędzi do edytowania zdjęć, aby jak najlepiej wykorzystać swoje zdjęcia. 10 bezpłatnych narzędzi do edytowania zdjęć, aby jak najlepiej wykorzystać swoje zdjęcia. Cokolwiek się stało ze wszystkimi migawkami, które zrobiłeś w przeszłości ? Jeśli masz plany i pomysły, oto kilka świetnych systemów Windows i narzędzi do ich obsługi na wielu platformach. aby zwiększyć kontrast i wyprostować obraz.

Mam nadzieję, że te opcje pomogą. Jeśli potrzebujesz więcej opcji OCR, zapoznaj się z 5 najlepszymi narzędziami OCR 5 najlepszymi narzędziami OCR do wydobywania tekstu z obrazów 5 najlepszych narzędzi OCR do wydobywania tekstu z obrazów Kiedy masz ryzę papieru, jak uzyskać wszystko, co wydrukowano tekst przekonwertowany na coś, co program cyfrowy będzie w stanie rozpoznać i zindeksować? Trzymaj dobre oprogramowanie OCR w pobliżu. , po więcej informacji.