Stanąłeś przed dylematem, jak przekopiować tekst z obrazka czy zeskanowanego dokumentu do edytora tekstu? Rozwiązanie jest proste, wystarczy skorzystać z aplikacji do rozpoznawania pisma. Pokażemy, jak to zrobić online, za darmo i bez potrzeby instalacji oprogramowania. [Maciej Koziński]
|
|
|
|
Zeskanowany obraz możesz zapisać w formacie kompresji stratnej JPEG (do wartości ok. 60 proc. – wartości niższe zwiększą liczbę błędów przy rozpoznawaniu tekstu), pod warunkiem że zachowałeś rozdzielczość 300 DPI. Zniekształcenia powstające w wyniku kompresji stratnej na krawędziach znaków przy tej rozdzielczości będą nieistotne. W przypadku skanowania z mniejszą rozdzielczością zapisz obraz, używając formatu kompresji bezstratnej, np. TIFF z kompresją albo PNG.

Otwórz stronę www.ocronline.com. Następnie wybierz z listy Document language język rozpoznawalnego dokumentu. W naszym przykładzie będzie to język polski.


Musisz także określić format wyjściowy dokumentu (w takim formacie otrzymasz gotowy dokument). W tym celu z listy wybierz jeden z dostępnych formatów. Do wyboru masz: Microsoft Word (DOC), PDF, Rich Text Format (RTF) lub czysty tekst (TXT). Teraz musisz wskazać pliki przeznaczone do przetworzenia, kliknij przycisk Browse.


W wywołanym oknie dialogowym zaznacz wybrane pliki z obrazami. Zatwierdź swój wybór przyciskiem Otwórz. Wybrane przez ciebie pliki pojawią się na liście Upload Queue. Jeśli przypadkowo wybrałeś błędne dane, możesz usunąć je z listy, klikając czerwony przycisk X.

Prześlij pliki z listy na serwer – w tym celu kliknij przycisk Upload. Sprawdź, czy pliki są uporządkowane we właściwej kolejności. Możesz już pobrać przetworzony dokument, klikając wyświetlony odsyłacz.


Uwaga! Jeżeli skanowane strony mają zbyt złożoną strukturę (kolumny, ramki, grafika), podziel je na kilka części o prostszej strukturze, używając do tego np. darmowego edytora graficznego (np. IrfanView) i zapisując poszczególne części w osobnych plikach. Dzięki temu OCRonline łatwiej rozpozna i zrekonstruuje układ strony.
- Nie musisz instalować oprogramowania
- Możesz wykonać rozpoznanie w dowolnym miejscu i czasie, korzystając np. z szybszego łącza
- Nie obciążasz własnego komputera
- Brak ręcznego wspomagania rozpoznania struktury dokumentu i wynikająca z tego próba rozpoznawania tekstu na rysunkach, winietach i w infografice
- Zagrożenia prywatności i poufności wynikające z przesyłania dokumentu w sieci





