whycomputer.com >> Wiedza o Internecie >  >> Oprogramowanie

Jak wyodrębnić tekst z dokumentu PDF

Próbowanie wyodrębnienia tekstu z pliku PDF w celu użycia w innej aplikacji może być bardzo frustrujące. Często zdarza się, że grafika przeszkadza lub układa dokument, co utrudnia przeniesienie testu w znaczących zdaniach. Chociaż nie jest możliwe wyodrębnienie tekstu za pomocą metody kopiowania i wklejania, może to być czasochłonne i nie pozwala na eksportowanie tekstu w pliku PDF w innym formacie. Istnieje jednak kilka sposobów na wyodrębnienie tekstu z pliku PDF.

Wyodrębnij tekst za pomocą Acrobat Reader

Krok 1
Otwórz plik w programie Acrobat Reader. W systemie Windows wybierz opcję „Plik -> Eksportuj dokument do tekstu”, nazwij dokument i zapisz go.

Krok 2
Skopiuj tekst w systemie Mac lub Linux OS, wybierając menu Widok i wybierając „ Ciągłe lub „Ciągłe obliczanie”. (Pierwszy z nich dostarczy ci tekstu w jednej kolumnie, podczas gdy drugi sformatuje tekst jako strony obok siebie). Przejdź do „Edytuj -> Zaznacz wszystko”, a następnie „Edytuj -> Kopiuj”.
Użyj narzędzia Wybierz, jeśli chcesz tylko wyodrębnić część tekstu. Kliknij narzędzie „Wybierz tekst”, a następnie wybierz żądane informacje. W dokumencie sformatowanym w wielu kolumnach musisz najpierw użyć narzędzia „Wybór kolumny”. Przejdź do „Edycja -> Kopiuj.”

Konwertuj PDF na HTML

Krok 1
Użyj Gmaila jako skrótu. Dołącz plik PDF do wiadomości e-mail i wyślij go na swoje konto Gmail. Po otwarciu wiadomości e-mail zobaczysz kilka opcji obok załącznika. Wybierz „Wyświetl jako HTML” i zapisz plik, który otwiera się w osobnym oknie. Chociaż nie będziesz w stanie wyświetlić żadnej grafiki, plik HTML zachowa formatowanie tekstu dokumentu.

Krok 2
Wyodrębnij i skonwertuj pliki w wierszu poleceń. Użytkownicy Linuksa mogą użyć podstawowego polecenia konwersji, które zmieni plik .pdf na plik .txt: „pdftotext filename.pdf”. Pamiętaj, aby zastąpić nazwę pliku nazwą pliku PDF.
Pobierz program do konwersji plików PDF na tekst. Dostępnych jest wiele programów open source i freeware, takich jak PDFBox i Easy PDF to Text Converter (patrz Zasoby poniżej). Wiele z tych programów może również konwertować pliki PDF na HTML.

Wskazówki
Określ, czy dokument jest sformatowany tak, aby zawierał zarówno tekst, jak i grafikę. Podejście Adobe Acrobat działa tylko wtedy, gdy plik PDF zawiera oba; nie będzie działać tylko w przypadku plików z obrazami. W niektórych przypadkach tekst w dokumencie PDF jest faktycznie sformatowany jako obraz. Zdarza się to często po zeskanowaniu oryginalnego dokumentu i utworzeniu pliku PDF z zeskanowanego obrazu.
Przygotuj się na ponowne sformatowanie części tekstu podczas korzystania z Acrobat Reader. Ten sposób ekstrakcji po prostu eksportuje plik PDF do pliku tekstowego - nie zachowuje koniecznie zachowania formatowania. Jeśli jednak potrzebujesz użyć słów, nie powinno to stanowić problemu.

Potrzebne elementy

  • Plik PDF
  • Adobe Acrobat Reader
  • Konto Gmail (opcjonalnie)
  • Oprogramowanie do konwersji tekstu na PDF (opcjonalnie)


    URL:https://pl.whycomputer.com/oprogramowanie/100300187.html

  • Oprogramowanie
    • Jak usunąć tagi z PDF

      Pliki PDF utworzone w Adobe Acrobat zawierają elementy kodu zwane „tagami”, które informują czytelników PDF, jak uporządkować informacje w dokumencie. Struktura ta obejmuje kolejność stron i rozmieszczenie obrazów, tekstu i tabel. Znaczniki są często używane w celu zapewnienia struktury dla plików P

    • Jak wysłać tekst do T-Mobile z komputera

      Krok 1 Zaloguj się na swoje konto My T-Mobile. Krok 2 Krok 3 Kliknij „Wyślij wiadomość tekstową.” Krok 4 Wprowadź swój numer telefonu w polu „Od” i numer telefonu odbiorcy w polu „Do”. Wprowadź maksymalnie 129 znaków w polu „Wiadomość” i kliknij „Wyślij”. E-mail Krok 1 Otwórz program po

    • Jak usunąć znaki wodne z plików PDF

      Gdy istnieje potrzeba usunięcia lub zastąpienia znaku wodnego w dokumencie PDF, może to być trudne do wykonania. Jeśli nie masz oryginalnych plików, może być potrzebne lekarstwo, aby uzyskać pożądane wyniki. Oto sposób usuwania znaków wodnych z plików PDF przy użyciu typowych programów systemu Windo

    Wiedza o Internecie © https://pl.whycomputer.com