If-Koubou

Jak wyodrębnić obrazy, tekst i osadzone pliki z dokumentów Word, Excel i PowerPoint

Jak wyodrębnić obrazy, tekst i osadzone pliki z dokumentów Word, Excel i PowerPoint (Jak)

Powiedzmy, że ktoś wysłał Ci dokument Word z dużą ilością obrazów i chcesz, abyś zapisał te obrazy na dysku twardym. Możesz wyodrębnić obrazy z dokumentu Microsoft Office za pomocą prostej sztuczki.

Jeśli masz plik Word (.docx), Excel (.xlsx) lub PowerPoint (.pptx) z obrazami lub innymi plikami osadzonymi, możesz je wyodrębnić (jak również tekst dokumentu), bez konieczności zapisywania każdego oddzielnie . A co najważniejsze, nie potrzebujesz żadnego dodatkowego oprogramowania. Formaty plików oparte na Office XML - docx, xlsx i pptx - są w rzeczywistości skompresowanymi archiwami, które można otwierać jak każdy normalny plik .zip w systemie Windows. Stamtąd można wyodrębnić obrazy, tekst i inne osadzone pliki. Możesz skorzystać z wbudowanej obsługi Windows zip lub z 7-zip, jeśli wolisz.

Jeśli chcesz wyodrębnić pliki ze starszych dokumentów biurowych - takich jak plik .doc, .xls lub .ppt - możesz to zrobić za pomocą niewielkiego wolnego oprogramowania. Szczegółowo opiszemy ten proces na końcu tego przewodnika.

Jak wyodrębnić zawartość nowszego pliku pakietu Office (.docx, .xlsx lub .pptx)

Aby uzyskać dostęp do wewnętrznej zawartości dokumentu Office opartego na XML, otwórz Eksplorator plików (lub Eksplorator Windows w Windows 7), przejdź do pliku, z którego chcesz wyodrębnić zawartość, i wybierz plik.

Naciśnij "F2", aby zmienić nazwę pliku i zmienić rozszerzenie (.docx, .xlsx lub .pptx) na ".zip". Pozostaw tylko główną część nazwy pliku. Naciśnij "Enter", kiedy skończysz.

Poniższe okno dialogowe wyświetla ostrzeżenie o zmianie rozszerzenia nazwy pliku. Kliknij "Tak".

System Windows automatycznie rozpoznaje plik jako spakowany plik. Aby wyodrębnić zawartość pliku, kliknij prawym przyciskiem myszy plik i wybierz "Wyodrębnij wszystko" z menu kontekstowego.

W oknie dialogowym "Wybierz plik docelowy i wyodrębnij pliki" ścieżka, w której zostanie wyodrębniona zawartość pliku .zip, zostanie wyświetlona w polu edycji "Pliki zostaną wyodrębnione do tego folderu". Domyślnie folder o takiej samej nazwie jak nazwa pliku (bez rozszerzenia pliku) jest tworzony w tym samym folderze co plik .zip. Aby wyodrębnić pliki do innego folderu, kliknij "Przeglądaj".

Przejdź do miejsca, w którym chcesz wyodrębnić zawartość pliku .zip, klikając "Nowy folder", aby utworzyć nowy folder, jeśli to konieczne. Kliknij "Wybierz folder".

Aby otworzyć okno Eksploratora plików (lub Eksploratora Windows) z folderem zawierającym wyodrębnione pliki wyświetlane po wyodrębnieniu, zaznacz pole wyboru "Pokaż wyodrębnione pliki po zakończeniu", aby w polu znajdował się znacznik wyboru. Kliknij "Wyodrębnij".

Jak uzyskać dostęp do wyodrębnionych obrazów

W wyodrębnionej zawartości znajduje się folder o nazwie "słowo", jeśli oryginalny plik jest dokumentem Word (lub "xl" dla dokumentu Excel lub "ppt" dla dokumentu PowerPoint). Kliknij dwukrotnie folder "word", aby go otworzyć.

Kliknij dwukrotnie folder "media".

Wszystkie obrazy z oryginalnego pliku znajdują się w folderze "media". Wyodrębnione pliki są oryginalnymi obrazami używanymi przez dokument. Wewnątrz dokumentu może istnieć zmiana rozmiaru lub inne właściwości, ale wyodrębnione pliki są nieprzetworzonymi obrazami bez tych właściwości.

Jak uzyskać dostęp do wyodrębnionego tekstu

Jeśli nie masz zainstalowanego pakietu Office na komputerze i musisz wyodrębnić tekst z pliku Word (lub Excel lub PowerPoint), możesz uzyskać dostęp do wyodrębnionego tekstu w pliku "document.xml" w folderze "word" .

Możesz otworzyć ten plik w edytorze tekstów, takim jak Notatnik lub WordPad, ale łatwiej jest go odczytać w specjalnym edytorze XML, takim jak darmowy program, Notatnik XML. Cały tekst z pliku jest dostępny w postaci fragmentów zwykłego tekstu, niezależnie od stylu i / lub formatowania zastosowanego w samym dokumencie. Oczywiście, jeśli zamierzasz pobrać darmowe oprogramowanie, aby wyświetlić ten tekst, możesz równie dobrze pobrać LibreOffice, który może czytać dokumenty Microsoft Office.

Jak wyodrębnić osadzone obiekty OLE lub załączone pliki

Aby uzyskać dostęp do plików osadzonych w dokumencie programu Word, gdy nie masz dostępu do programu Word, najpierw otwórz plik programu Word w programie WordPad (wbudowanym w systemie Windows). Możesz zauważyć, że niektóre ikony plików osadzonych nie wyświetlają się, ale nadal tam są. Niektóre z osadzonych plików mogą mieć częściowe nazwy plików. WordPad nie obsługuje wszystkich funkcji programu Word, więc niektóre treści mogą być wyświetlane niepoprawnie. Ale powinieneś mieć dostęp do plików.

Jeśli klikniemy prawym przyciskiem myszy jeden z plików osadzonych w naszym przykładowym pliku Word, jedną z opcji jest "Otwórz obiekt PDF". Spowoduje to otwarcie pliku PDF w domyślnym programie do odczytu plików PDF na twoim komputerze. Stamtąd można zapisać plik PDF na dysku twardym.

Jeśli WordPad nie ma możliwości otwarcia pliku, zanotuj jego typ pliku tutaj. Na przykład naszym drugim plikiem w tym dokumencie jest plik .mp3.

Następnie wróć do folderu "Pliki z [Dokumentu]" i dwukrotnie kliknij folder "embeddings" w folderze "word".

Niestety typy plików nie są zachowywane w nazwach plików. Wszystkie mają zamiast tego rozszerzenie pliku ".bin". Jeśli wiesz, jakie typy plików są osadzone w pliku, prawdopodobnie możesz wywnioskować, który plik jest zgodny z rozmiarem pliku. W naszym przykładzie mieliśmy plik PDF i plik MP3 osadzony w naszym dokumencie. Ponieważ plik MP3 jest najprawdopodobniej większy niż plik PDF, możemy dowiedzieć się, który plik jest, patrząc na rozmiary plików, a następnie zmienić ich nazwę, używając poprawnych rozszerzeń. Poniżej zmieniamy nazwę pliku MP3.

Zauważ, że nie wszystkie pliki będą musiały zostać otwarte przy użyciu tego procesu - na przykład nasz plik PDF został poprawnie otwarty z WordPada, ale nie możemy go otworzyć, zmieniając nazwę pliku .bin.

Po rozpakowaniu zawartości skompresowanego pliku możesz przywrócić rozszerzenie pierwotnego pliku do .docx, .xlsx lub .pptx. Plik pozostanie nienaruszony i będzie można go normalnie otworzyć w odpowiednim programie.

Jak wyodrębnić obrazy ze starszych dokumentów pakietu Office (.doc, .xls lub .ppt)

Jeśli chcesz wyodrębnić obrazy z dokumentu Office 2003 (lub wcześniejszego), dostępne jest bezpłatne narzędzie o nazwie Office Image Extraction Wizard, które ułatwia to zadanie. Ten program umożliwia także wyodrębnianie obrazów z wielu dokumentów (tego samego lub różnych typów) na raz. Pobierz program i zainstaluj go (dostępna jest również wersja przenośna, jeśli nie chcesz jej instalować).

Uruchom program i wyświetli się ekran powitalny. Kliknij Następny".

Najpierw musimy wybrać plik, z którego chcemy wyodrębnić obrazy. Na ekranie Wejście i wyjście kliknij przycisk "Przeglądaj" (ikona folderu) po prawej stronie pola edycji Dokument.

Przejdź do folderu zawierającego żądany dokument, zaznacz go i kliknij "Otwórz".

Folder zawierający wybrany plik automatycznie staje się folderem wyjściowym. Aby utworzyć podfolder w tym folderze o nazwie identycznej jak wybrany plik, kliknij pole wyboru "Utwórz folder tutaj", aby w polu znajdował się znacznik wyboru. Następnie kliknij "Dalej".

Na ekranie Gotowy do startu kliknij "Start", aby rozpocząć wyodrębnianie obrazów.

Poniższy ekran wyświetla się podczas procesu ekstrakcji.

Na ekranie Finished kliknij przycisk "Kliknij tutaj, aby otworzyć folder docelowy", aby wyświetlić wynikowe pliki obrazów.

Ponieważ zdecydowaliśmy się na utworzenie podfolderu, otrzymujemy folder zawierający pliki graficzne wyodrębnione z pliku.

Zobaczysz wszystkie obrazy jako pliki ponumerowane.

Można również wyodrębnić obrazy z wielu plików jednocześnie. Aby to zrobić, na ekranie Wejście i wyjście kliknij pole wyboru "Tryb wsadowy", aby w polu znajdował się znacznik wyboru.

Zostanie wyświetlony ekran wprowadzania i wyprowadzania partii. Kliknij "Dodaj pliki".

W oknie dialogowym Otwórz przejdź do folderu zawierającego dowolny plik, z którego chcesz wyodrębnić obrazy, zaznacz pliki za pomocą klawisza "Shift" lub "Ctrl", aby wybrać wiele plików, i kliknij "Otwórz".

Możesz dodać pliki z innego folderu, klikając ponownie "Dodaj pliki", przechodząc do folderu w oknie dialogowym Otwieranie, wybierając żądane pliki i klikając "Otwórz".

Po dodaniu wszystkich plików, z których chcesz wyodrębnić obrazy, możesz utworzyć osobny folder dla każdego dokumentu w tym samym folderze co każdy dokument, do którego pliki zdjęć zostaną zapisane, klikając przycisk "Utwórz folder dla każdy dokument ", aby zaznaczyć pole wyboru.

Możesz także określić folder wyjściowy jako "Ten sam, co folder wejściowy każdego pliku" lub wprowadzić lub wybrać niestandardowy folder za pomocą pola edycji i przycisku "Przeglądaj" znajdującego się pod tą opcją. Kliknij "Dalej" po wybraniu żądanych opcji.

Kliknij "Start" na ekranie Gotowy do start.

Poniższy ekran pokazuje postęp ekstrakcji.

Liczba wyodrębnionych obrazów wyświetlanych na ekranie Finished. Kliknij "Zamknij", aby zamknąć Kreatora pobierania obrazu Office.

Jeśli zdecydujesz się utworzyć osobny folder dla każdego dokumentu, zobaczysz foldery o takich samych nazwach jak pliki zawierające obrazy, którekolwiek z podanych folderów wyjściowych.

Ponownie otrzymujemy wszystkie obrazy jako pliki numerowane dla każdego dokumentu.

Teraz możesz zmieniać nazwy obrazów, przenosić je i używać ich we własnych dokumentach. Tylko upewnij się, że masz prawo do ich legalnego użytkowania.