If-Koubou

Dlaczego pliki PDF generowane przez Microsoft Word są tak duże?

Dlaczego pliki PDF generowane przez Microsoft Word są tak duże? (Jak)

Kiedy twoje dokumenty mają głównie charakter tekstowy, wydaje się, że rozmiary plików .docx i .pdf powinny być dość podobne po zapisaniu, ale nie zawsze tak jest. Dzisiejszy post z pytaniami i odpowiedziami dla SuperUser zawiera odpowiedzi na pytania ciekawskiego czytelnika dotyczące dużej różnicy w rozmiarach plików.

Dzisiejsza sesja pytań i odpowiedzi przychodzi do nas dzięki uprzejmości SuperUser - poddziału Stack Exchange, społecznościowego forum z pytaniami i odpowiedziami.

Rękawice bokserskie clip-art dzięki uprzejmości Clker.com.

Pytanie

Czytnik SuperUser Borek chce wiedzieć, dlaczego pliki PDF generowane przez Microsoft Word są tak duże:

Stworzyłem prosty dokument Microsoft Word zawierający tylko to zdanie, nic więcej:

  • To jest mały dokument.

Następnie zapisałem dokument jako pliki .docx i .pdf. Oto rozmiary plików:

  • .docx: 12 kB
  • .pdf: 89 kB

Różnica między tymi dwoma plikami jest ogromna (technicznie) i naprawdę przeszkadza mi to, że dokumenty, które w większości mają charakter tekstowy, to tylko dziesiątki KB w formacie .docx, ale mają setki rozmiarów kB po przekonwertowaniu na pliki PDF. Co jest tak nieefektywnego w formacie PDF? Czy to jest po prostu Microsoft Word z użyciem jakiegoś okropnego algorytmu wyjściowego?

Nawiasem mówiąc, ustawienia wyjściowe PDF w mojej instalacji Microsoft Office są ustawione tak, aby tworzyć możliwie najmniejsze pliki:

Dlaczego pliki PDF generowane przez Microsoft Word są tak duże?

Odpowiedź

SuperUser contributor rene ma dla nas odpowiedź:

Jeśli otworzysz plik PDF w Notepad ++, znajdziesz:

I ten obiekt jest tutaj na końcu wymieniony w instrukcji / FontFile2:

Czcionki używane przez dokument Microsoft Word są osadzone w plikach PDF, dzięki czemu są samodzielne. Użyłem tego slajdu firmy Adobe do rozszyfrowania instrukcji PDF.

Jeśli chcesz uniemożliwić osadzanie czcionek w pliku PDF, upewnij się, że twoje dokumenty Microsoft Word korzystają z jednej z 14 standardowych krojów pisma dostępnych w przeglądarkach PDF (Źródło: Wikipedia).

  • Times New Roman> Times (v3) (zwykła, kursywa, pogrubienie i pogrubienie kursywa)
  • Courier Nowość> Kurier (normalny, skośny, pogrubiony i pogrubiony skośny)
  • Arial> Helvetica (v3) (w regularnym, skośnym, pogrubionym i pogrubionym skośnym)
  • Symbol> Symbol
  • Skrzydła> Zapf Dingbaty

Czy masz coś do dodania do wyjaśnienia? Dźwięk w komentarzach. Chcesz przeczytać więcej odpowiedzi od innych użytkowników Stack Exchange, którzy znają się na technologii? Sprawdź cały wątek dyskusji tutaj.