Widziałeś to w kółko. FBI wykorzystuje zaawansowaną technologię do "wzmocnienia" rozmytego obrazu i znalezienia twarzy złoczyńcy w najgorszym możliwym filmie. Cóż, How-To Geek nazywa ich blefem. Czytaj dalej, aby zobaczyć, dlaczego.
Jest to jeden z najczęstszych tropów w telewizji i filmach, ale czy istnieje możliwość, że agencja rządowa mogłaby naprawdę mieć technologię znajdowania twarzy, w których występują tylko niewyraźne piksele? Podejmiemy argument, że nie jest to niemożliwe tylko z obecną technologią, ale jest mało prawdopodobne, aby kiedykolwiek była to technologia, którą kiedykolwiek zobaczymy. Trzymajcie się, aby zobaczyć, jak kładziemy ten trop pod soczewkami nauki i technologii, i udowodnić, że to źle raz na zawsze.
Wszystkie technologie obrazowania, zarówno cyfrowe, jak i analogowe, działają w przybliżeniu w ten sam sposób. Zastanówmy się chwilę nad kamerami. Wszystkie kamery tworzą obraz, gdy światło (cząstki, które nazywamy fotonami) wchodzą w interakcje z jakimś rodzajem nośnika tworzącego obraz. W aparatach cyfrowych jest to czujnik fotoelektryczny. W kamerach filmowych jest to chemicznie obrobiony, wrażliwy na światło pasek folii.
Może dziwić, że kamery oparte na filmach potrafią uchwycić więcej szczegółów niż nawet aparaty cyfrowe o bardzo wysokiej rozdzielczości. Ale nawet w przypadku kamery filmowej na filmie można zarejestrować tylko ograniczoną ilość światła. To samo dotyczy każdego urządzenia do przetwarzania obrazu, czy to magnetowidu, aparatu cyfrowego czy skanera płaskiego. A ponieważ każde zdjęcie jest robione w skończonym czasie (zwykle ułamki sekundy, w przypadku aparatów fotograficznych), konieczny jest górny limit szczegółów każdego uchwyconego obrazu.
W obrazowaniu cyfrowym górna granica często ma związek z sufitem, który ma kamera lub urządzenie - na przykład liczbą pikseli, które czujniki w aparacie są w stanie wykryć. Chodzi o granice samego urządzenia i jest nieco inny niż problem skończonej ilości światła docierającego do nośnika w aparacie. Mówiąc prościej, żadna kamera, bez względu na to, jak zaawansowana, ma nieskończoną zdolność rozdzielczą.
Komputery są interesującymi maszynami, ale nie są pozbawione ograniczeń. Jedną z rzeczy, o których większość ludzi błędnie myśli o komputerach, jest to, że nie są w stanie tworzyć "nowych" informacji, po prostu tworzą "inne" informacje. W matematyce, gdy jedna część równania jest pozwana na innej części, nazywa się to funkcją. Gdy Y = X + 1, Y jest funkcją X. Bez względu na to, X jest, Y jest bezpośrednio skorelowane.
Komputery działają w podobny sposób. Możesz dać komputerowi ogromny plik tekstowy z losowymi literami i słownikiem, i nakazać mu rozmieszczenie ograniczonego zestawu liter w słowach ze słownika. Dzieje się tak, ponieważ produkt końcowy można podzielić na funkcję zestawu losowych liter, słów ze słownika i wskazówek, jak utworzyć jeden od drugiego.
Wyobraź sobie, że robisz pracę domową algebry na swoim komputerze. Wpisujesz serię liczb do równania "Y = X + 1". Najpierw X = 1, więc 1 + 1 = 2. Ale co by się stało, gdybyś wcisnął niewłaściwe klawisze i wprowadził nieprawidłowe liczby? Czy nadal otrzymasz poprawną odpowiedź? Jeśli chciałeś powiedzieć X = 1, ale wpisałeś X = 11, czy komputer nadal dałby ci poprawną odpowiedź? Pytanie jest oczywiście niedorzeczne. Jest to koncepcja "Garbage In, Garbage Out". Innymi słowy, błędne dane dadzą błędną odpowiedź.
Podobnie jak nasze równanie, "ulepszone" obrazy są funkcją oryginalnego obrazu. Kiedy zaczynasz od rozmytego lub pikselowego obrazu (lub nawet ostrego, o ile to możliwe), żadna ilość filtrów lub magii komputerowej nie może nakłaniać informacji z miejsca, w którym informacja po prostu nie istnieje. Tak jak "1 + 11" nigdy nie spowoduje "2", ograniczony obraz nigdy nie spowoduje tak zwanej "ulepszonej" wersji.
Możesz zadać pytanie: "Czy nie jest możliwe stworzenie funkcji, która może dodać szczegółów do złego obrazu?" Cóż, prawdopodobnie nie stworzymy jej w najbliższym czasie. Po prostu dlatego, że rozpoznajemy układ pikseli jako twarzy, nie oznacza to, że jest to prawdziwa twarz. Częścią twarzy jest nasze postrzeganie tych danych - w rzeczywistości patrzymy tylko na dane! Pobieranie danych obrazu i przekształcanie go w "lepsze" dane jest niemożliwe. Funkcja, która tworzy coś tak specyficznego jak ludzka twarz na podstawie bzdurnych danych, wymagałaby rzeczywistej wiedzy o produkcie końcowym - trzeba znać twarz prawdziwej osoby, aby "znaleźć" ją na rozmytym obrazie, który to rodzaj pokonuje punkt tej wyimaginowanej technologii.
Możliwe, że uda się utworzyć obraz przypominający twarz z danych obrazu ze śmieci, ale nie oznacza to, że ten produkt będzie odpowiedni. Może stworzyć twarz, która w rzeczywistości nie wygląda tak, jak osoba, która była w rzeczywistości. Najprawdopodobniej po prostu tworzyłby masę pikseli, które po prostu wyglądają jak "inna" wersja tego, co tam jest. W logice telewizyjnej za tym obrazem jest twarz zamknięta, a dobrzy faceci po prostu znajdą sposób, aby do niej dotrzeć. W rzeczywistości są to tylko dane - a każda funkcja odtwarzająca okoliczności zdjęcia, które już zostało zrobione, zawiera już te informacje.
Organizacje rządowe, takie jak NASA, wydają mnóstwo pieniędzy na przeszukiwanie nieba za pomocą teleskopów satelitarnych, takich jak Hubble i Kepler.Te lunety i inne na Ziemi zapewniają niesamowitą, głęboką kosmiczną, cyfrową fotografię światła, a także inne długości fali w widmie elektromagnetycznym - takie jak fale radiowe i mikrofale oraz promieniowanie o wysokiej częstotliwości, takie jak promieniowanie gamma i promieniowanie X. Ale wszystkie te obrazy podlegają tym samym ograniczeniom omówionym wcześniej. Są migawkami w czasie. Ograniczone obrazowanie rentgenowskie jest takie samo jak ograniczone obrazowanie światła widzialnego. Jeśli zdjęcia mogłyby być "zintensyfikowane", fotografowanie w przestrzeni kosmicznej byłoby łatwe dla każdego. Jeśli potrafisz "wzmocnić" obraz, powiększając twarz w tłumie, dlaczego nie wyjść na zewnątrz, zrobić migawkę nieba i "wzmocnić" to zobaczyć szczegóły na ziemi Plutona? Gdyby było to możliwe, obraz - jakikolwiek obraz - mógł zawierać wszystkie dane obrazu we wszechświecie.
Po prostu dlatego, że sposób, w jaki pisane przez trop, pisanie przedstawia ulepszanie obrazu, jest zły, zły, zły, nie oznacza, że programy graficzne nie są przydatnymi narzędziami dla tego rodzaju problemu. Dopóki informacja znajduje się w obrazie, coś w rodzaju "zaawansowania" może ułatwić jej dostrzeżenie. Weźmy na przykład ten ciemny, zacieniony obraz, rozjaśniony, by pokazać szczegóły w cieniu. Ten rodzaj "wzmocnienia" jest prawdziwy i dostępny dla każdego, kto ma komputer. Różnica polega na tym, że dane już istnieją - patrzymy na to inaczej. Nasze oczy nie widzą (w zależności od monitora) szczegółów twarzy po lewej. Ale "wzmocniona" wersja po prawej pokazuje nam wiele szczegółów w cieniu, dając nam lepszy obraz twarzy.
Więc FBI najprawdopodobniej nie ma magicznych mocy Photoshopa, a ty nie możesz robić zdjęć małym zielonym ludziom żyjącym na Plutonie za pomocą funsaver. Nie wierz we wszystko, co widzisz w telewizji!
Kredyty wizerunkowe: Harrison Ford z zapory ogniowej używany bez zezwolenia, zakładał dozwolony użytek. Light Writing by BloomsEyeView, Creative Commons. Garbage by Redaktor B, Creative Commons. IMG1189b wg HooverStreetStudios, Creative Commons.