Preorder drugiego tomu książki sekuraka: Wprowadzenie do bezpieczeństwa IT. -15% z kodem: sekurak-book

Jak zdepikselować zamazany tekst? [narzędzie Unredacter]

21 lutego 2022, 17:25 | W biegu | komentarzy 11

Na początek zastrzeżenie, nie mówimy tutaj o zdepikselowaniu obrazu rozumianego np. jako twarz. Daje to czasem umiarkowanie dobre efekty ;-)

O czym będziemy mówić? O (de)pikselowaniu tekstu. Badacze z Bishopfox na początek przyjęli sensowne założenie – algorytm pikselizacji jest dość standardowy i raczej nikt raczej nie będzie przygotowywał go od zera. Początkowo do depikselizacji używali narzędzia Depix, ale w pewnych przypadkach nie do końca się sprawdzało. Stworzyli więc swoje o nazwie Unredacter.

Przy jakich złożeniach można spróbować zdepikselować tekst?

  • Znamy font / rozmiar czcionki użytej w oryginale (możliwy jest też tutaj bruteforce – możliwości często nie ma zbyt wiele)
  • Znamy oczywiście zapikselowany fragment

Po odpowiednim dobraniu parametrów, narzędzie działa całkiem efektownie:

W zasadzie można powiedzieć – w czym problem? Wystarczy przecież po kolei pikselować litery danym fontem a następnie porównywać całość z wersją zapikselowaną. No prawie, badacze natknęli się na kilka problemów, np. na pikselowanie jednej litery może wpłynąć kolejna litera. Np. na obrazie poniżej litera h jest na tyle blisko t, że wpływa na wynik pikselowania tej ostatniej. Nie możemy więc zgadywać liter po kolei…

Takich problemów jest kilka, ale narzędzie próbuje sobie z nimi dawać radę.

Rada? Cenzurujcie obrazy tylko czarnym prostokątem (inne kolory też są OK :), nałożonym w edytorze obrazów. To wystarczy? Czasem nie – są np. metadane.

Interesujesz się tego typu tematami? Dopisz się poniżej do sekurakowej listy „czwartki z OSINT-em” (co tydzień przesyłamy kolejną ciekawostkę ze świata OSINT). Jako bonus, od razu po potwierdzeniu subskrypcji od razu otrzymasz linka do nagrania jednej z naszych prezentacji: OOPSEC – wpadki i wypadki przy zabezpieczaniu danych. Czyli jak (nie) cenzurować zdjęć i dokumentów.

Gdybyś nie dostał maila z potwierdzeniem – sprawdź spam i kliknij: to nie jest spam :-)

~Michał Sajdak

Spodobał Ci się wpis? Podziel się nim ze znajomymi:



Komentarze

  1. Gregor

    Wystarczy użyć większych bloków pikselizowania np. obejmujących 2-3 litery i narzędzie już ma problem. Przy mniejszych blokach pikseli można użyć dodatkowo np. efektu blur i też nic nie odczyta.

    Odpowiedz
    • Mat

      Można też użyć po prostu całego czarnego prostokąta :)

      Odpowiedz
      • Nux

        Ale czarny prostokąt brzydko wygląda i źle się kojarz ;-). Dlatego fotki się częściej bluruje/pikselizuje, żeby aż tak nie psuło wyglądu.

        Odpowiedz
    • asdsad

      Na blur jest deblur.

      Odpowiedz
  2. Nux

    Założenie, że jest jeden algorytm pikselizacji nie jest do końca prawidłowe. Można używać różnych algorytmów z różnymi parametrami.

    Popularny program IrfanView ma Explosion z zakresem od 1 do 99. Ma pikselize z zakresem 2 do 50. I kilka innych blurów, median, itp it. Każdy algorytm można zastosować parę razy w dowolnej kolejności. Można też zaznaczyć dowolnie obszar, bo pikselizuje się fragment, a algorytm zadziała inaczej jak będzie np. jeden piksel w prawo.

    Brakuje zatem założenia, że jednak musi być znany algorytm pikselizacji i trzeba wiedzieć gdzie jest brzeg zastosowania pikselizacji.

    Odpowiedz
    • Krzysztof

      Dobry komentarz. Tak właśnie jest.

      Odpowiedz
    • Masz rację co do szczegółów, ale zapominasz o samym celu: jeśli naprawdę chcę coś skutecznie wymazać, to mogę po prostu zrobić czarny lub biały prostokąt.

      Natomiast czasem NIE MOGĘ czegoś opublikować wprost, ale nadal chcę to opublikować. Wtedy mam szereg opcji:
      – luźny tekst mogę jakoś sprytnie zredagować, dorzucić jakieś disclaimery itd.
      – obrazki i konkretny tekst mogę opublikować w wersji rozpikselowanej – ale wtedy nie będę nikomu utrudniać, tylko wręcz odwrotnie, posiedzę nad tym i rozpikseluję w taki sposób, aby co bardziej ogarnięci czytelnicy bez problemu sobie to odtworzyli

      Odpowiedz
  3. Maciej

    Ten pierwszy pod pixelami to wygląda raczej jak Obama, więc kiepsko coś ta depixelacja działa :)

    Odpowiedz
    • Stąd odpowiedni komentarz w newsie :-)

      Odpowiedz
  4. Ktos

    @Nux – dobrze napisane.
    @sekurak – na metadane dobrym sposobem jest screenshot. Czyli nawet miniatura będzie ocenzurowana. PS o ile tekst łatwiej odgadnąć, przede wszystkim ze względu na jednolity kolor tła, o tyle ze zdjęciem i filmem może być gorzej. Ale pewnie to kwestia czasu.

    Odpowiedz
    • Generalnie tak. Chyba że program do screenshotów coś doda :-)

      Odpowiedz

Odpowiedz