AI zsyntetyzuje dowolne zdanie „wypowiedziane” przez Ciebie. Wystarczy 5 sekund nagrania Twojego głosu. Zobacz demo.

14 listopada 2019, 20:32 | W biegu | komentarzy 6
Tagi: , ,
: oglądaj sekurakowe live-streamy o bezpieczeństwie IT.

Zerknijcie tutaj (dostępne są nagrane 5-sekudnowe próbki + kilka zsyntetyzowanych fragmentów). Na początek została zrobiona gigantyczna praca polegająca na treningu systemu tysiącami realnych głosów. Po wykonaniu tego etapu wystarczy raptem 5 sekund nagrania głosu ofiary, aby zsyntetyzować wypowiedziane przez nią fejkowe zdania:

Do czego może być to wykorzystane? Np. do scamów – jeden taki opisywaliśmy całkiem niedawno. Wg doniesień fałszywy głos prezesa jeden z firm spowodował przelanie równowartości około miliona złotych na konto przestępców…

–ms

Spodobał Ci się wpis? Podziel się nim ze znajomymi:



Komentarze

  1. piter

    Fascynujące, a zarazem przerażające. What a time to be alive :)

    Odpowiedz
  2. Mariusz

    Jest nieźle, ale różnica jest słyszalna (zajmuję się produkcją muzyczną i jestem wyczulony na wszelkie niuanse dźwiękowe- myślę, że wprowadzono do emulacji jeszcze zbyt mało parametrów).
    ALE NARAZ NIKT TEGO NIE BĘDZIE SŁUCHAŁ, więc bez porównania – materiał na fraud znakomity.

    Odpowiedz
    • szczególnie jak się to odgra np. przez telefon

      Odpowiedz
  3. cryptonnoob

    Czy to jest metoda na podważanie umów zawieranych telefonicznie? ;)

    Odpowiedz
  4. n00b

    Fajna opcja, już to widzę na Youtube przy tłumaczeniu filmów na różne języki
    w locie :) Jeden materiał mógłby mieć ogólnoświatowy zasięg bazując na syntezie.

    Odpowiedz
  5. Można się skupiać na negatywnych, ale można też na pozytywnych zastosowaniach.

    Mając własną próbkę głosu i syntezator, można tworzyć własne wypowiedzi/podcasty/opisy do filmów czy poradników wideo nie mając dobrego mikrofonu czy też oszczędzając czas.

    Podając tylko tekst do przeczytania i własny głos dobrej jakości można przygotować materiał znacznie szybciej. A taki sztuczny, ale dobrej jakości głos nie chrząka, nie wzdycha, nie kicha itd. w trakcie wypowiedzi.

    Są zalety i potencjał do pozytywnego wykorzystania.

    Zresztą już jakiś czas temu myślałem o tym. Są już próby generowania czysto komputerowo ludzkich twarzy czy całych postaci na filmach wideo. Na razie to w fazach testów i niedostępne dla zwykłych ludzi (plus potrzebna moc obliczeniowa), ale przy obecnym rozwoju tego typu narzędzia pewnie pojawią się szybciej niż później (mniej lub bardziej zaawansowane) – na domowym komputerze czy smartfonie.

    Odpowiedz

Odpowiedz