Preorder drugiego tomu książki sekuraka: Wprowadzenie do bezpieczeństwa IT. -15% z kodem: sekurak-book

Deep fake audio jest już w zasięgu ręki każdego. Uruchomili serwis, gdzie można uploadować próbkę głosu i generować dowolną wypowiedzianą nim frazę

31 stycznia 2023, 16:22 | W biegu | komentarzy 14

Serwis Elevenlabs ogłasza się następująco:

Jak widać potrzebna jest aż (tylko?) minuta głosu – aby go sklonować (tj. wypowiadać nim dowolną frazę, którą wpisujemy z klawiatury):

Oczywiście wymagane jest odznaczenie potwierdzenia, że mamy prawo do używania danego głosu, ale część osób niezbyt się przejmuje tego typu checkboxami. Engadget donosi np. o przypadkach klonowania głosów celebrytów, którzy następnie „wypowiadali” rozmaite kompromitujące frazy.

Inny przykład niedobrego zastosowania tej technologii to zaawansowany vishing – tego typu jak np. ten.

Regularni czytelnicy sekuraka pamiętają pewnie niedawnego newsa o podobnym projekcie Microsoftu, gdzie do sklonowania głosu wystarczyło raptem parę sekund nagrania (ale nie udostępniono prostego interfejsu umożliwiającego upload dowolnego głosu). Microsoft zastrzega:

Since VALL-E could synthesize speech that maintains speaker identity, it may carry potential risks in misuse of the model, such as spoofing voice identification or impersonating a specific speaker. We conducted the experiments under the assumption that the user agree to be the target speaker in speech synthesis. If the model is generalized to unseen speakers in the real world, it should include a protocol to ensure that the speaker approves the use of their voice and a synthesized speech detection model.

Dla Polaków jest też dobra informacja – zobaczcie dopisek na pierwszym zrzucie: „currently works best on US-English accent”.

~ms

Spodobał Ci się wpis? Podziel się nim ze znajomymi:



Komentarze

  1. Bartek

    Działa przyzwoicie, ale jako, że jest to dedykowane do języka angielskiego, głos brzmi nieco nienaturalnie. Podejrzewam, że narzędzia dostępne nie dla szerokiej publiczności są o wiele lepsze. Tak czy siak – nieźle.

    Odpowiedz
    • Dam

      Masz tam wersje biznesową, która jest lepsza, ale też płatna.

      Odpowiedz
  2. Szymon

    Będzie wysyp ataków typu: szef nagrał się na pocztę głosową swojej księgowej i poprosił o wykonanie przelewu.

    Odpowiedz
    • xd

      no i niech zgadne:
      1. serwisy które udostępniają takie narzędzia, zostaną pozamykane bo gdzieś ktoś zrobi tym atak i zgarnie kasę xD
      2. ale jak Bank pomaga złodziejom kraść moje pieniądze, to banku nie zamkną co nie xD bo przecież NIGDY nie wprowadzą blokady kredytu od urodzenia i kredyt dopiero za twoją zgodą z wizytą w banku popartą 10 dowodami tożsamości xD
      3. ale jak Operatorzy pomagają Bankowi i złodziejom kraść moje pieniądze, to operatorów nie zamkna i dalej będzie można dostać po dupie bo słup z ulicy skopiuje moją karte w kilja minut xD
      mógłbym tak ze 100 instytucji wymienić ale to nie ma sensu…
      btw. jak mam konto w Spółdzielczym Banku ale bez dostępu przez Internet, to nadal mogą mnie okraść?

      Odpowiedz
  3. SeeM

    Jeżeli jest za darmo, to po prostu potrzebują kolejnych gigabajtów nagrań do wytrenowania ai. I jeszcze dostają darmową ocenę wszystkich nagrań przez darmowych testerów. Wszystkie publicznie wystawione aplilacje są tylko do zbierania próbek.

    Odpowiedz
    • ps

      Albo zbudowaniu sobie bazy użytkowników.

      Odpowiedz
    • tomasz

      *SeeM.
      Dokładnie Tak, jak napisałeś. Chodzi o testy i próbki… Radość jest przed wczesna, byłbym bardzo ostrożny w tej materii.
      pozdrawiam wszystkich.

      Odpowiedz
  4. Artur

    Jeszcze do niedawna mieliśmy problem z zamianą tekstu na mowę jednym wybranym głosem w taki sposób, żeby nie brzmiało to jak robot – większość asystentów głosowych nadal ma bardzo szarpany akcent. A tu takie coś – szok

    Odpowiedz
  5. Aaaa

    OMG oskryptuję to z chatem gpt i już nigdy nie wejdę na daily

    Odpowiedz
  6. Słyszałem już deep fake tego z głosem Knapika i brzmiało całkiem realistycznie.

    Odpowiedz
  7. Meronix

    No i bardzo dobrze, że technologia idzie w górę. Elevenlabs to świetnia sprawa, jeśli chodzi o dubbingowanie gier czy innych filmów, a to że jakiś gałgan zamierza wykorzystywać to narzędzie do nieprzyjemnych rzeczy to serwis nie powinien ponosić odpowiedzialności za takiego użytkownika. Wyobraźcie sobie teraz nowy przełom w branży dubbingowej za pomocą takiego programu. Trzymam kciuki za dalszy rozwój i nie mogę się doczekać wprowadzenia języka polskiego. Wkurza mnie fakt, że wszyscy odbierają tą technologię negatywnie, zamiast spojrzeć na to z dobrej strony, np dzięki ai można przywrócić głos zmarłego aktora pod zgodą osób bliskich.

    Odpowiedz
    • Szymon

      Po co zgoda bliskich by odtworzyć głos zmarłej osoby?

      Odpowiedz
    • Jaki alkohol piłeś przed napisaniem ostatniego zdania i ile promili pokazał alkomat?

      Odpowiedz
  8. Lex

    Meronix, a co jeśli zaczną wykorzystywać głos osób, które nie wyraziły na to zgody? Dla mnie to nie rozwój branży a olbrzymie dla niej zagrożenie. Stworzą sobie miks kilku różnych osób, aby nie płacić nikomu a robotę odwali syntezator. I to będzie koniec zawodów związanych z dubbingiem. Dodaj do tego AI i koniec zawodów związanych z radiem i telewizją. To będzie miało olbrzymi wpływ na nasze życie. Jedni zarobią na tym więcej, inni będą musieli poszukać sobie innej pracy.

    Odpowiedz

Odpowiedz