Zachwyt nad LLMami, a zderzenie z górą lodową – czyli o powielaniu błędnych praktyk

07 marca 2025, 07:59 | W biegu | komentarzy 10

Tagi: ai, awareness, llm, programowanie, zachwyt

Wprowadzenie integracji dużych modeli językowych (Large Language Model, LLM) ze środowiskami programistycznymi może okazać się zbawienne w przypadku pisania tzw. boiler plate code (czyli szablonów). Nudne i powtarzalne zajęcie, to idealne zadanie dla sztucznej inteligencji. Jednak zachłyśnięcie się technologią oraz poszukiwanie na siłę oszczędności może prowadzić do katastrofalnych skutków. Dlaczego? Pomijając aspekt licencji oraz tego skąd pochodzą dane w zbiorach uczących (dziwnym trafem niektóre potrafią zniknąć, akurat wtedy kiedy są potrzebne), należy zastanowić się, jak można niskim kosztem wytrenować modele w dziedzinie programowania. Z pomocą przyjść mogą wszelkiego rodzaju repozytoria kodu i projekty otwartoźródłowe. Niestety nie wszystkie są utrzymywane na takim wysokim poziomie jak OpenSSH czy cURL (które właściwie stanowią wyjątki od reguły).

TLDR:

Powstaje coraz więcej modeli językowych, przeznaczonych głównie do wspomagania procesu wytwarzania oprogramowania.
W prasie (głównie niebranżowej) przewijają się makabryczne prognozy o tym, że programiści (jak i całe IT) przestanie być potrzebne.
Badania oparte o przykłady z życia wzięte sugerują, że sytuacja globalnego bezpieczeństwa systemów, może być gorsza niż przypuszczamy.
Modele uczone na niskiej jakości kodzie popełniają niebezpieczne błędy, czego dowodzi badanie opublikowane przez Truffle Security Co.

Badacze z Truffle Security opublikowali krótkie badanie, które pokazuje, że duże modele językowe wspierające programistów stosują tzw. anty-wzorce (ang. anti-pattern), czyli praktyki, których stosowanie może prowadzić do negatywnych skutków. W tym przypadku skupiamy się głównie na bezpieczeństwie. Przykładem niebezpiecznego zachowania jest zawieranie (tzw. hardcodowanie) poświadczeń (np. kluczy API) w źródłach programu. Ta niefrasobliwość może nieść za sobą bardzo negatywne skutki, o czym przekonała się niejedna firma. Frywolne wypychanie kodu z takimi tokenami, do zdalnych repozytoriów, może skutkować poważnymi nadużyciami ze strony atakujących, którzy aktywnie poszukują tego typu sekretów (korzystając między innymi ze zautomatyzowanych narzędzi jak np. TruffleHog).

Benchmarkiem stosowanym do ewaluacji działania modeli były prompty nakazujące wygenerowanie kodu z wykorzystaniem SDK Slacka (wysłanie wiadomości na kanał ogólny) oraz obsłużenie $1 płatności przy pomocy SDK Stripe.

Przykłady zostały dobrane w taki sposób, że dokumentacja jednej biblioteki (python-slack-sdk) zawierała dobre (może nie idealne, ponieważ przechowywanie sekretów w zmiennych środowiskowych nie jest optymalnym rozwiązaniem) praktyki, a druga (stripe-python) sugerowała umieszczenie klucza API w kodzie.

Wyniki otrzymane przy pomocy różnych modeli zostały zestawione w tabeli.

Tabela 1. Zestawienie wyników dla różnych modeli (źródło: trufflesecurity.com)

Większość wygenerowanych snippetów zawierała typowy błąd, nawet jeśli dokumentacja sugerowała inne rozwiązanie. Dlaczego tak się dzieje? Umiejętności generowania tokenów odpowiadają danym uczącym, co w tym kontekście oznacza, że wykorzystane do nauki źródła nie stosowały się do wszystkich dobrych praktyk.

Najciekawszy wydaje się fakt, że te same modele zwracały różne wyniki w zależności od sposobu ich wywołania. W momencie gdy były uruchamiane np. z IDE:

Rysunek 1. Różnica w wygenerowanym kodzie (źródło: trufflesecurity.com)

Jak wygląda przykładowe zapytanie zawierające prompt, który skutkuje wygenerowaniem kodu? Ano tak:

Rysunek 2. Zapytanie nie zawierające żadnej wzmianki o bezpieczeństwie czy dobrych praktykach. (źródło: trufflesecurity.com)

Dlaczego zatem przedstawiony kod nie jest poprawny z punktu widzenia bezpieczeństwa? Może dlatego, że użytkownik explicite nie definiuje jakie warunki powinien spełniać.

Analizując ruch sieciowy (zapytania HTTP) przy pomocy narzędzia Burp Suite, badacze znaleźli ciekawą informację. Otóż błędna odpowiedź zawierała też informację o wykrytej nieprawidłowości, wyzwolonej przez filtr odpowiedzi.

Rysunek 3. Fragment odpowiedzi serwera, z informacją o błędzie (źródło: trufflesecurity.com)

Informacja ta została przedstawiona użytkownikowi w postaci małego pop-up:

Rysunek 4. Mała, rozwijana informacja o błędzie (źródło: trufflesecurity.com)

Co to znaczy? Autorzy wyciągają oczywiste wnioski – ograniczenia LLMów powodują, że to na użytkowniku spoczywa ciężar napisania dobrego zapytania (ang. prompt-engineering). To powoduje, że programiści powinni szczegółowo definiować kontekst zapytania i nie zapominać o kwestiach bezpieczeństwa. Oprócz tego wynik wygenerowany przez model językowy powinien zostać krytycznie zweryfikowany przed użyciem w kodzie produkcyjnym. Czy tak się dzieje? Zapewne tak. Czy zawsze? Tutaj Czytelnik pewnie wie co o tym sądzimy… pozostaje jeszcze kwestia filtrowania wyjścia – jak miało to miejsce w przypadku IDE (informacja o możliwej podatności zwrócona przez filtr). Nie jest to rozwiązanie idealne, ale powinno odsiać te najprostsze błędy.

Patrząc na to, jak chętnie niektóre organizacje chwalą się “innowacjami” w postaci zastąpienia programistów mitycznym “AI” mamy pewne obawy ile wygenerowanego kodu zostało sprawdzone pod kątem różnych niezdefiniowanych (lub nie mieszczących się w oknie kontekstowym modelu) potencjalnych zagrożeń. Znając życie przekonamy się o tym w najmniej oczekiwanym momencie.

Jak poradzić sobie z taką wizją rzeczywistości? Najlepiej manualnie recenzować każdy element kodu ;) Nic nie zastąpi doświadczonego programisty, który rozumie potrzeby biznesowe, logikę aplikacji, a także potrafi się wspomóc różnymi narzędziami do analizy kodu.

~fc

Yaneek

7 marca, 2025 | 1:14 pm

Nie jest problemem to, ze chat nie robi rozwiazania produkcyjnego. Glupi prompt wygeneruje głupią odpowiedź. Głupi developer zaakceptuje glupią odpowiedź. Głupi pracodawca zatrudni głupiego developera.

Odpowiedz
- Notte
  
  7 marca, 2025 | 10:55 pm
  
  … głupie koprpo zleci pracę do głupiego pracodawcy IT, głupi klient skorzysta z produktu głupiego korpo. Cykl się zamyka.
  
  Odpowiedz
- Piotr
  
  9 marca, 2025 | 11:37 am
  
  Jak to mówią, „you can’t fix stupid”.
  
  Odpowiedz
Mistrzu jo

7 marca, 2025 | 6:22 pm

Na sam koniec każdego projektu stworzonego przez ai wrzuca się prompt nakazujący znalezienie podatności oraz nieprawidłowych praktyk według przesłanych reguł i wszystko poprawia ai :) po prostu badacze nie wpadli, by kazać zrobić code.review sztucznej inteligencji. Zakop

Odpowiedz
Hitgub

7 marca, 2025 | 6:57 pm

A na LI na zmianę jak nie jeden się chwali: napisałem stronę w 15 minut, to drugi – napisałem czata AI w 10 minut! W obydwu przypadkach to co powstało przyprawia przeciętnego mida o ciarki, tylko że ewangeliści AI nie są w stanie tego stwierdzić, bo nie mają ani wiedzy programistycznej, ani doświadczenia.
AI jest na etapie zachłyśnięcia się biznesu, że oto mogą sobie sami wszystko zrobić i nie potrzebują tych gburowatych programistów zasłaniających się terminami. Do etapu, że to nie działa, dopiero dojdziemy :)

Odpowiedz
Łukasz

8 marca, 2025 | 8:55 pm

Próbowałem różnych tego typu narzędzi, i o ile nie robię jakiś kompletnie sztampowych rzeczy to generowany kod jest najczęściej nieprawidłowy lub nie uwzględniający wielu rzeczy.
Nie wiem, może nie umiem z tego korzystać.

Najgorszą dla mnie cechą GenAI jest to że nie umie powiedzieć „nie wiem”, co wynika że sposobu działania.

Odpowiedz
- Publius
  
  10 marca, 2025 | 8:16 pm
  
  Wielu programistów, architektów, itd też nie potrafi powiedzieć „nie wiem”, więc przynajmniej w tym całe to ĄĘ przypomina człowieka.
  
  Odpowiedz
Przemek

9 marca, 2025 | 9:59 pm

Nie widzę nigdzie problemu – przecież jeżeli ktoś poda na stackoverflow przykład jak wysłać coś na slacka / googla itp to nie będzie przy takim temacie pisał całej infry do przechowywania haseł, tokenów tylko napisz TUTAJ_SE_WKLEP_SWOJE_TAJNE_HASLO
Zapewne jakby ktoś wpisał promtpa – wyślij wiadomomość na slack przy użyciu bezpiecznego przechowywania hasłe itp to kod od tego by się tam znalazł.
No ludzie.
Jak proszę promptem o shella która ma mi wyszukać pliki względem jakiegos regexpa to nie wymagam żeby mi pisał całą aplikację!

Odpowiedz
Dzikus

9 marca, 2025 | 10:41 pm

Uśmiałem się.. przecież to są oczywiste błędy, a żadne ai nie weźmie tych sekretnych kluczy API, maili, czy innych danych znikąd xD sami je tam wprowadzamy, I najczęściej musimy się siłować żeby zrobić hardcode gemini API + discord bot tokena w skrypcie xd

Odpowiedz
lucek

10 marca, 2025 | 8:36 am

Ludzie popełniają błędy. Są badania ile błędów na 1000 linii robi doświadczony programista. Tak było jest i będzie.
LLMy są karmione na etapie treningu tym kodem zawierającym błędy. Czy ktoś się oczekiwał, ze LLMy trenowane na danych zawierajacych błędy będą pisać bezbłędny kod?

Odpowiedz

Wprowadzenie do bezpieczeństwa IT od sekuraka!

Zachwyt nad LLMami, a zderzenie z górą lodową – czyli o powielaniu błędnych praktyk

Spodobał Ci się wpis? Podziel się nim ze znajomymi:

Komentarze

Odpowiedz na Dzikus