Jak pracować z AI, żeby nie opowiadało bzdur

Zanim wejdziemy w szczegóły

Dlaczego twój AI Agent czasem zmyśla.

Pewnie znasz to uczucie. Dajesz twojemu AI Agent większe zadanie, na początku idzie świetnie, a po chwili zaczyna się gubić. Wymyśla rzeczy, których nie ma. Pomija połowę tego, o co prosiłeś. Miesza fakty. To nie jest tak, że twój AI Agent nagle zgłupiał. Po prostu skończyło mu się miejsce.

Twój AI Agent ma swoją pamięć roboczą. Nazywa się okno kontekstowe i mieści wszystko, co dasz mu w danej rozmowie: twoje polecenia, pliki, całą dotychczasową wymianę zdań. Ta pamięć ma granicę. Im więcej do niej wrzucisz, tym bardziej się zapełnia.

I tu jest rzecz, której mało kto na początku jest świadomy. Twój AI Agent nie psuje się dopiero wtedy, gdy pamięć jest pełna w stu procentach. Jakość zaczyna spadać już dużo wcześniej, mniej więcej w okolicach 50–60 procent zapełnienia. Wtedy traci wątek i zaczyna zmyślać. To zjawisko ma nawet swoją nazwę: context rot, czyli psujący się kontekst.

Okno kontekstowe AI Agent im więcej wrzucasz, tym dalej w prawo

bezpiecznie

context rot

~50–60% · próg

Strefa czysta

Pamięć w połowie wolna. Twój AI Agent trzyma się faktów, pamięta, o co prosiłeś, robi to dobrze.

Context rot

Pamięć za bardzo zapełniona. Twój AI Agent gubi wątek, zmyśla, pomija rzeczy. Tu robią się błędy.

Dobra wiadomość: są na to sposoby. Najprostszy i najskuteczniejszy to nie pozwolić, żeby jedno zadanie zapełniło całą pamięć twojego AI Agent. Trzymasz go w tej zielonej, czystej strefie i nie wpychasz mu naraz całego wielkiego projektu. I to, co zobaczysz poniżej, jest zrobione dokładnie na tej zasadzie, krok po kroku, na prawdziwym przykładzie z mojej własnej pracy.

Od czego się zaczęło

Sprawdzony schemat działania. Jak to zrobiłem.

Zbudowałem sobie własną aplikację. Nazywa się AI Planner i służy mi do zarządzania projektami i zadaniami. Zamiast płacić za gotowe narzędzie w stylu ClickUp, zrobiłem swoje, skrojone dokładnie pod siebie. I działa świetnie. Wygląda dobrze, klika się przyjemnie, robi to, czego potrzebuję.

Ale pojawiła się jedna myśl, która mi nie dawała spokoju. Z zewnątrz wygląda super. A co z tym, co w środku? Co z kodem, z całymi bebechami tej apki? Czy są dobrze ułożone, czy to jeden wielki bałagan, który wygląda ładnie tylko z daleka? Ja nie jestem koderem. Nie umiem zajrzeć do środka i ocenić, czy jest dobrze. Patrzę na kod i widzę ścianę liter.

I tu zaczyna się cała historia, bo to mój AI Agent pomógł mi rozwiązać dokładnie ten problem.

Pierwszy ruch

Niech AI Agent zajrzy do środka.

Otworzyłem moją apkę w Claude Code, systemie AI od Anthropic, który potrafi czytać i pisać kod. To tam pracuję z moim AI Agent. Poprosiłem go o jedno: przejrzyj cały kod tej aplikacji, od środka, i wypisz mi rzeczy, które warto poprawić.

Zrobił to bardzo porządnie. Przejrzał całość i stworzył mi dokument z listą. Werdykt był spokojny: apka jest zdrowa, nic się nie pali, nie ma żadnej awarii. Ale jest kilka miejsc, które warto uporządkować, żeby później łatwiej było ją rozbudowywać. Każdy punkt z osobna, po kolei, od najważniejszego.

Co już z tego widać

Nie musisz znać się na kodzie, żeby zadbać o jakość tego, co budujesz z twoim AI Agent. Możesz poprosić swojego AI Agent, żeby ocenił robotę. To trochę jak druga para oczu, która zna się na rzeczy, której ty nie znasz.

Pierwsza ważna decyzja

Wybrałem jedną rzecz, nie wszystko naraz.

Na liście było sporo do zrobienia. I tu jest pierwsza ważna decyzja. Nie rzuciłem się na całość. Wybrałem jeden punkt.

Padło na taki: w aplikacji był jeden plik, w którym siedziało wszystko naraz. Ponad tysiąc linijek, a w środku dwadzieścia kilka różnych elementów apki wciśniętych jeden obok drugiego. Wyobraź sobie jedną wielką szufladę, do której przez lata wrzucałeś wszystko: dokumenty, kable, paragony, klucze, baterie. Da się z niej korzystać, ale za każdym razem, gdy czegoś szukasz, przekopujesz całość. A im więcej tam wrzucisz, tym gorzej.

Zadanie brzmiało: rozbij tę jedną wielką szufladę na osobne, opisane szuflady. Każdy element apki do swojego folderu. Po takim porządkowaniu o wiele łatwiej dobudować coś nowego, bo wiesz dokładnie, gdzie co leży.

Główna zasada

Duże zadanie tnij na małe kawałki.

Dlaczego w ogóle dzieliłem to na kawałki, zamiast powiedzieć mojemu AI Agent „posprzątaj to całe" i pójść po kawę? Żeby to zrozumieć, musisz wiedzieć jedno o tym, jak myśli twój AI Agent.

Wiesz już, że ma on okno kontekstowe, czyli swoją pamięć roboczą. Wyobraź je sobie jako biurko. Wszystko, co dasz mu do przeczytania, ląduje na tym biurku: twoje polecenia, pliki, kod, wcześniejsza rozmowa. A biurko ma swój rozmiar. Im więcej na nie wrzucisz, tym bliżej tej czerwonej strefy, w której twój AI Agent zaczyna się gubić.

Biurko AI Agent · okno kontekstowe

Cały projekt naraz

Biurko zapełnione. Brak miejsca na myślenie, rzeczy spadają z brzegu.

Jeden mały kawałek

Czyste biurko, jedno zadanie, cała uwaga na nim.

Co się dzieje, gdy wrzucisz na nie cały wielki projekt naraz? Biurko się zapełnia. Robi się ciasno. Twój AI Agent ma coraz mniej miejsca na samo myślenie, a do tego zaczyna gubić rzeczy, które spadły gdzieś na brzeg. Im większe zadanie wrzucisz w całości, tym większa szansa, że twój AI Agent zrobi część dobrze, a o części zapomni albo coś pomyli.

Rozwiązanie jest proste. Nie zarzucasz całego biurka naraz. Dajesz jedno małe zadanie. Twój AI Agent je kończy. Czyścisz biurko. Dajesz następne małe zadanie, znowu na czystym biurku. I tak po kolei. Każdy kawałek dostaje całą uwagę i całe wolne miejsce, jakby był jedynym zadaniem na świecie.

Sedno

Każdy mały kawałek to dla twojego AI Agent osobne, świeże zadanie na czystym biurku. Dlatego dzielenie dużej roboty na kawałki to nie jest sprzątanie dla samego sprzątania. To sposób, żeby twój AI Agent w ogóle dał radę zrobić rzecz dobrze, do końca i bez gubienia połowy po drodze.

Trzy dokumenty

Pamięć, która przeżywa czyszczenie biurka.

Skoro biurko czyścimy po każdym kawałku, pojawia się problem. Jeśli twój AI Agent co chwilę zaczyna z czystym biurkiem, to skąd ma wiedzieć, co już jest zrobione, a co jeszcze nie? Przecież za każdym razem zaczyna na świeżo i nie pamięta poprzedniej rundy.

Odpowiedź to dokument, który leży obok biurka i przeżywa każde czyszczenie. Twój AI Agent zagląda do niego, widzi, na czym stanął, robi kolejny kawałek i odhacza go. W praktyce mój AI Agent w Claude Code przygotował mi trzy takie dokumenty, każdy z inną rolą.

Lista rzeczy do poprawy

Spis wszystkiego, co warto zrobić, z wyjaśnieniem dlaczego. Mapa całej roboty.

Opis jednego, wybranego zadania

Mój jeden punkt rozpisany krok po kroku: co przenieść, dokąd, w jakiej kolejności i jak sprawdzić po każdym kroku, że nic się nie zepsuło.

Dokument postępu, w którym AI Agent odhacza

Osobna kartka tylko ze statusem: co zrobione, co w trakcie, co czeka. Polecenie jest jasne: skończony krok zaznacz tutaj, zanim ruszysz dalej.

Te trzy dokumenty grają razem. Pierwszy mówi, co jest do zrobienia w ogóle. Drugi mówi, jak zrobić ten jeden konkretny kawałek. Trzeci pilnuje, na czym stoimy. Dzięki temu nawet po wyczyszczeniu biurka praca wraca dokładnie tam, gdzie się skończyła.

Mały smaczek

Dlaczego oddałem robotę innemu AI Agent.

Cały plan, te trzy dokumenty, przygotował mój AI Agent w Claude Code. Ale samo wdrożenie, czyli faktyczne przekładanie kodu, oddałem już innemu AI Agent, temu pracującemu w Codex, systemie AI od OpenAI. Dlaczego dwa różne rozwiązania do jednej apki?

Bo wśród ludzi, którzy robią to na co dzień, krąży taka obserwacja: Claude Code, rozwiązanie od Anthropic, jest bardzo dobre w planowaniu, a pracując w Codex, systemie AI od OpenAI, mój AI Agent świetnie sprawdza się we wdrażaniu. W jednym lepiej idzie rozłożenie roboty na kawałki i opisanie, jak ją zrobić. W drugim samo wykonanie tej roboty. I właśnie to tu sprawdziłem na żywo.

Claude Code

Planuje

Przegląda kod, rozkłada robotę na kawałki, pisze trzy dokumenty.

Gotowy komplet

Lista · opis · postęp

Nic do zgadywania. Wszystko opisane na talerzu.

Codex

Wdraża

Robi po kolei, kawałek po kawałku, i odhacza każdy skończony fragment.

Dałem mojemu AI Agent w Codex ten komplet i nie musiał niczego zgadywać. Po prostu robił po kolei, kawałek po kawałku, a po każdym skończonym fragmencie zaznaczał w dokumencie postępu: zrobione. Dokładnie tak, jak było napisane.

Jak to wyglądało

Z jednej szuflady w równy rząd szuflad.

Na starcie cała główna część AI Plannera siedziała w jednym folderze, wszystko wciśnięte razem. Mój AI Agent, z którym pracowałem w Codex, brał ją po kolei: wyciągał jedną sekcję kodu, zakładał dla niej osobny folder i przenosił tam ten kawałek. I tak sekcja po sekcji, aż został równy rząd osobnych, opisanych folderów.

Przed

AI Planner · jeden folder

jedna wielka szuflada, wszystko na kupę

W trakcie

AI Planner · co zostało

projekty zadania kalendarz…

AI Agent wyciąga jedną sekcję, zakłada jej folder i odhacza, że przełożył

projekty

zadania

automatyzacje

kalendarz

dokumenty

ustawienia

osobne, opisane szuflady, każda rzecz na swoim miejscu

Co ważne, z zewnątrz mój AI Planner wygląda dokładnie tak samo jak wcześniej. Te same ekrany, te same przyciski, działa identycznie. Zmieniło się tylko to, czego nie widać: środek jest teraz poukładany. A dzięki temu, gdy następnym razem zechcę coś dobudować, będzie o wiele łatwiej, bo wiadomo, gdzie co leży.

Co z tego wynika dla ciebie

Co możesz z tym teraz zrobić?

Mój przykład akurat dotyczył kodu, ale ta sama zasada działa przy każdym dużym zadaniu, jakie dajesz twojemu AI Agent. Duży raport, obszerna analiza, przepisanie sporej części materiałów, rozbudowany research. Wszędzie tam, gdzie robota nie zmieści się wygodnie na jednym biurku, działa ten sam schemat.

Podziel materiał na logiczne części

Cały twój materiał i cały kontekst rozbij na sensowne, osobne kawałki, które da się robić po kolei. To twoja lista do zrobienia, mapa całej roboty. Sam podział spokojnie zlecisz swojemu AI Agent.

Opisz każdy oddzielony kawałek

Każdy fragment opisz tak, żeby twój AI Agent wiedział, co dokładnie ma z nim zrobić, bez doczytywania reszty. To opis zadania: jeden kawałek, jedno jasne polecenie. Bez niego agent zgaduje, a od zgadywania zaczynają się błędy.

Oddaj to jako kontekst i dołóż dokument postępu

Gotową listę i opisy udostępnij swojemu AI Agent jako kontekst, żeby miał na czym pracować. Do tego dołóż dokument postępu i każ na nim odhaczać każdy skończony kawałek, zanim ruszy dalej. Tak nic nie wypadnie i nic nie zrobi się dwa razy.

Gotowe do wklejenia

Trzy prompty, które przygotują cały plan.

Niżej masz to samo, co zrobiłem ja, rozpisane na trzy gotowe prompty. Każdy odpowiada jednemu z trzech dokumentów. Wklejasz je po kolei do swojego AI Agent (u mnie był to Claude Code), za pierwszym razem dorzucasz swój materiał, a resztę robi on.

01 Niech AI Agent przejrzy całość i zrobi listę tworzy: lista do zrobienia

Przeczytaj uważnie cały materiał, który ci podaję: [tutaj wklej albo wskaż swój duży materiał].

Przejrzyj całość i przygotuj listę wszystkich rzeczy, które trzeba zrobić, żeby [wpisz swój cel, np. uporządkować ten projekt, napisać ten raport, przeprowadzić tę analizę]. Przy każdej pozycji podaj krótką nazwę, jedno zdanie o tym, dlaczego jest do zrobienia, i jak ważna jest względem reszty. Ułóż listę od najważniejszego.

Na razie niczego nie wykonuj. Tylko spisz wszystko w jednym dokumencie. To będzie nasza mapa całej roboty.

02 Wybierz jeden punkt i rozpisz go na kroki tworzy: opis zadania

Z listy, którą przed chwilą zrobiłeś, biorę jeden punkt: [wpisz, który]. Resztą na razie się nie zajmuj.

Rozpisz mi ten jeden punkt na konkretne, małe kroki do wykonania po kolei. Przy każdym kroku napisz dokładnie, co trzeba zrobić, w jakiej kolejności, i jak po nim sprawdzić, że wszystko gra i nic się nie zepsuło.

Zapisz to w osobnym dokumencie. Instrukcja ma być na tyle jasna, żeby dało się ją wykonać bez doczytywania reszty materiału.

03 Zrób dokument postępu i każ na nim odhaczać tworzy: dokument postępu

Na podstawie kroków z poprzedniego dokumentu zrób osobną, krótką kartkę postępu. Wypisz na niej wszystkie kroki jako listę do odhaczania, każdy ze statusem: do zrobienia, w trakcie, zrobione.

Od teraz pracuj tak: bierzesz jeden krok, wykonujesz go, a zanim ruszysz do następnego, zaznaczasz na tej kartce, że jest gotowy. Zawsze najpierw zaglądaj tutaj, żeby wiedzieć, na czym skończyliśmy.

Dzięki temu, nawet gdy zaczniemy nową rozmowę na czysto, od razu widać, co jest zrobione, a co jeszcze czeka.

I co dalej

Te trzy prompty dają ci gotowy komplet: listę, opis i kartkę postępu. Wtedy mówisz swojemu AI Agent „bierz się do roboty kawałek po kawałku i odhaczaj postęp", i pilnujesz już tylko, czy idzie zgodnie z planem. Tę część u mnie wykonał AI Agent w Codex, ale równie dobrze może to być ten sam, z którym przygotowałeś plan.