Praktyka · budowanie skilli
Zbudowałem skill do analizy konkurencji, podałem mu trzy firmy i dostałem gotowy obraz rynku.
W tym artykule pokażę ci coś naprawdę super. To jest nowość i kawał możliwości, które dopiero teraz się otwierają. Pokażę ci, jak możesz rewelacyjnie wykorzystać skill, bo daje to niesamowite rzeczy, o jakich jeszcze niedawno nie było mowy. Sam to przetestowałem na żywym przykładzie i właśnie to opisuję ci poniżej, krok po kroku.
Z moich poprzednich tekstów wiesz już, czym jest skill. Mówię o tym dość często. To zapisana struktura zadania, instrukcja, w której krok po kroku opisujesz, co AI ma zrobić, a agent wykonuje to po kolei. Opisujesz raz, odpalasz komendą, dostajesz za każdym razem ten sam, dobrze zrobiony efekt. To jest jasne i to już znasz.
Ale ten skill, który dzisiaj pokażę, jest czymś zupełnie innym i nowym. To był dla mnie świetny test i dlatego chcę go opisać dokładnie. Zbudowałem skill do analizy konkurencji, podałem mu trzy firmy i dostałem gotowy obraz rynku. Wyszło bardzo dobrze. Najciekawsze jest jednak nie to, co dostałem, tylko to, jak ten skill jest zbudowany w środku, bo to pokazuje, jak mocne rzeczy można dziś robić.
Mechanika
W zwykłym skillu agent, któremu zlecasz zadanie, sam je wykonuje, tu i teraz, w twojej rozmowie. Czyta, analizuje, odpowiada. Wszystko dzieje się na twoich oczach i w tym samym oknie.
Żeby zrozumieć, co ten skill robi inaczej, wyobraź sobie zwykłą sytuację w firmie. Jesteś głównym szefem, CEO. Chcesz sprawdzić, jak działa twoja konkurencja, i wybierasz trzy firmy do prześwietlenia. Nie robisz tego sam, bo masz od tego ludzi. Wołasz jednego ze swoich menadżerów i mówisz: zajmij się tym, nie zawracaj mi głowy szczegółami, wróć z gotowym obrazem. I co ważne, to ty sam wybierasz, którego menadżera bierzesz do tego zadania. Ten menadżer to właśnie agent. A teraz najlepsze. Menadżer nie siada do roboty sam. Ma swój zespół. Rozdaje zadanie trzem swoim pracownikom, każdy bierze jedną firmę. Kiedy skończą, meldują mu wyniki, on składa je w całość i wraca do ciebie z gotową analizą. Ty dostajesz czysty wniosek, a całe zamieszanie zostało po stronie menadżera i jego ludzi.
Ten skill działa dokładnie tak. Kiedy go odpalasz, zadanie nie ląduje w twojej rozmowie. Skill tworzy osobnego agenta, twojego menadżera, w osobnym oknie kontekstowym. To jest ten oddzielny pokój, w którym menadżer pracuje w ukryciu i wraca do ciebie dopiero z gotowym wynikiem.
Już samo to jest cenne, bo cała ta praca nie zaśmieca twojej głównej rozmowy. Twoje okno zostaje czyste.
Ale to dopiero początek, bo najważniejsze jest to, co ten menadżer robi dalej. On nie analizuje trzech firm sam. On wywołuje kolejnych agentów na następnym poziomie, czyli swoich pracowników, dokładnie jak w naszym przykładzie z firmą. I tu jest cała nowość, bo to schodzenie w głąb nie kończy się na jednym poziomie. Każdy z tych pracowników mógłby wywołać kolejnych. Dziś można w ten sposób zejść aż do pięciu poziomów w głąb. Wyobraź sobie, ile pracy potrafi wykonać taka struktura, skoro na każdym poziomie agent może rozmnożyć zadanie na kolejnych.
Tyle warstw agentów można dziś zagnieździć jedna w drugiej. Na każdym poziomie agent może rozmnożyć zadanie na kolejnych, więc jedna komenda potrafi uruchomić całą strukturę pracujących równolegle agentów.
Dla naszej analizy konkurencji wygląda to tak:
Menadżer sam niczego nie szuka. Czeka na trzy gotowe profile i dopiero z nich wyciąga wnioski. Dzięki temu jego głowa zostaje wolna na to, co najtrudniejsze, czyli na sam wniosek, a nie na przekopywanie się przez dziesiątki stron.
Anatomia pliku
To wszystko brzmi jak skomplikowana technologia, a w środku jest zwykłym plikiem tekstowym. Cała ta magia siedzi w kilku linijkach na samej górze, w tak zwanym frontmatterze. Przejdźmy przez nie po kolei, bo każda coś włącza.
To ona sprawia, że skill nie wykona się w twojej rozmowie, tylko utworzy osobnego agenta w osobnym oknie. Wpisujesz fork i właśnie to się dzieje, praca przenosi się do ukrycia.
Tutaj wybierasz, kto jest twoim menadżerem. W tym przykładzie wskazałem agenta ogólnego, czyli takiego do wszystkiego. Ale jeśli wcześniej skonfigurujesz własnego, wyspecjalizowanego agenta, a to już osobny temat, to właśnie w tej linijce go wpiszesz i to on poprowadzi całą robotę. Ty decydujesz, kto jest tym szefem operacji.
Oznacza, że skill nigdy nie odpali się sam z siebie. Uruchomi się tylko wtedy, kiedy ty wpiszesz komendę. To celowe, bo taki skill odpala kilku agentów naraz i nie chcesz, żeby ruszył przez przypadek.
To po prostu podpowiedź, że masz podać nazwy firm.
Mówi, z jakich narzędzi agent ma prawo skorzystać. I tu jest sprytna rzecz: narzędzie Task to nic innego jak prawo do wywoływania kolejnych agentów. Bez niego menadżer nie mógłby rozdać pracy nikomu. To jest właśnie ten klucz, który otwiera drogę na następny poziom.
Tak wygląda cały skill w środku. Możesz go wziąć, podmienić nazwy i przerobić pod własną branżę.
--- name: analiza-konkurencji description: Analiza konkurencji zespołem agentów. Jeden agent bada jedną firmę, menadżer składa wnioski. context: fork # skill działa w osobnym oknie i nie zaśmieca twojej rozmowy agent: general-purpose # to ty wybierasz menadżera; tu agent ogólny, ale może być twój własny disable-model-invocation: true # odpala się tylko wtedy, kiedy sam wpiszesz komendę argument-hint: "firma 1, firma 2..." allowed-tools: Task, Exa, WebFetch # Task to prawo do wywoływania kolejnych agentów --- # Analiza konkurencji ## Firmy $ARGUMENTS ## Twoja rola Jesteś menadżerem. Rozdaj pracę, nie rób jej sam. Twoja głowa ma zostać czysta na wnioski. ## Krok 1: rozdaj zadania Dla każdej firmy odpal osobnego pracownika. Każdy dostaje: 1. nazwę jednej firmy, 2. wzór profilu poniżej, przepisany co do słowa, 3. zasady: tylko fakty, źródło do każdego zdania, a gdzie brak danych, pisz UNKNOWN zamiast zgadywać. ### Wzór profilu - Pozycjonowanie: dla kogo i jaka obietnica - Realny klient: komu naprawdę sprzedają - Cennik: każdy publiczny próg cenowy - Komunikacja: trzy główne motywy - Mocne strony: maksymalnie trzy - Luki i skargi: maksymalnie trzy, ze źródłem - Źródła: lista linków ## Krok 2: zbierz Poczekaj na wszystkich agentów. ## Krok 3: złóż wnioski Na podstawie samych profili: 1. kto bije się o tego samego klienta, 2. gdzie jest wolne miejsce, którego nikt nie zajął, 3. którędy wejść z najmniejszym oporem. ## Wynik Zwróć tylko wnioski z kroku 3, nie surowe profile.
Najważniejsza lekcja
A teraz rzecz, dla której właściwie piszę ten tekst. Pierwsza wersja tego skilla nie działała tak, jak chciałem. I to jest zupełnie normalne. Tak to zawsze wygląda. Nikt nie pisze skilla, który od razu jest gotowy, i nie ma w tym nic złego.
Kluczowe jest to, co robisz dalej. Nie siadasz do kodu i nie grzebiesz w technicznych szczegółach. Po prostu rozmawiasz ze swoim głównym agentem, normalnie, tak jak rozmawiałbyś z kimś z zespołu. Mówisz: tu coś nie zagrało, jak ty to oceniasz, gdzie widzisz błędy. A potem: dobra, to teraz popraw. I on poprawia. Cała inżynieria dzieje się w zwykłej rozmowie.
U mnie wyszły z tej rozmowy trzy rzeczy:
Menadżerowi brakowało prawa do rozdawania pracy, więc cała maszyna by się odpaliła i stanęła, bo nie miałby czym powołać ani jednego pracownika.
Narzędzia do szukania w sieci były przypisane nie tej osobie, co trzeba, i przy okazji podmieniliśmy zwykłą wyszukiwarkę na lepszą, która oddaje czystsze dane ze stron z cennikami.
Zasada o źródłach była za sztywna i kazała wyrzucać cenne informacje, na przykład słabe oceny obsługi klienta, więc złagodziliśmy ją z głową, tak żeby twarde dane musiały mieć mocne źródło, a miększe sygnały mogły zostać, byle uczciwie oznaczone.
Żadnej z tych rzeczy nie dało się zobaczyć, patrząc na gotowy plik. Wyszły dopiero wtedy, kiedy zacząłem dopytywać agenta o szczegóły i kiedy odpaliłem prawdziwy test na żywych danych.
Wniosek
Tak, i to jest właśnie sedno pracy z AI na poważnie. Budujesz szkielet, rozmawiasz, testujesz na czymś prawdziwym, poprawiasz to, co się posypało, i tak w kółko, aż działa.
↺ i tak w kółko, aż działa
Wartość nie powstaje w chwili, kiedy skill jest napisany. Powstaje w tej pętli.
AI jest dobre w napisaniu pierwszej wersji, która wygląda na skończoną. Ty jesteś dobry w pytaniu, czy to na pewno zadziała, i to twoje pytanie odsłania, gdzie pierwsza wersja kłamie. Na końcu masz narzędzie sprawdzone w boju, a nie tylko ładnie napisane.