4 maja 20264 min czytania

OpenAI udostępnia Symphony — system pozwalający agentom AI zarządzać sobą samodzielnie

OpenAI wypuściło Symphony, które przekształca trackery zadań w centrum kontroli dla autonomicznych agentów AI, eliminując problem ludzkiej uwagi jako wąskiego gardła.

Źródło zdjęcia: The Decoder

Poprzedni

DeepClaude — Claude Code z DeepSeek V4 Pro za 17 razy niższą cenę

Następny

30 tysięcy programistów IBM pracuje codziennie z AI o imieniu Bob

Podobne Publikacje

Narzędzia i Aplikacje

Google uruchamia konkurs filmowy Future Vision XPRIZE z pulą nagród 3,5 mln dolarów

Google partneruje z XPRIZE w konkursie filmowym o wartości 3,5 mln dolarów. Zwycięzca otrzyma wsparcie w produkcji pełnometrażowego filmu.

2 min6 maja

Etyka i Bezpieczeństwo

Pracownicy Google DeepMind tworzą związki zawodowe w proteście przeciwko kontraktom wojskowym

98% członków związku w DeepMind poparło utworzenie reprezentacji w proteście przeciwko używaniu AI przez wojsko izraelskie i amerykańskie.

Kluczowe wnioski

OpenAI udostępniło Symphony jako open-source'ową specyfikację, która przekształca trackery zadań typu Linear w centrum dowodzenia dla agentów Codex

Niektóre wewnętrzne zespoły odnotowały sześciokrotny wzrost scalonych pull requestów w ciągu pierwszych trzech tygodni użytkowania systemu

System automatycznie przypisuje aktywne zadania agentom, które mogą również samodzielnie tworzyć nowe tickety dla zadań następczych

Agenci są kierowani przez proste pliki markdown z jasnymi celami, a OpenAI udostępnia Symphony jedynie jako implementację referencyjną

Społeczność już adaptuje system na inne modele i platformy, włączając wersję dla Claude Code z GitHub Issues

Problem ludzkiej uwagi jako wąskiego gardła

Przed wprowadzeniem Symphony deweloperzy w OpenAI prowadzili kilka sesji Codex równolegle, rozdawali zadania i śledzili postępy każdego z nich. W praktyce prowadzenie więcej niż trzech do pięciu sesji jednocześnie było niemal niemożliwe bez ciągłego przełączania kontekstu, co rujnowało produktywność.

„Agenci byli szybcy, ale mieliśmy wąskie gardło systemu: ludzką uwagę”, piszą deweloperzy. Zbudowali zespół juniorskich programistów, tylko po to, by obciążyć swoich ludzkich współpracowników mikromanagementem. To właśnie zainspirowało pomysł odwrócenia przepływu pracy — zamiast nadzorowania sesji, agenci mieli sami pobierać pracę bezpośrednio z trackera.

Linear jako maszyna stanów

Symphony wykorzystuje Linear jako maszynę stanów. Zadania przechodzą przez statusy takie jak „Todo”, „In Progress”, „Review” i „Merging”. System obserwuje tablicę i zapewnia, że każdy aktywny ticket ma przypisanego agenta. Jeśli agent się zawiesza lub zatrzymuje, Symphony go ponownie uruchamia.

Pobierane są tylko odblokowane zadania, co pozwala na równoległe wykonywanie drzewa zadań. Zespół wskazuje na aktualizację React, która rozpoczęła się dopiero po migracji upstream do Vite. Zadania mogą być znacznie większe niż pojedyncza zmiana kodu — niektóre generują kilka pull requestów w różnych repozytoriach, podczas gdy inne to czysto badawcze lub analityczne zadania bez kodu.

Jeśli agenci zauważą problemy poza swoim bieżącym zadaniem — jak problemy z wydajnością czy możliwości refaktoryzacji — samodzielnie tworzą nowe tickety. Według OpenAI, product managerowie i designerzy mogą również bezpośrednio zgłaszać żądania funkcji i otrzymać pakiet recenzji z video walkthrough bez sprawdzania repozytorium.

Specyfikacja jako fundament

Gdy otworzysz repozytorium Symphony, znajdziesz głównie plik SPEC.md. Ten plik markdown przedstawia problem i pożądane rozwiązanie. Zamiast budować złożony system monitoringu, OpenAI dostarcza specyfikację, którą agenci mogą sami zaimplementować.

Implementacja referencyjna została napisana w Elixir — języku z solidnymi narzędziami do współbieżnych procesów. OpenAI twierdzi, że Codex zbudował tę implementację za jednym razem. Aby przetestować specyfikację, zespół Codex kazał również zaimplementować ją w TypeScript, Go, Rust, Java i Python.

Nie każde zadanie nadaje się do Symphony. Niejednoznaczne problemy lub praca wymagająca osądu wciąż są obsługiwane bezpośrednio przez deweloperów w interaktywnych sesjach Codex. Symphony służy głównie do pochłaniania rutynowej pracy, aby ludzie mogli skupić się na jednym trudnym problemie na raz.