OpenAI wypuściło Symphony, które przekształca trackery zadań w centrum kontroli dla autonomicznych agentów AI, eliminując problem ludzkiej uwagi jako wąskiego gardła.

Źródło zdjęcia: The Decoder

Google partneruje z XPRIZE w konkursie filmowym o wartości 3,5 mln dolarów. Zwycięzca otrzyma wsparcie w produkcji pełnometrażowego filmu.

98% członków związku w DeepMind poparło utworzenie reprezentacji w proteście przeciwko używaniu AI przez wojsko izraelskie i amerykańskie.
OpenAI wypuściło Symphony — system, który przekształca narzędzia do zarządzania zadaniami w centrum kontroli dla autonomicznych agentów AI. Zamiast żonglerki wieloma sesjami, deweloperzy mogą teraz pozwolić agentom samodzielnie wybierać zadania z listy, a sami skupić się na przeglądaniu rezultatów. Szczegóły rozwiązania dostępne są na The Decoder.
Symphony to odpowiedź na problem, który OpenAI zidentyfikowało w swoich wewnętrznych procesach — ludzka uwaga stała się wąskim gardłem w pracy z wieloma agentami AI jednocześnie.
Przed wprowadzeniem Symphony deweloperzy w OpenAI prowadzili kilka sesji Codex równolegle, rozdawali zadania i śledzili postępy każdego z nich. W praktyce prowadzenie więcej niż trzech do pięciu sesji jednocześnie było niemal niemożliwe bez ciągłego przełączania kontekstu, co rujnowało produktywność.
„Agenci byli szybcy, ale mieliśmy wąskie gardło systemu: ludzką uwagę”, piszą deweloperzy. Zbudowali zespół juniorskich programistów, tylko po to, by obciążyć swoich ludzkich współpracowników mikromanagementem. To właśnie zainspirowało pomysł odwrócenia przepływu pracy — zamiast nadzorowania sesji, agenci mieli sami pobierać pracę bezpośrednio z trackera.
Symphony wykorzystuje Linear jako maszynę stanów. Zadania przechodzą przez statusy takie jak „Todo”, „In Progress”, „Review” i „Merging”. System obserwuje tablicę i zapewnia, że każdy aktywny ticket ma przypisanego agenta. Jeśli agent się zawiesza lub zatrzymuje, Symphony go ponownie uruchamia.
Pobierane są tylko odblokowane zadania, co pozwala na równoległe wykonywanie drzewa zadań. Zespół wskazuje na aktualizację React, która rozpoczęła się dopiero po migracji upstream do Vite. Zadania mogą być znacznie większe niż pojedyncza zmiana kodu — niektóre generują kilka pull requestów w różnych repozytoriach, podczas gdy inne to czysto badawcze lub analityczne zadania bez kodu.
Jeśli agenci zauważą problemy poza swoim bieżącym zadaniem — jak problemy z wydajnością czy możliwości refaktoryzacji — samodzielnie tworzą nowe tickety. Według OpenAI, product managerowie i designerzy mogą również bezpośrednio zgłaszać żądania funkcji i otrzymać pakiet recenzji z video walkthrough bez sprawdzania repozytorium.
Gdy otworzysz repozytorium Symphony, znajdziesz głównie plik SPEC.md. Ten plik markdown przedstawia problem i pożądane rozwiązanie. Zamiast budować złożony system monitoringu, OpenAI dostarcza specyfikację, którą agenci mogą sami zaimplementować.
Implementacja referencyjna została napisana w Elixir — języku z solidnymi narzędziami do współbieżnych procesów. OpenAI twierdzi, że Codex zbudował tę implementację za jednym razem. Aby przetestować specyfikację, zespół Codex kazał również zaimplementować ją w TypeScript, Go, Rust, Java i Python.
Nie każde zadanie nadaje się do Symphony. Niejednoznaczne problemy lub praca wymagająca osądu wciąż są obsługiwane bezpośrednio przez deweloperów w interaktywnych sesjach Codex. Symphony służy głównie do pochłaniania rutynowej pracy, aby ludzie mogli skupić się na jednym trudnym problemie na raz.