Naukowcy opracowali wieloagentowy system AI osiągający 84,7% skuteczności w automatycznym generowaniu kompletnych pipeline'ów ML na podstawie danych i opisów.

Źródło zdjęcia: arXiv.org

Amazon dodał do SageMaker AI agenta, który automatyzuje fine-tuning modeli językowych na podstawie opisów w naturalnym języku.

Współzałożyciel OpenAI stanął przed sądem w sprawie Muska, broniąc majątku wartego nawet 30 miliardów dolarów i odpierając zarzuty o „moralną niewypłacalność”.
Naukowcy z Rumunii opracowali przełomowy system wieloagentowej sztucznej inteligencji, który automatycznie generuje kompletne pipeline'y uczenia maszynowego na podstawie danych i opisów w języku naturalnym. Badanie opublikowane w arXiv przedstawia architekturę pięciu agentów AI, która osiąga 84,7% skuteczności w tworzeniu end-to-end pipeline'ów ML.
System „Think it, Run it” został zaprojektowany przez zespół Adeli Bara, Gabrieli Dobrițy i Simony-Vasilicy Oprei jako odpowiedź na potrzebę automatyzacji złożonych procesów tworzenia modeli uczenia maszynowego. Tradycyjnie proces ten wymaga ręcznego projektowania, kodowania i optymalizacji każdego etapu pipeline'u, co jest czasochłonne i podatne na błędy.
Opracowany system składa się z pięciu specjalistycznych agentów, z których każdy odpowiada za konkretny aspekt tworzenia pipeline'u ML. Pierwszy agent zajmuje się profilowaniem danych, analizując strukturę i charakterystykę dostarczonego zbioru danych. Drugi agent parsuje intencje użytkownika, interpretując opisy zadań podane w języku naturalnym.
Trzeci agent rekomenduje odpowiednie mikrousługi na podstawie analizy danych i celów projektu, wykorzystując eksplanacyjny system rekomendacji hybrydowych. Czwarty agent konstruuje Directed Acyclic Graph (DAG) — skierowany graf acykliczny określający kolejność operacji w pipeline'ie. Ostatni agent odpowiada za wykonanie całego procesu i monitorowanie jego przebiegu.
Kluczową innowacją systemu jest mechanizm samo-naprawiający, który wykorzystuje duże modele językowe do interpretacji błędów występujących podczas wykonywania pipeline'ów. Gdy system napotka problem, automatycznie analizuje komunikaty błędów, identyfikuje przyczynę i podejmuje próby naprawy bez interwencji użytkownika.
System implementuje również adaptacyjne uczenie się z historii wykonań, co pozwala mu na ciągłe doskonalenie rekomendacji i strategii rozwiązywania problemów. Każde wykonanie pipeline'u dostarcza cennych informacji, które są wykorzystywane do optymalizacji przyszłych procesów.
Dodatkowo architektura integruje code-grounded Retrieval-Augmented Generation (RAG) dla lepszego zrozumienia mikrousług. To podejście pozwala systemowi na dokładniejsze dopasowanie komponentów do specyficznych wymagań każdego zadania ML.
Ewaluacja systemu przeprowadzona na 150 różnorodnych zadaniach uczenia maszynowego wykazała jego znaczną przewagę nad metodami bazowymi. Osiągnięta skuteczność 84,7% w tworzeniu kompletnych pipeline'ów end-to-end stanowi istotny postęp w automatyzacji procesów ML.
Badanie potwierdza, że zintegrowane podejście wieloagentowe przewyższa wydajnością izolowane rozwiązania. Ścisłe powiązanie inteligentnych komponentów w ramach jednej architektury zapewnia lepszą koordynację i optymalizację całego procesu niż suma niezależnych narzędzi.
System „Think it, Run it” reprezentuje znaczący krok w kierunku demokratyzacji uczenia maszynowego, umożliwiając użytkownikom bez głębokiej wiedzy technicznej tworzenie zaawansowanych pipeline'ów ML poprzez proste opisy w języku naturalnym.