15 czerwca 20264 min czytania

Transformer rozwiązuje problem harmonogramowania warsztatów lepiej niż klasyczne heurystyki

Naukowcy opracowali metodę opartą na architekturze Transformer, która osiąga wyniki w 15–30% od optymalnych w problemach harmonogramowania warsztatów.

Źródło zdjęcia: arXiv.org

Naukowcy z zespołu Faezeh Ardali opracowali nowatorską metodę rozwiązywania problemu harmonogramowania otwartego warsztatu (OSSP) przy użyciu architektury Transformer w połączeniu z głębokim uczeniem ze wzmocnieniem. Badanie, opublikowane w arXiv, przedstawia alternatywę dla klasycznych metod heurystycznych w jednym z najbardziej złożonych problemów optymalizacyjnych w przemyśle.

Problem harmonogramowania otwartego warsztatu występuje w wielu środowiskach przemysłowych i usługowych, ale pozostaje obliczeniowo trudny wraz ze wzrostem liczby zadań i maszyn. Podczas gdy dokładne metody szybko stają się niewykonalne, klasyczne reguły dyspozycyjne i metaheurystyki mogą wymagać znacznego dostrajania, aby utrzymać jakość rozwiązań na dużą skalę.

Kluczowe wnioski

Metoda oparta na architekturze Transformer z enkoder-dekoder i mechanizmem wielogłowicowej uwagi osiąga rozwiązania w zakresie 15–30% od najlepszych znanych wartości dla instancji benchmarkowych Taillard.
Model wytrenowany na małych instancjach (4x4 do 10x10) skutecznie generalizuje na znacznie większe problemy (40x40 do 100x100) bez konieczności ponownego trenowania.
W porównaniu z klasycznymi heurystykami SPT, LPT, MWKR i EST, Transformer osiąga średnie odchylenia 12,89–15,12% względem standardowych dolnych granic.
Metoda wymaga jedynie macierzy czasów przetwarzania jako wejścia, oferując rozwiązanie o niskim zapotrzebowaniu na cechy w porównaniu z tradycyjnymi podejściami.
System pozostaje konkurencyjny względem heurystyki EST przy jednoczesnym znacznym przewyższeniu metod SPT i LPT.

Architektura i metodologia

Opracowany system wykorzystuje architekturę enkoder-dekoder z mechanizmem wielogłowicowej uwagi, charakterystyczną dla modeli Transformer. Kluczową zaletą tego podejścia jest minimalistyczne wymaganie dotyczące danych wejściowych — model potrzebuje jedynie macierzy czasów przetwarzania, co znacznie upraszcza implementację w porównaniu z metodami wymagającymi złożonych cech inżynieryjnych.

Model był trenowany na instancjach benchmarkowych Taillard o rozmiarach 4x4, 5x5, 7x7 i 10x10. Te relatywnie małe przykłady treningowe okazały się wystarczające do nauczenia modelu ogólnych zasad harmonogramowania, które następnie można było zastosować do znacznie większych problemów.

Wyniki i porównania

Zespół badawczy przeprowadził kompleksową ocenę skalowalności, testując wytrenowany model na losowo generowanych instancjach od 40x40 do 100x100 maszyn i zadań. Porównano wyniki z czterema klasycznymi heurystykami dyspozycyjnymi: SPT (Shortest Processing Time), LPT (Longest Processing Time), MWKR (Most Work Remaining) oraz EST (Earliest Start Time).

Transformer osiągnął średnie odchylenia w zakresie 12,89–15,12% względem standardowych dolnych granic dla dużych instancji. Szczególnie imponujące jest to, że model pozostał konkurencyjny względem heurystyki EST, uważanej za jedną z najskuteczniejszych w tej klasie problemów, jednocześnie znacznie przewyższając prostsze metody SPT i LPT.

Implikacje dla przemysłu

Wyniki wskazują, że polityka harmonogramowania oparta na Transformer, wytrenowana na małych instancjach OSSP, może skutecznie generalizować na znacznie większe problemy rzeczywiste. To oznacza potencjalną rewolucję w podejściu do optymalizacji procesów produkcyjnych, gdzie tradycyjne metody często wymagają czasochłonnego dostrajania parametrów dla każdego nowego środowiska.

Badanie otwiera drogę do zastosowania nowoczesnych architektur uczenia maszynowego w klasycznych problemach optymalizacji kombinatorycznej, oferując alternatywę opartą na danych dla tradycyjnych reguł heurystycznych w harmonogramowaniu przemysłowym.

#transformer #optymalizacja #uczenie maszynowe #harmonogramowanie #OSSP

Udostępnij

Źródła

arXiv AI

Poprzedni

Nie, nie wszyscy używają AI do wszystkiego — badania obalają medialne mity

Następny

Nowy framework UP-NRPA pozwala AI dostosowywać dialogi do użytkownika w czasie rzeczywistym

Podobne Publikacje

Modele AI

Claude Fable 5 wyprzedza GPT-5.5 o 13 punktów w najtrudniejszych zadaniach matematycznych

Nowy model Anthropic osiągnął 88% dokładności w FrontierMath tier 4, podczas gdy GPT-5.5 uzyskał 75%. Przełom w matematycznym rozumowaniu AI.

3 min13 czerwca

Modele AI

Claude Fable 5 kosztuje dwukrotnie więcej za 5,7% wyższą wydajność

Nowy flagowy model Anthropic zajął pierwsze miejsce w rankingu AI, ale oferuje jedynie marginalny wzrost wydajności przy podwojeniu cen tokenów.

4 min12 czerwca

Modele AI

Rząd USA zablokował najnowszy model Claude Mythos 5 od Anthropic

Administracja Trumpa dała Anthropic 90 minut na wyłączenie dostępu do modeli Mythos 5 i Fable 5 po wykryciu sposobu omijania zabezpieczeń.

4 min16 czerwca

Kluczowe wnioski

Metoda oparta na architekturze Transformer z enkoder-dekoder i mechanizmem wielogłowicowej uwagi osiąga rozwiązania w zakresie 15–30% od najlepszych znanych wartości dla instancji benchmarkowych Taillard.

Model wytrenowany na małych instancjach (4x4 do 10x10) skutecznie generalizuje na znacznie większe problemy (40x40 do 100x100) bez konieczności ponownego trenowania.

W porównaniu z klasycznymi heurystykami SPT, LPT, MWKR i EST, Transformer osiąga średnie odchylenia 12,89–15,12% względem standardowych dolnych granic.

Metoda wymaga jedynie macierzy czasów przetwarzania jako wejścia, oferując rozwiązanie o niskim zapotrzebowaniu na cechy w porównaniu z tradycyjnymi podejściami.

System pozostaje konkurencyjny względem heurystyki EST przy jednoczesnym znacznym przewyższeniu metod SPT i LPT.

Architektura i metodologia

Wyniki i porównania

Implikacje dla przemysłu