Open source'owy pakiet ARS automatyzuje rutynowe zadania w pisaniu prac naukowych, oferując 13-agentowy zespół badawczy za 4–6$ za pracę.
Źródło zdjęcia: GitHub
Naukowcy i studenci zyskali nowe narzędzie do wspomagania pracy badawczej — pakiet Academic Research Skills (ARS) dla Claude Code, który automatyzuje rutynowe zadania w procesie pisania prac naukowych. Projekt dostępny jest na GitHub jako open source i obejmuje cały cykl badawczy — od planowania struktury po recenzję gotowego tekstu.
/plugin marketplace add Imbad0202/academic-research-skills, a koszt pełnego pipeline'u wynosi około 4–6 dolarów za pracę liczącą 15 tysięcy słów.ARS działa jako kompleksowy pipeline składający się z czterech głównych modułów. Deep Research to 13-agentowy zespół badawczy oferujący tryb dialogu Sokratejskiego, systematyczny przegląd PRISMA, wykrywanie intencji i monitorowanie stanu dialogu. Academic Paper zapewnia wsparcie 12 agentów w pisaniu z kalibracją stylu, kontrolą jakości pisania, utwardzaniem LaTeX i wizualizacją.
System Academic Paper Reviewer implementuje wieloperspektywiczną recenzję przez 7 agentów z rubrykami jakości w skali 0–100, obejmującymi redaktora naczelnego, trzech dynamicznych recenzentów i advocatus diaboli. Academic Pipeline stanowi 10-etapowy orkiestrator z adaptacyjnymi punktami kontrolnymi, weryfikacją twierdzeń i opcjonalną weryfikacją integralności między modelami.
Nowością w wersji 3.3.2+ są metadane poziomu dostępu do danych — każda umiejętność deklaruje data_access_level (raw/redacted/verified_only) kontrolowany przez skrypty. System wprowadza także adnotacje typów zadań, gdzie wszystkie obecne umiejętności ARS są oznaczone jako „open-ended”.
Twórcy ARS odrzucają model pełnej automatyzacji na rzecz współpracy człowieka z AI. Jak wyjaśniają: „AI jest twoim kopilotem, nie pilotem. To narzędzie nie napisze za ciebie pracy. Zajmuje się robotą — wyszukiwaniem referencji, formatowaniem cytatów, weryfikacją danych, sprawdzaniem logicznej spójności — abyś mógł skupić się na częściach, które rzeczywiście wymagają twojego mózgu.”
System opiera się na badaniach Lu et al. (2026, Nature 651:914–919), którzy stworzyli The AI Scientist — pierwszy w pełni autonomiczny system badawczy AI, który opublikował pracę przez ślepą recenzję w top-tierowym venue ML. Jednak ich sekcja Limitations wylicza tryby awarii, które dziedziczy każdy w pełni autonomiczny pipeline badawczy AI: błędy implementacji, uhalucynowane wyniki, poleganie na skrótach i fabrykację metodologii.
ARS implementuje bramy integralności na etapach 2.5 i 4.5, uruchamiające 7-modową blokującą checklistę. Recenzent oferuje opcjonalny tryb kalibracji mierzący własny FNR/FPR względem dostarczonego przez użytkownika złotego zestawu.
Projekt stanowi praktyczną implementację tezy, że badacz wspomagany przez AI unika tych trybów awarii lepiej niż którykolwiek z nich działający samodzielnie. System kosztuje około 4–6 dolarów za pełny pipeline dla pracy liczącej 15 tysięcy słów, oferując kompleksowe wsparcie od koncepcji po publikację z zachowaniem ludzkiej kontroli nad kluczowymi decyzjami badawczymi.

Test programistyczny pokazał zbliżoną skuteczność GLM-5.2 i Opus 4.7, ale dramatyczna różnica w cenie może wywrócić rynek AI do góry nogami.

Największy dotąd pozew lokalnych mediów przeciwko gigantom tech. Wydawcy zarzucają kradzież artykułów, w tym płatnych, do trenowania ChatGPT i Copilot.

OpenAI zaprezentowało GPT-5.5-Cyber, który osiąga 85,6% w benchmarku CyberGym, przewyższając konkurencyjny Mythos 5. Nowy model automatyzuje proces od wykrycia luk do łatek.