Popularne repozytorium naukowe ArXiv karze autorów rocznym banem za niepsprawdzone treści z modeli AI. Nowe zasady wymagają pełnej weryfikacji.

Źródło zdjęcia: TechCrunch
ArXiv, jedno z najważniejszych repozytoriów naukowych preprintów, wprowadza surowe kary za nieodpowiedzialne wykorzystywanie sztucznej inteligencji w publikacjach. Według nowych zasad, autorzy którzy nie sprawdzą treści wygenerowanych przez modele językowe, otrzymają roczny ban od publikowania.
Platforma, szeroko wykorzystywana w dziedzinach takich jak informatyka i matematyka, od lat zmaga się z rosnącą liczbą niskiej jakości publikacji generowanych przez AI. Nowe regulacje mają na celu zachowanie integralności naukowej w erze sztucznej inteligencji.
Thomas Dietterich, przewodniczący sekcji informatyki ArXiv, ogłosił w czwartek, że platforma wprowadza zasadę „one-strike” wobec nieodpowiedzialnego używania modeli językowych. Jak wyjaśnił, jeśli publikacja zawiera niepodważalne dowody, że autorzy nie sprawdzili wyników generacji LLM, oznacza to, że „nie możemy ufać niczemu w tym artykule”.
Kluczowe jest rozróżnienie między używaniem AI a brakiem nadzoru nad jej wynikami. Dietterich podkreślił, że autorzy muszą brać „pełną odpowiedzialność” za treść, „niezależnie od tego, w jaki sposób zostanie wygenerowana”. Oznacza to, że kopiowanie „niewłaściwego języka, splagiatowanych treści, stronniczych treści, błędów, pomyłek, nieprawidłowych referencji lub wprowadzających w błąd treści” bezpośrednio z modeli językowych nadal obciąża odpowiedzialnością autorów.
ArXiv już wcześniej podejmowało kroki przeciwko rosnącej liczbie niskiej jakości publikacji generowanych przez AI. Platforma wprowadziła wymóg, aby autorzy publikujący po raz pierwszy otrzymali poparcie od uznanego badacza. Po ponad 20 latach funkcjonowania pod egidą Cornell University, organizacja staje się niezależną organizacją non-profit, co ma umożliwić pozyskanie większych funduszy na walkę z tym, co określa się mianem „AI slop”.
Problem wykracza poza ArXiv — najnowsze recenzowane badania wykazują wzrost liczby sfabrykowanych cytatów w badaniach biomedycznych, prawdopodobnie z powodu używania modeli językowych. Co istotne, naukowcy nie są jedynymi, którzy dają się przyłapać na używaniu cytatów wymyślonych przez sztuczną inteligencję.
Nowe regulacje ArXiv stanowią znaczący krok w kierunku zachowania standardów naukowych w erze sztucznej inteligencji. Wprowadzenie surowych kar przy jednoczesnym zachowaniu możliwości korzystania z AI pod warunkiem odpowiedzialności może stać się modelem dla innych platform naukowych zmagających się z podobnymi wyzwaniami.

Zwycięzcy Commonwealth Short Story Prize 2026 stoją w obliczu oskarżeń o wykorzystanie sztucznej inteligencji. Narzędzia wykrywania AI wskazują 100% prawdopodobieństwo.

Nowe podsumowania AI w Google Search generują pusty blok zamiast definicji słowa 'disregard', podczas gdy Bing dostarcza użyteczne wyniki.

Nowy Gemini 3.5 Flash osiąga 280 tokenów na sekundę, ale koszty wzrosły trzykrotnie. W zadaniach agentowych przewyższa nawet droższy model Pro.