15 maja 20264 min czytania

Artykuły naukowe generowane przez AI stają się lepsze — i to ogromny problem dla nauki

Redakcje czasopism naukowych są zalewane AI-generowanymi artykułami coraz trudniejszymi do wykrycia. System peer-review może osiągnąć punkt krytyczny.

Źródło zdjęcia: The Verge

Poprzedni

CLIPR — nowy framework uczy AI preferencji użytkowników z minimalnych rozmów

Następny

GraphBit: nowy framework dla deterministycznej orkiestracji agentów AI osiąga 67,6% dokładności

Podobne Publikacje

Narzędzia i Aplikacje

Microsoft Edge z Copilotem analizuje wszystkie karty jednocześnie. Nowe funkcje AI w przeglądarce

Microsoft wprowadza w Edge funkcje AI, które analizują wszystkie karty, tworzą podcasty i quizy. Copilot otrzymuje długoterminową pamięć.

3 min14 maja

Biznes i Rynek

Tencent zwiększy wydatki na AI po poprawie dostępności chińskich chipów

Tencent planuje znacznie zwiększyć inwestycje w infrastrukturę AI w drugiej połowie 2026 roku, licząc na poprawę dostępności krajowych chipów.

Kluczowe wnioski

Sztuczna inteligencja umożliwia masową produkcję artykułów naukowych, które są wystarczająco przekonujące, by przejść przez proces recenzji.

System peer-review, już wcześniej przeciążony, może osiągnąć punkt krytyczny z powodu lawinowego wzrostu liczby publikacji AI-generowanych.

Firmy oferują narzędzia do tworzenia publikacji w kilka godzin, wykorzystując publicznie dostępne bazy danych do generowania pozornie nowych badań.

Paradoksalnie, im lepsza staje się technologia AI, tym większy problem stanowi dla integralności nauki.

„Młyny publikacyjne” ewoluowały od prostych plagiatów do wyrafinowanych systemów wykorzystujących AI do omijania detektorów.

Ewolucja „młynów publikacyjnych”

Przez ostatnią dekadę wydawnictwa naukowe zmagały się z tzw. „paper mills” — firmami produkującymi masowo artykuły i sprzedającymi miejsce w autorach naukowcom potrzebującym publikacji. To była gra w kotka i myszkę — wydawcy, często pod presją „detektywów naukowych” specjalizujących się w wykrywaniu oszustw, zamykali jedną lukę, a młyny znajdowały nową.

AI początkowo pomagało młynom omijać detektory plagiatu przez tworzenie nowych obrazów i tekstów. Jednak charakterystyczne „halucynacje” technologii pozwalały teoretycznie na wykrywanie takiej produkcji. W praktyce artykuły nadal przechodziły, by później zostać wycofane po odkryciu diagramów szczurów z niewytłumaczalnie wielkimi narządami płciowymi opisanymi jako „testtomcels” lub tekstu z pozostawionymi frazami „as an AI assistant”.

Nowa era AI-generowanej nauki

Matt Spick, wykładowca na University of Surrey i redaktor w Scientific Reports, zauważył zjawisko po otrzymaniu trzech uderzająco podobnych artykułów analizujących amerykańską bazę danych NHANES. Sprawdzenie Google Scholar ujawniło nagły wzrost publikacji cytujących NHANES, wszystkie według podobnej formuły — każda rzekomo odkrywająca związek między na przykład jedzeniem orzechów włoskich a funkcjami poznawczymi czy piciem odtłuszczonego mleka a depresją.

„Jeśli masz wystarczającą moc obliczeniową, przechodzisz przez wszystko i mierzysz każdą parę powiązań, a w końcu znajdziesz takie, o których jeszcze nie pisano i po prostu publikujesz: jest korelacja między tym a tamtym” — wyjaśnia Spick. Te korelacje to często mylące uproszczenia zjawisk o wielu przyczynach lub przypadkowe fluktacje statystyczne.

Spick podaje absurdalny przykład: „Jedna z prac twierdziła, że liczba lat edukacji powoduje powikłania przepukliny pooperacyjnej. To po prostu przypadkowa korelacja. Co mam z tym zrobić? Wcześnie skończyć szkołę, żeby nie mieć później powikłań przepukliny pooperacyjnej?”

Problem polega na tym, że obecne AI może produkować przekonujące artykuły niemal hurtowo, pozwalając desperackim naukowcom samodzielnie produkować publikacje. Rezultatem jest potop naukowego „śmiecia”, który zagraża zalaniem systemu publikowania, recenzowania, przyznawania grantów i całego współczesnego systemu badawczego.