Biblioteka i aplikacja konsolowa usuwa widoczne i niewidoczne watermarki z obrazów generowanych przez AI, w tym SynthID z Gemini i metadane C2PA.
Źródło zdjęcia: GitHub
Deweloper opublikował na platformie GitHub narzędzie Remove-AI-Watermarks — bibliotekę i aplikację konsolową służącą do usuwania zarówno widocznych, jak i niewidocznych znaków wodnych z obrazów generowanych przez sztuczną inteligencję. Narzędzie obsługuje obrazy z Google Gemini, ChatGPT/DALL-E, Stable Diffusion, Adobe Firefly, Midjourney i innych modeli AI. Projekt jest dostępny na GitHubie i oferuje także bezpłatną wersję webową.
Google Gemini (wewnętrznie nazywany „Nano Banana”) dodaje widoczne logo w kształcie iskierek używając mieszania alfa według wzoru: watermarked = α × logo + (1 − α) × original. Narzędzie odwraca ten proces za pomocą znanej mapy alfa wyekstraktowanej z outputu Gemini na czarnym tle.
Trzyetapowy detektor NCC (Normalized Cross-Correlation) dynamicznie znajduje pozycję i skalę watermarku, co pozwala na działanie nawet gdy obraz został przeskalowany lub przycięty. Po usunięciu znak, pozostałe artefakty są czyszczone przez inpainting z maską gradientu. Proces zajmuje około 0,05 sekundy na obraz i nie wymaga GPU.
Google osadza SynthID w każdym obrazie generowanym przez Gemini. Inne serwisy używają StableSignature, TreeRing i podobnych schematów. Te niezauważalne wzory w domenie częstotliwości przetrwają kadrowanie, skalowanie i kompresję JPEG.
Pipeline usuwania (domyślny profil SDXL) działa następująco: obraz jest skalowany do ~1024px, kodowany do przestrzeni latentnej (VAE), poddawany kontrolowanemu szumowi (forward diffusion), odszumiany (reverse diffusion, ~50 kroków przy sile 0.05), dekodowany z powrotem do pikseli i przeskalowany do oryginalnej rozdzielczości.
Narzędzie oferuje funkcję „Analog Humanizer” dodającą ziarno filmowe i aberrację chromatyczną, co sprawia, że output jest nie do odróżnienia od zdjęcia ekranu i oszukuje klasyfikatory obrazów AI. System „Smart Face Protection” używa YOLO do wykrywania ludzi w obrazie i wyodrębniania ich przed dyfuzją, a następnie miesza oryginalne twarze z powrotem używając miękkiej eliptycznej maski.
W zakresie metadanych, cleaner usuwa tagi EXIF (prompt, seed, hash modelu), XMP DigitalSourceType używany przez Instagram, Facebook i X do wyświetlania etykiet „Made with AI”, PNG text chunks z ComfyUI i AUTOMATIC1111 oraz manifesty C2PA Content Credentials z Google Imagen, OpenAI DALL-E i Adobe Firefly.
Narzędzie można zainstalować jako izolowaną aplikację CLI używając pipx lub uv, bez konieczności zarządzania wirtualnymi środowiskami. Podstawowa instalacja pokrywa usuwanie widocznych watermarków i metadanych, podczas gdy do usuwania niewidocznych znaków wodnych wymagane są dodatkowe zależności GPU.

Naukowcy opisują system przetwarzający tysiące dokumentów na godzinę, odkrywając że OCR, nie LLM, jest głównym wąskim gardłem wydajności.

UC Berkeley Law zakazuje używania AI w pracach studenckich od lata 2026. Dozwolone tylko wyszukiwanie prawne, za które studenci ponoszą pełną odpowiedzialność.

OpenAI przełamuje granice automatycznego rozumowania, rozwiązując problem matematyczny nierozwiązany od 1946 roku dzięki teorii liczb.