20 maja 20264 min czytania

Remove-AI-Watermarks — narzędzie do usuwania znaków wodnych z obrazów AI

Biblioteka i aplikacja konsolowa usuwa widoczne i niewidoczne watermarki z obrazów generowanych przez AI, w tym SynthID z Gemini i metadane C2PA.

Źródło zdjęcia: GitHub

Deweloper opublikował na platformie GitHub narzędzie Remove-AI-Watermarks — bibliotekę i aplikację konsolową służącą do usuwania zarówno widocznych, jak i niewidocznych znaków wodnych z obrazów generowanych przez sztuczną inteligencję. Narzędzie obsługuje obrazy z Google Gemini, ChatGPT/DALL-E, Stable Diffusion, Adobe Firefly, Midjourney i innych modeli AI. Projekt jest dostępny na GitHubie i oferuje także bezpłatną wersję webową.

Kluczowe wnioski

Narzędzie usuwa widoczne znaki wodne (logo Gemini), niewidoczne watermarki (SynthID, StableSignature, TreeRing) oraz metadane AI w jednej komendzie.
Wykorzystuje zaawansowane techniki: odwrotne mieszanie alfa dla widocznych znaków, regenerację dyfuzyjną dla niewidocznych watermarków i usuwanie metadanych C2PA/EXIF.
Oferuje funkcję „Smart Face Protection” automatycznie wykrywającą i chroniącą ludzkie twarze przed zniekształceniem podczas procesu czyszczenia.
Obsługuje przetwarzanie wsadowe całych katalogów oraz zawiera system detekcji watermarków z oceną pewności w trzech etapach.
Domyślnie używa pipeline'u SDXL od maja 2026 roku, który skutecznie radzi sobie z SynthID v2 z Gemini 3 Pro.

Jak działa usuwanie znaków wodnych

Widoczne watermarki Gemini

Google Gemini (wewnętrznie nazywany „Nano Banana”) dodaje widoczne logo w kształcie iskierek używając mieszania alfa według wzoru: watermarked = α × logo + (1 − α) × original. Narzędzie odwraca ten proces za pomocą znanej mapy alfa wyekstraktowanej z outputu Gemini na czarnym tle.

Trzyetapowy detektor NCC (Normalized Cross-Correlation) dynamicznie znajduje pozycję i skalę watermarku, co pozwala na działanie nawet gdy obraz został przeskalowany lub przycięty. Po usunięciu znak, pozostałe artefakty są czyszczone przez inpainting z maską gradientu. Proces zajmuje około 0,05 sekundy na obraz i nie wymaga GPU.

Niewidoczne watermarki SynthID

Google osadza SynthID w każdym obrazie generowanym przez Gemini. Inne serwisy używają StableSignature, TreeRing i podobnych schematów. Te niezauważalne wzory w domenie częstotliwości przetrwają kadrowanie, skalowanie i kompresję JPEG.

Pipeline usuwania (domyślny profil SDXL) działa następująco: obraz jest skalowany do ~1024px, kodowany do przestrzeni latentnej (VAE), poddawany kontrolowanemu szumowi (forward diffusion), odszumiany (reverse diffusion, ~50 kroków przy sile 0.05), dekodowany z powrotem do pikseli i przeskalowany do oryginalnej rozdzielczości.

Funkcje dodatkowe i obsługiwane modele

Narzędzie oferuje funkcję „Analog Humanizer” dodającą ziarno filmowe i aberrację chromatyczną, co sprawia, że output jest nie do odróżnienia od zdjęcia ekranu i oszukuje klasyfikatory obrazów AI. System „Smart Face Protection” używa YOLO do wykrywania ludzi w obrazie i wyodrębniania ich przed dyfuzją, a następnie miesza oryginalne twarze z powrotem używając miękkiej eliptycznej maski.

W zakresie metadanych, cleaner usuwa tagi EXIF (prompt, seed, hash modelu), XMP DigitalSourceType używany przez Instagram, Facebook i X do wyświetlania etykiet „Made with AI”, PNG text chunks z ComfyUI i AUTOMATIC1111 oraz manifesty C2PA Content Credentials z Google Imagen, OpenAI DALL-E i Adobe Firefly.

Narzędzie można zainstalować jako izolowaną aplikację CLI używając pipx lub uv, bez konieczności zarządzania wirtualnymi środowiskami. Podstawowa instalacja pokrywa usuwanie widocznych watermarków i metadanych, podczas gdy do usuwania niewidocznych znaków wodnych wymagane są dodatkowe zależności GPU.

#Gemini #obróbka obrazów #DALL-E #watermarki #SynthID

Udostępnij

Źródła

Hacker News AI

Poprzedni

System AI pomylił nazwiska absolwentów podczas rozdania dyplomów w college'u

Następny

Google Beam wprowadza nowe funkcje dla lepszych spotkań hybrydowych

Podobne Publikacje

Narzędzia i Aplikacje

sqlite-utils 4.0 napisany głównie przez Claude Fable za 149 dolarów

Simon Willison wykorzystał Claude Fable do przygotowania stabilnej wersji biblioteki sqlite-utils 4.0, wydając 149 dolarów i znajdując krytyczne błędy.

4 min5 lipca

Modele AI

GPT-5.5 może mieć problem z tokenami rozumowania — clustering na 516 tokenach wpływa na wydajność

Model GPT-5.5 nieproporcjonalnie często kończy rozumowanie na dokładnie 516 tokenach, co może tłumaczyć gorsze wyniki w złożonych zadaniach programistycznych.

4 min5 lipca

Biznes i Rynek

OpenAI proponuje przekazanie 5% udziałów amerykańskiemu funduszowi państwowemu

Sam Altman zaproponował donację 5% udziałów OpenAI dla funduszu państwowego. Podobne kroki miałyby podjąć inne firmy AI w celu poprawy relacji z administracją.

3 min2 lipca

Kluczowe wnioski

Narzędzie usuwa widoczne znaki wodne (logo Gemini), niewidoczne watermarki (SynthID, StableSignature, TreeRing) oraz metadane AI w jednej komendzie.

Wykorzystuje zaawansowane techniki: odwrotne mieszanie alfa dla widocznych znaków, regenerację dyfuzyjną dla niewidocznych watermarków i usuwanie metadanych C2PA/EXIF.

Oferuje funkcję „Smart Face Protection” automatycznie wykrywającą i chroniącą ludzkie twarze przed zniekształceniem podczas procesu czyszczenia.

Obsługuje przetwarzanie wsadowe całych katalogów oraz zawiera system detekcji watermarków z oceną pewności w trzech etapach.

Domyślnie używa pipeline'u SDXL od maja 2026 roku, który skutecznie radzi sobie z SynthID v2 z Gemini 3 Pro.

Jak działa usuwanie znaków wodnych

Widoczne watermarki Gemini

Niewidoczne watermarki SynthID

Funkcje dodatkowe i obsługiwane modele