Unwatermark — Deteccion y Eliminacion de Marcas de Agua con IA
Un pipeline de IA en capas que detecta y elimina marcas de agua incrustadas en imagenes, PDFs y presentaciones usando EasyOCR, Florence-2, Grounded SAM, Claude Vision e inpainting neuronal LaMa — con precision pixel-perfect.
Video Demostrativo
Capturas de Pantalla
1 / 6
El Desafio
Los decks de diapositivas y documentos exportados incrustan marcas de agua directamente en imagenes raster — no hay capa que borrar. NotebookLM, sitios de fotos stock y PDFs borrador producen archivos donde los pixeles de la marca de agua reemplazan el contenido original. La limpieza manual en Photoshop no escala para docenas de slides. La deteccion es dificil porque las marcas de agua van desde etiquetas de texto pequenas hasta logos semi-transparentes hasta overlays diagonales rotados. Y la eliminacion agresiva destruye el contenido circundante mientras la eliminacion conservadora deja restos visibles.
La Solución
Unwatermark resuelve un problema que ningun modelo de IA puede manejar solo: marcas de agua incrustadas donde los pixeles reemplazan el contenido original — no hay capa que borrar, no hay metadata que eliminar. La solucion es un pipeline de deteccion en capas que arranca barato y escala: EasyOCR atrapa marcas de agua de texto gratis, Florence-2 maneja deteccion visual, Grounded SAM produce mascaras binarias pixel-perfect, y Claude Vision sirve como respaldo para casos no estandar. La eliminacion la maneja LaMa inpainting neuronal, que reconstruye lo que estaba debajo de la marca de agua en vez de clonar o difuminar. El procesamiento multi-pasada atrapa marcas residuales en hasta 3 ciclos detectar-eliminar. La herramienta corre como app web en produccion y CLI, procesando exportaciones PPTX de 14 slides en menos de 60 segundos.
Destacados Tecnicos
- Deteccion en capas: EasyOCR → Florence-2 → Grounded SAM → Claude Vision → heuristico — cada nivel agrega costo solo cuando metodos mas baratos fallan
- Mascaras pixel-perfect de SAM aislan exactamente los pixeles de la marca de agua, previniendo dano colateral al contenido adyacente
- Inpainting neuronal LaMa reconstruye textura y contenido en vez de clonar o difuminar
- Pipeline multi-pasada con hasta 3 ciclos detectar-eliminar atrapa marcas visibles solo despues de la primera pasada
- Reutilizacion de baseline PPTX — primera deteccion exitosa en cualquier slide se cachea para slides subsecuentes
- Inferencia ML agnostica de proveedor via API Replicate con backends locales/Modal intercambiables
- Progreso streaming NDJSON para actualizaciones de UI en tiempo real durante el procesamiento
- Despliegue Docker sin estado en VPS Hetzner detras de Caddy con HTTPS
Resultados
- Exportaciones limpias de PPTX, PDF e imagenes de fuentes con marca de agua en menos de 60 segundos
- El inpainting neuronal produce resultados visualmente indistinguibles de originales sin marca de agua
- Pipeline consciente de costos — OCR gratuito maneja 70% de casos antes de que se necesiten modelos de vision costosos
- Mascaras pixel-perfect de SAM significan cero dano colateral al contenido que rodea la marca de agua
- Despliegue en produccion en unwatermark.cushlabs.ai sirviendo usuarios reales
- Exploracion practica de los limites de precision de IA — que funciona, que no, documentado honestamente
Puntos clave
Ideal para
- Creadores de contenido limpiando marcas de agua de NotebookLM, fotos stock y documentos borrador
- Educadores y presentadores que necesitan exportaciones limpias de slides de fuentes con marca de agua
- Cualquiera evaluando arquitectura de pipeline de IA en produccion con orquestacion de modelos consciente de costos
- Profesionales que necesitan procesamiento por lotes de imagenes, PDFs y archivos PowerPoint
No resuelve por completo
- Overlays semi-transparentes grandes cubriendo 50%+ de la imagen (el inpainting neuronal no puede reconstruir tanto contenido)
- Eliminacion de marcas de agua en video en tiempo real (esto procesa archivos estaticos)
- Eliminacion de marcas de agua invisibles/esteganograficas embebidas en dominio de frecuencia
Qué obtienes
- App web en produccion con upload drag-and-drop y progreso streaming en tiempo real
- CLI para procesamiento por lotes de imagenes, PDFs y archivos PPTX
- Pipeline de deteccion IA de 5 niveles con escalacion consciente de costos
- Inpainting neuronal LaMa para eliminacion sin artefactos
- Handlers especificos por formato para imagenes, PDFs y presentaciones PowerPoint
- Despliegue Docker con reverse proxy Caddy y HTTPS
Proyectos Relacionados
AI Voice Agent Platform
AI phone agents that answer calls, qualify leads, and book appointments — 24/7, under 500ms response
Converso AI — Bilingual AI Front Desk & Sales Assistant
Bilingual AI chatbot platform for service businesses — handles front desk and sales conversations 24/7
NY AI Chatbot
AI chatbot for a coaching business — turns website visitors into booked calls, replaced 4 roles
¿Tienes un desafío similar?
Hablemos sobre cómo una solución así podría funcionar para tu equipo. Llamada gratis, sin compromiso.
Agendar Llamada Gratis