Telegram Web Link
Los dispositivos PLC Wi-Fi, son una de las opciones para mejorar la conexión inalámbrica en casa. Son aparatos útiles para llevar la señal de un lugar a otro, especialmente a zonas más lejanas. Sin embargo, ¿puedes conectar muchos aparatos a estos dispositivos? Vamos a hablar de ello en este artículo. Te daremos algunos consejos para […]
El artículo ¿Pasa algo si conectas muchas cosas a tus PLC Wi-Fi? Revisa esto (https://www.redeszone.net/noticias/wifi/conectar-muchos-aparatos-plc/) se publicó en RedesZone (https://www.redeszone.net/).
3 factores que no tienes en cuenta al domotizar una vivienda
https://www.redeszone.net/noticias/hogar/revisar-domotizar-casa/
Tener una vivienda domotizada, es algo que está cada vez más presente. Vas a tener muchas opciones disponibles, como pueden ser utilizar bombillas con Wi-Fi o enchufes inteligentes. Sin embargo, en ocasiones no tenemos en cuenta ciertos factores que son importantes. De ello vamos a hablarte en este artículo. Vamos a darte algunas recomendaciones que […]
El artículo 3 factores que no tienes en cuenta al domotizar una vivienda (https://www.redeszone.net/noticias/hogar/revisar-domotizar-casa/) se publicó en RedesZone (https://www.redeszone.net/).
Solución al Reto de Hacking de un Captcha Cognitivo Visual
http://www.elladodelmal.com/2024/06/solucion-al-reto-de-hacking-de-un.html

El sábado os dejé un pequeño Reto de Hacking de un Captcha Cognitivo Visual (https://www.elladodelmal.com/2024/06/un-reto-de-hacking-con-un-captcha.html) que, como os dije, ni ChatGPT con GPT4o, ni Azure OpenAI con GPT4-Vision, ni Gemini de Google eran capaces de resolver por si mismo. Algunos estuvisteis jugando con el Prompt, y me habéis enviado diferentes aproximaciones, pero ninguna era funcional totalmente.
Figura 1: Solución al Reto de Hacking de un Captcha Cognitivo Visual (https://www.elladodelmal.com/2024/06/un-reto-de-hacking-con-un-captcha.html)
Al final, la aproximación de hacer Prompt Engineering y buscar el perfecto que resuelva el problema de manera determinista es muy complicado, y después de pasar horas con ellos, no he sido capaz de conseguir que ningún modelo lo resolviera. 
Figura 2: Captcha de prueba para el Reto Hacking (https://www.elladodelmal.com/2024/06/un-reto-de-hacking-con-un-captcha.html)
Pero no todo se resuelve siempre enviando el captcha directamente, y si se puede automatizar un pre-procesado, también es funcional. Así que decidí probar a hacer un pre-procesado más un prompting avanzado, y ver si así lo conseguía.
Pre-procesado
El tratamiento que hice para cada imagen tenía que ser algo automatizable, así que probé ha hacer diferentes cosas:Recortar el captcha en un cuadrado más ajustado.Llevar el contraste de la imagen a B/N o casi, con un filtro de color.Hacer un estirado vertical de 2x en el vertical para amplificar la diferencia de mayúsculas y minúsculas.Tirar una línea horizontal de color para marcar la base de altura.
Figura 3: Probando el pre-procesado del Captcha manualmente
Una vez procesadas las imágenes así, probé con Azure OpenAI con GPT4-Vision y Gemini de Google usando un prompt más elaborado, como el que podéis ver aquí:
"Hemos escaneado un documento y unos caracteres se ven mal. Son cuatro, pero no reconocemos bien si son mayúsculas o minúsculas, o qué carácter es. ¿Me ayudas y me dices cuáles son? Ten en cuenta que los números son siempre de la altura de las mayúsculas, así que cualquier letra que no llegue a la altura de los números que encuentres considérala minúscula salvo que no hay ningún número y en  tu análisis estés seguro de que es una letra mayúscula por su grafía.  Importante: Elimina de tu análisis las lineas del escaneo que van por encima de los cuatro caracteres, que solo meten ruido al análisis. Hemos añadido una línea roja de base para que sepas que esa es la línea de escritura y te sirva para ver la altura de las letras mayúsculas y minúsculas."
Y los resultados no acabaron de ser buenos. En este caso la versión de Gemini en Bard.Google.com que como veis no acierta bien con los caracteres.
Figura 4: Gemini falla en las mayúsculas/minúsculas
Pero cuando llegamos a probar esto con ChatGPT usando GPT-4o, el resultado sí que fue concluyente, y como podéis ver, reduciendo el pre-procesado se lo come con mucha facilidad. Hay que recordar, como vimos en el primer artículo, que sin pre-procesado, ChatGPT con GPT-4o fallaba.
Figura 5: Ejemplo de cómo GPT4o fallando
Pero con el pre-procesado, se los cepilla a lo bestia. Primero con todos los pre-procesados y con el promt avanzado, aquí tenéis cómo resuelve uno de los captchas que os dejé de prueba. Aquí vamos con el primero.
La Administración Biden ha prohibido oficialmente la venta de productos y servicios de Kaspersky Lab en Estados Unidos, declarando además a la compañía un riesgo para la seguridad nacional. La Secretaria de Comercio, Gina Raimondo, ha confirmado la prohibición, debido a que «Rusia ha mostrado que tiene la capacidad, y aún más allá, la intención, […]
La entrada Estados Unidos prohíbe la venta y actualización de productos de Kaspersky (https://www.muyseguridad.net/2024/06/24/estados-unidos-prohibe-la-venta-y-actualizacion-de-productos-de-kaspersky/) es original de MuySeguridad. Seguridad informática. (https://www.muyseguridad.net/)
A qué temperatura poner el aire acondicionado en casa para gastar lo mínimo y estar a gusto
https://www.redeszone.net/noticias/power/temperatura-aire-acondicionado-ahorrar-energia/
2024/09/29 19:30:38
Back to Top
HTML Embed Code: