Todo comenzó cuando estábamos buscando una idea para el proyecto de título del magíster en Inteligencia Artificial Generativa. No se nos ocurría nada concreto, y al mismo tiempo, nos costaba mantenernos al día con las noticias de ciberseguridad en distintos sitios. Dado lo rápido que se mueve el rubro, necesitábamos una forma eficiente de mantenernos actualizados. Así nació la idea.
Para explicar mejor, dividí esto en dos partes: el
pipeline de noticias (cómo obtenemos y procesamos la información) y el
sitio web productivo (lo que ve el público).
Primera versión del sistema de noticias
Creamos un prototipo que recolectaba feeds RSS de distintas fuentes. Los artículos eran resumidos por IA, en inglés y en español. El resultado fue mejor de lo esperado: los resúmenes eran fáciles de leer y enlazaban a la fuente original.
Primer problema
Pensamos en liberar el sitio al público, pero investigamos las licencias de los RSS y solo dos fuentes permitían uso comercial. Como planeamos monetizar con publicidad, la mayoría no era utilizable legalmente.
Segunda versión del sistema de noticias
Intentamos generar nuestros propios artículos investigando sobre los temas que aparecían en los RSS, para evitar problemas de licencia.
Nuevo problema
La información en los RSS era muy escasa y no siempre se encontraba contenido suficiente. El sistema generaba muy pocas noticias y fue descartado.
Tercera versión del pipeline de noticias
Consultamos a la IA sobre cómo obtener noticias mediante palabras clave. Creamos 18 categorías de noticias. Tras muchos ajustes, logramos un pipeline funcional que agrupa, filtra y evita duplicados.
Primera versión del sitio productivo
Usamos Google News como fuente por su alta capacidad de búsqueda.
Problemas:
1. Todas las URLs venían de Google.
2. Se necesitaba usar headless Chrome para acceder.
3. El contenido era HTML y difícil de procesar.
4. El sistema era lento y exigente en recursos.
Segunda versión del sitio productivo
Evaluamos varios servicios de agregación de noticias. Finalmente contratamos uno asequible que entregaba entre 10 y 20 noticias diarias. Pero al optimizar el sistema, la cifra bajó a 2–5, por lo que sumamos una segunda fuente, logrando 15 a 35 noticias por día.
Faltaba algo:
imágenes. Así que decidimos agregarlas.
Tercera versión del sitio productivo
Compramos acceso a un generador de imágenes AI económico. Al principio eran clichés (capuchas, candados), pero mejoramos los prompts y obtuvimos imágenes más creativas.
Recortamos y convertimos las imágenes a formatos web livianos. Generamos dos versiones por noticia: una para celular y otra para escritorio.
Actualización del pipeline
Se modificó el pipeline para generar imágenes automáticamente cada día.
Cuarta versión del sitio productivo
Tradujimos el sitio completo al portugués brasileño. En dos días, teníamos casi 700 artículos traducidos por solo
1 dólar. Ahora planeamos expandir a más idiomas.
Quinta versión del sitio productivo
Estamos preparando soporte multilenguaje. Queremos lanzar el sitio en alemán, francés e italiano.
Sorpresas del sitio
Como la clasificación es automática, aparecen noticias inesperadas. Ejemplos: implicaciones de la obesidad en la ciberseguridad o riesgos de celulares baratos sin actualizaciones.
La IA descarta lo irrelevante antes de iniciar una investigación. Solo se publica lo que tiene potencial en ciberseguridad.