Noticias

Conversión de PDF a SCORM mediante IA: retos y logros

20/12/2024
Juan Prieto

El desafío de convertir documentos PDF a SCORM se ha llevado al siguiente nivel gracias a la implementación de inteligencia artificial (IA). Este desarrollo se presenta como una solución eficiente y versátil, ideal para quienes necesitan transformar documentos en contenido interactivo, pudiendo respetar tanto el diseño original como adaptarlo a un diseño específico diferenciado.

Visión global: un proceso inteligente y flexible

La síntesis de documentos en formatos electrónicos tipo EPUB, SCORM o HTML desde PDF se realiza ya por múltiples sistemas de transformación respetando el aspecto visual original.

Sin embargo, adaptar un documento PDF con un diseño a un documento con otra estructura y otro nuevo diseño o layout es un reto por la falta de información sobre la estructura en el documento de partida.

Este punto cobra especial importancia en contenidos interactivos como HTML y SCORM, donde una buena organización mejora tanto la experiencia visual como la interactividad. Además, es clave que estos contenidos sean accesibles y responsivos, permitiendo una adaptación fluida a diferentes tamaños de pantalla y dispositivos.

La conversión de un PDF a otro formato con posiciones exactas es un proceso directo. En cambio, transformar un PDF ajustando las posiciones de los elementos y los flujos de lectura es una tarea que normalmente requiere un maquetador humano o diseñador. Ximdex la realiza utilizando técnicas de inteligencia artificial.

¿Cómo se hizo?

El problema a resolver es como maquetar el contenido de partida para adaptarlo a un nuevo formato electrónico con un flujo de lectura, diseño y estructura diferente al de partida.

Para resolverlo, usamos visión artificial que identifica elementos clave en la página, los separa del contenido principal y los coloca en los espacios adecuados del nuevo formato.

Al mismo tiempo, aplicamos tecnologías basadas en LLMs para analizar el texto, encontrar patrones y ajustarlo a una estructura de lectura coherente.

Entrenamiento del modelo de visión:

Se preparó un conjunto de datos de ejemplo con PDFs, donde se identificaron y etiquetaron manualmente elementos clave como acordeones, pop-ups, actividades, etc.

La imagen siguiente muestra cómo se realiza este etiquetado manual, que es un paso necesario antes de entrenar el sistema de reconocimiento visual.

Durante el entrenamiento, se evalúan métricas clave para medir qué tan bien el modelo detecta los elementos y los ajusta correctamente al nuevo diseño. Cuando los resultados superan el nivel esperado, el modelo está listo para usarse desde la Plataforma Ximdex.

Una vez entrenado el sistema, este puede procesar una página de un documento PDF y separar los elementos secundarios del texto principal. La ilustración siguiente muestra una página de un libro educativo, destacando los elementos que el sistema de visión artificial ha reconocido y el nivel de confianza asignado a cada uno.

¿Puedo usar ya XPUBLISH?

¡Rotundamente sí! XPUBLISH es un gran paso en la automatización de tareas complejas de conversión, como la adaptación de diseños de impresión al mundo digital. Disponible en la Plataforma Ximdex, este servicio transforma documentos PDF utilizando técnicas de visión artificial para identificar elementos secundarios como actividades, anotaciones o esquemas. Al finalizar el proceso, el contenido se convierte automáticamente a formatos como SCORM o EPUB, con un diseño accesible y adaptable para su visualización en cualquier dispositivo.