Visión general de la clasificación de documentos y la extracción de valores clave

En Oracle Cloud Infrastructure (OCI), Document Understanding proporciona modelos de IA entrenados previamente que pueden extraer texto, tablas y otros datos clave de archivos de documentos. Realice la clasificación de documentos o la extracción de valores clave en un documento y, a continuación, utilice esos datos extraídos como parte de su análisis en Oracle Analytics.

Document Understanding también le permite crear modelos personalizados para la extracción de valores clave y la clasificación de documentos.

En Oracle Analytics, utilice los flujos de datos para aplicar los modelos de IA de Document Understanding en sus datos.

Oracle Analytics soporta varios modelos de IA personalizados y previamente entrenados disponibles en Document Understanding:
  • Modelos previamente entrenados soportados en Oracle Analytics
    • Clasificación de documentos
    • Extracción de valores clave (de recibos, facturas, permisos de conducir y pasaportes)
  • Modelos personalizados soportados en Oracle Analytics
    • Clasificación de documentos personalizados
    • Extracción de valores clave personalizados

Debe crear y configurar modelos personalizados en OCI Console para poder utilizarlos en Oracle Analytics. Primero, utilice OCI Data Labeling para crear un buen juego de datos que pueda utilizar para entrenar el modelo y, a continuación, cree el modelo personalizado. Consulte OCI Document Understanding: Modelos personalizados.

Ejemplo de salida de un modelo de clasificación de documentos

En este ejemplo, un flujo de datos aplica un modelo de clasificación de documentos previamente entrenado a documentos con formato JPG para predecir si son recibos, y genera los resultados del análisis en un juego de datos. El juego de datos incluye el valor RECEIPT para "Tipo de documento", y el nivel de predicción "Confianza" para cada documento.


A continuación se muestra la descripción de GUID-D4540502-D2A4-43CB-B023-E9F27C43579E-default.png
.png

Antes de empezar: