Uso de Explicar para identificar los segmentos más significativos de los registros de su juego de datos

En Oracle Analytics, haga clic con el botón derecho en una columna de destino del juego de datos, seleccione Explicar y, a continuación, seleccione Segmentos. En cuestión de segundos, podrá ver una lista de segmentos, cada uno de ellos representado como una única barra en el gráfico de barras superior.

Los segmentos son grupos de registros del juego de datos que el algoritmo de Explicar ha identificado como que tienen valores diferentes a la media general del juego de datos para la columna de destino. Los resultados detallados difieren para las medidas y los atributos.

Si explica una columna de medida

Para las medidas, el algoritmo de segmentación de Explicar busca grupos de registros en el juego de datos para los que el valor medio es significativamente diferente del valor medio del juego de datos completo. Por ejemplo, si la medida objetivo es Edad y la edad media del juego de datos completo es 23, un segmento podría ser un grupo de registros en los datos en los que la edad sea 55, significativamente mayor que la media del juego de datos completo. Un segmento único se define mediante unos pocos filtros en el juego de datos que identifican un grupo de registros con un valor medio inusual para la columna que se está explicando. Por ejemplo, los filtros podrían ser Ciudad y Tipo de trabajo.
A continuación se muestra la descripción de GUID-83744C61-9978-4F83-9E38-9EF06C7A8061-default.png
.png

El gráfico de barras verticales situado en la parte superior indica el tamaño de cada segmento en el número de registros (altura de la barra), mientras que la densidad de color indica cuánto se aleja el valor medio del segmento del valor medio del juego de datos completo.

Los gráficos de viñetas situados en la parte inferior del panel representan cada uno un único segmento en detalle. Las descripciones indican el valor medio de medida de un segmento (la medida objetivo), el número total de registros de un segmento y los criterios que definen un segmento. En el gráfico, el tamaño de burbuja representa el número de registros del segmento, mientras que el color y la posición en el eje x representan cuánto se aleja el valor medio del segmento del valor medio del juego de datos completo (línea de puntos). Puede pasar el cursor por encima del gráfico para ver la pista que muestra estos detalles. También puede ajustar la ordenación de todos estos segmentos, o puede mostrar la lista de segmentos detallados como una tabla editando el tipo de visualización u ordenación de panel en la parte superior derecha del panel.

Si está interesado en un segmento, haga clic en él para agregarlo al lienzo del libro de trabajo. Al agregar un segmento a un lienzo del libro de trabajo:

  • Se crea una visualización de tabla con el recuento de filas dentro del segmento y fuera del segmento.
  • Se crea un cálculo personalizado que define Dentro o Fuera del segmento, el cual se puede utilizar para agregar cualquier medida en el juego de datos según estos criterios. Este objeto también se puede utilizar como un potente filtro para el lienzo, que muestra la comparación de los registros dentro del segmento con los que están fuera de este.

Si explica una columna de atributo

Si el destino es un atributo, en los datos globales cada valor distinto de ese atributo recopila una proporción determinada de registros. Por ejemplo, una columna con dos valores, Sí o No, podría tener un 20 % de Sí y un 80 % de No. El algoritmo del segmento identifica grupos de registros en los datos para los que estas proporciones varían de forma significativa en relación con la distribución media. Por ejemplo, el Segmento 1 podría ser un grupo de registros de los datos en los que Yes fuera el 55 % (en lugar del 20 % para el juego de datos completo), y No fuera el 45 %(en lugar del 80 % para el juego de datos completo). Un segmento único se define mediante unos pocos filtros en el juego de datos que identifican un grupo de registros con una distribución inusual para la columna que se está explicando. Por ejemplo, el Segmento 1 se podría definir como todos los registros de una ciudad determinada y con un valor de edad determinado.
A continuación se muestra la descripción de GUID-30051023-F52C-49D3-8324-47C12A219B9A-default.png
.png

Explicar explora los datos e identifica muchos segmentos diferentes. Estos no son acumulativos, es decir, es posible que un registro determinado pertenezca a dos segmentos distintos. El gráfico de barras verticales situado en la parte superior indica el tamaño de cada segmento en los registros (altura de la barra), mientras que el color de la barra indica el valor de miembro que se analiza. Puede filtrar valores de miembro específicos haciendo clic en el hiperenlace del texto en la parte superior de la página.

Los gráficos de barras horizontales situados en la parte inferior del panel representan cada uno un único segmento en detalle. Las descripciones indican el valor de miembro (por ejemplo, Sí o No) que se analiza, el número total de registros de ese segmento y los criterios que definen el segmento. El gráfico representa la proporción de este valor en el segmento (zona de color) en comparación con la proporción media para el juego de datos completo (línea de puntos). Puede pasar el cursor por encima del gráfico para ver la pista que muestra esta información con más detalle. También puede ordenar los segmentos y cambiar cómo se muestran editando el tipo de visualización u ordenación de panel en la parte superior derecha del panel.

Si está interesado en un segmento, haga clic en él para agregarlo al lienzo del libro de trabajo. Al agregar un segmento a un lienzo del libro de trabajo:

  • Se crea una visualización de tabla con el recuento de filas dentro del segmento y fuera del segmento.
  • Se crea un cálculo personalizado que define Dentro o Fuera del segmento, el cual se puede utilizar para agregar cualquier medida en el juego de datos según estos criterios. Este objeto también se puede utilizar como un potente filtro para el lienzo, que muestra la comparación de los registros dentro del segmento con los que están fuera de este.