Saltar al contenido

    ¿Te enteraste? Nuevas funciones en Dataiku

    El día de hoy queremos conversar un poco más sobre las nuevas funcionalidades con las que Dataiku comenzó el año. 

    Junto con muchas mejoras en las capacidades existentes, esta actualización de producto ofrece características completamente nuevas para analistas de datos, científicos de datos e ingenieros y operadores de ML.   

    Para analistas de datos

    El conjunto de datos “Anti-Join ” 

    A veces, desea inspeccionar los registros que son inigualable en una operación de unión. Además de producir el conjunto de datos de salida que contiene los registros que cumplen con las condiciones de unión, la receta de unión ahora puede generar opcionalmente un conjunto de datos que devuelve las filas inigualables para un análisis más detallado. 

    Compartir y exportar vistas filtradas

    Al analizar interactivamente los datos aplicando filtros a un panel de control, puede ser útil exportar un subconjunto de datos o compartir una vista específica con el equipo. Para paneles, un nuevo botón “ Copiar a URL ” conserva los parámetros de filtro seleccionados en una URL que puedes enviar fácilmente a otros. Cuando hacen clic en el enlace, se conservarán todos los filtros para que puedan revisar las ideas del tablero exactamente en el mismo estado. También puedes exportar el tablero filtrado como un PDF.

    Lo mismo ocurre con los conjuntos de datos filtrados en la vista de exploración: simplemente diríjase al menú de acciones para descargar el subconjunto de datos o exporte la vista como otro conjunto de datos con los filtros conservados.

    Atajo a vistas previas visuales para imágenes y datos geoespaciales

    Cuando se trabaja con tipos de datos no tabulares, es útil inspeccionar visualmente los registros en un formato multimedia más interpretable. Después de todo, las rutas de archivo y las coordenadas geográficas pueden ser prácticas para el almacenamiento, pero una imagen vale más que mil palabras.

    Ahora puedes usar la conveniente Acción “ preview ” para obtener una vista previa de imágenes individuales o geolocalizaciones. Simplemente presione shift-v en una celda resaltada o use el menú del botón derecho y elija “ Vista previa ” para ver una ventana emergente de la imagen seleccionada o un mapa.

    Para científicos de datos

    Red neuronal profunda como algoritmo nativo

    la Red neuronal profunda es un nuevo algoritmo disponible en Dataiku AutoML para tareas de regresión y clasificación. Basado en la arquitectura de perceptrón multicapa ( MLP ), esta red neuronal profunda aprovecha las bibliotecas de última generación para un modelo robusto, eficiente y escalable.

    Example of a Multilayer Perceptron architecture, with 3 hidden layers of 4 neurons each

    La implementación de Dataiku ofrece:

    • Una arquitectura de búsqueda y un proceso de aprendizaje personalizable.
    • Técnicas de regularización para evitar el exceso de equipamiento.
    • Soporte de GPU para aceleración de entrenamiento.

    Una vez entrenado, se puede implementar, evaluar y calificar una red neuronal profunda como cualquier otro algoritmo.

    Vista y búsqueda a nivel de característica en la tienda de características

    La nueva vista de nivel de característica en el almacén de características de Dataiku facilita la búsqueda y exploración de características específicas que puede reutilizar en sus propios proyectos y modelos. Esta vista proporciona información adicional y contexto sobre la característica en sí y el grupo de características al que pertenece.

    Pronóstico de la serie de tiempo visual: evaluar más allá del horizonte de pronóstico

    Al realizar pronósticos de series de tiempo, el horizonte de pronóstico representa con qué frecuencia se deben generar nuevos pronósticos. El período de evaluación generalmente corresponde a la frecuencia con la que se espera que el modelo sea reentrenado.

    Si no planea volver a entrenar el modelo con tanta frecuencia como el horizonte de pronóstico, ahora puede especificar un período de evaluación más largo que el horizonte.

    Por ejemplo, supongamos que desarrolla un pronóstico de ventas de siete días que genera las ventas previstas para la próxima semana, pero sabe que no evaluará y volverá a entrenar el modelo con más frecuencia que una vez al mes. En este caso, puede especificar un período de evaluación de cuatro horizontes de largo para capturar y evaluar las métricas de rendimiento del modelo para todo el mes a través de múltiples ciclos de pronóstico.

    Para ingenieros y operadores de ML

    Registros de eventos listos para la evaluación

    El servidor de eventos Dataiku es una forma integrada para que los equipos capturen los registros de predicción de todos los modelos en los nodos API de Dataiku y los almacenen en una sola ubicación. Los registros de predicción se utilizan especialmente para monitorear el rendimiento del modelo utilizando recetas de evaluación y tiendas de evaluación de modelos.

    Con la actualización Dataiku 11.3, al evaluar la receta ahora puede procesar automáticamente esos registros de predicción. Esto elimina la necesidad de una receta de preparación previa y simplifica la configuración del monitoreo del modelo de producción.

    Detección de deriva de predicción sin verdad fundamental

    Cuando un modelo se implementa en producción, es prudente comenzar inmediatamente a monitorear para detectar cambios significativos en su comportamiento. Sin embargo, para muchos casos de uso, la verdad fundamental no está disponible o no está disponible lo suficientemente rápido como para proporcionar comentarios oportunos y métricas de rendimiento del modelo que alertan a los operadores de un modelo degradante.

    Incluso en ausencia de etiquetas de verdad básicas, aún puede aproveche el análisis de deriva de predicción en la tienda de evaluación de modelos de Dataiku solo con los registros de predicción. La tabla de fugacidad y el cuadro de densidad muestran las diferencias entre la distribución de predicción actual y la distribución de referencia desde cuándo se entrenó el modelo.

    Junto con el análisis de deriva de datos de entrada, que tampoco requiere la verdad fundamental, estas dos herramientas proporcionan información crítica y alerta temprana para los operadores de ML para que puedan mantener de manera proactiva los modelos vivos saludables.

    ¡INTENTELO USTED MISMO! Agende un recorrido para ver estas funcionalidades en acción

    Trabaje con datos claros y disponibles para cada decisión.

    Nuestro equipo les acompaña con entusiasmo, para acercarles al futuro que desean.

    andersen_consulting_popup_logo

    Nos enorgullece anunciar que Excibit de Centroamérica es ahora miembro de Andersen Consulting

    El registro para el evento ha terminado

    Déjenos su información para que le incluyamos en próximas invitaciones