Multivariate Adaptive Regression Splines

 

El Statistica MAR Splines (multivariado de regresión adaptativa Splines) módulo se basa en una implementación completa de esta técnica, como se había propuesto por Friedman (1991; multivariado de regresión adaptativa Splines, Anales de Estadísticas, 19, un-ciento cuarenta y uno), en Statistica Data Miner, las opciones MARSplines tienen más ha mejorado para dar cabida a problemas de regresión y clasificación, con predictores continuas y categóricas.

C / C + +, C #, STATISTICA Visual Basic, la sintaxis basada en XML PMML generadores de código. La información contenida en el modelo puede ser rápidamente incorporado en sus propios programas personalizados a través de la opción C / C + + / C #, STATISTICA Visual Basic, o (XML, la sintaxis de base) PMML opciones generador de código.El programa, que en términos de su funcionalidad puede ser considerada una generalización y la modificación de regresión múltiple y de clasificación y regresión de los árboles (GC & RT), está diseñado específicamente (optimizado) para el procesamiento de conjuntos de datos muy grandes. Un gran número de opciones de los resultados y diagnósticos extendidos están disponibles para que usted pueda evaluar numéricamente y gráficamente la calidad de la solución MAR Splines.

Rapid Deployment of Predictive Models

 

El rápido despliegue de modelos de predicción del módulo le permite cargar uno o más PMML (Lenguaje de marcado de modelos predictivos) archivos con información de implementación, y para calcular muy rápidamente (en una sola pasada a través de los datos) las predicciones de un gran número de observaciones (de una o modelos más).

El rápido despliegue de opciones de modelos de predicción ofrecen el más rápido, los métodos más eficientes para el cálculo de predicciones de los modelos de formación completa.PMML puede generarse a partir de prácticamente todos los módulos para la minería de datos predictivos (así como el EM generalizado y k-medias opciones de análisis cluster). PMML es uno basado en XML (Extensible Markup Language) estándar de la industria conjunto de convenciones de sintaxis que está particularmente bien adaptado para permitir el intercambio.

Todos los modelos están pre-programados en forma genérica en un programa altamente optimizado compilado, el código PMML sólo provee los parámetros estimados, etc para los modelos de formación completa, para permitir el rápido despliegue de modelos de predicción del programa para calcular predicciones o clasificaciones previsto (o grupo asignaciones) en una sola pasada a través de los datos.

Statistica Neural Networks

 

Todo el poder de las Redes Neuronales para previsión, clasificación, series temporales, etc., en una herramienta única de utilización sencilla. Las Redes Neuronales posibilitan a los usuarios menos experimentados elegir la mejor red neuronal para sus datos. El SNN también permite controlar todo el proceso de construcción de la red neuronal.

Hacer frente a los problemas reales de Computación Neural

Uso de redes neuronales implica más que simplemente la alimentación de datos a una red neuronal.

STATISTICA automatizado Redes Neuronales (SANN) tiene la funcionalidad para ayudarle a través de las etapas de diseño críticos, incluyendo no sólo el estado de la técnica Arquitectura de Redes Neuronales y Algoritmos de formación, sino también nuevos enfoques innovadores para el diseño de arquitectura de red mediante el uso específico y significativo funciones de error que permiten la interpretación de los resultados de salida.

Por otra parte, los desarrolladores de software y los usuarios que experimentar con aplicaciones personalizadas apreciarán el hecho de que una vez que su prototipo experimentos se realicen mediante simple e intuitiva Statistica automatizado Neural Networks interfaz de usuario, análisis de redes neuronales pueden ser incorporados en aplicaciones personalizadas utilizando ya sea la biblioteca de la Statistica de las funciones COM que expone plenamente toda la funcionalidad del programa o mediante el uso de la C / C + + código generado por el programa de ayuda en el despliegue de redes con buena formación.

 

 


 

La entrada de datos

Statistica automatizado Redes Neuronales está totalmente integrado con el sistema Statistica , por lo que una gran selección de herramientas para la edición (la preparación) de datos para el análisis está disponible (transformaciones, las condiciones de selección de casos, herramientas de verificación de datos, etc.)

Al igual que todos los análisis Statistica, el programa puede ser «conectado» con bases de datos remotas a través de las herramientas para el procesamiento en el lugar de bases de datos, o puede estar vinculada a los datos activos para que los modelos son nueva formación o aplicada (por ejemplo, para calcular los valores pronosticados o clasificaciones ) automáticamente cada vez que el cambio de datos.

 

 


 

Los datos de escala y preparación de valor nominal

En general, los datos deben estar específicamente preparado para la entrada en las redes neuronales, y también es importante que la salida de la red pueden ser interpretados correctamente.

Statistica automatizado Redes Neuronales (SANN) incluye automatizado de datos de escala para ambas entradas y salidas, también hay recodificación automática de un valor nominal de las variables (por ejemplo, Sexo = (hombre, mujer)), entre ellos uno de codificación-N. SANN también tiene instalaciones para manejar los datos faltantes. Hay preparación de datos especiales y servicios de interpretación para su uso con series de tiempo. Un gran número de herramientas relevantes también se incluyen en Statistica.

Por problemas de clasificación, SANN asigna los casos a miembros de clase e interpreta los resultados de la red como probabilidades verdad. En combinación con la función especializada SANN activación Softmax y funciones de error transversal de entropía, esto apoya un enfoque basado en principios, probabilístico para la clasificación.

 

 


 

Selección de un modelo de red neuronal, redes neuronales Conjuntos

La gama de modelos de redes neuronales y el número de parámetros que deben ser decididas (incluyendo el tamaño de la red, y los parámetros de formación algoritmo de control) puede parecer desconcertante [la red de búsqueda automática (SNA) está disponible para buscar automáticamente a través de numerosas arquitecturas de red de diferentes complejidades , véase más adelante]. Statistica  automatizado Redes Neuronales (SANN) es compatible con las clases más importantes de las redes neuronales para el problema del mundo real de problemas, incluyendo:

* Perceptrones multicapa
* Función de base radial redes
* Self-Organizing mapas de características

La arquitectura de arriba puede ser utilizado para la regresión, clasificación, series de tiempo de regresión, series temporales, clasificación y análisis de conglomerados.

Además, apoya a las redes SNA conjunto formado por arbitraria (cuando significativa) combinaciones de los tipos de red antes mencionados. La combinación de redes para formar grupo predicciones son particularmente fáciles de usar en SANN, especialmente para los conjuntos de datos ruidosos o pequeño. SANN contiene numerosos servicios para ayudar en la selección de una arquitectura de red adecuada. Para la visualización de datos, SANN también puede mostrar diagramas de dispersión 3D y superficies de respuesta para ayudar al usuario a entender la red de «comportamiento». Naturalmente, puede utilizar la información de cualquiera de estas fuentes para nuevos análisis con otras herramientas de Statistica o para su inclusión en los informes, analyis más, o personalización.

SANN automáticamente conserva copias de las mejores redes que se encuentran a medida que experimente un problema, que puede ser recuperada en cualquier momento. La utilidad y validez predictiva de la red de forma automática puede ser evaluada mediante la inclusión de la prueba y las muestras de validación y evaluación del tamaño y eficiencia de la red, así como el costo de clasificación errónea.

Para un mejor rendimiento, Statistica automatizado Redes Neuronales apoya una serie de opciones de personalización de la red. Puede especificar una capa de salida lineal de las redes utilizadas en (pero no se limitan a) los problemas de regresión o funciones softmax de activación de la estimación de probabilidad en problemas de clasificación. funciones de error de la Cruz-entropía, basada en modelos de la teoría de la información, también se incluyen, y hay una amplia gama de funciones de activación especializados, incluyendo exponencial, hiperbólica tangente, sigmoide logística, y las funciones de seno, tanto para las neuronas ocultas y de salida.