Data Mining

Se denomina data mining al proceso de extracción de información significativa de grandes bases de datos, información que revela inteligencia del negocio, a través de factores ocultos, tendencias y correlaciones para permitir al usuario realizar predicciones que resuelven problemas y proporcionan una ventajas competitivas.

Los métodos de investigación estadísticos tradicionales, aparte de obtener una descripción cuantitativa de un problema permiten confirmar ó rechazar una hipótesis determinada, la llamada H0, hipótesis que el investigador desea confirmar con cierto nivel de confianza y significación estadística. En data mining es posible obtener información sin tener ninguna hipótesis previa, podemos realizar análisis exploratorios sobre el conjuntos o nubes de datos.

Los metódos aplicados no privilegian variables específicas sino tratan el conjunto de datos como un todo y posteriormente se establecen direcciones de mayor significación al problema estudiado.  Uno de estos métodos básicos es el análisis en componentes principales ó regresión ortogonal, obviamente el data mining hace uso de todos los elementos que existen actualmente de modelamiento y análisis de datos multidimensionales.