domingo, 24 de enero de 2010

EL ALCANCE DE DATA MINING

El nombre de “Data Mining” se debe a las similitudes de búsqueda de valiosa información en una etapa de un proceso llamado extracción de conocimiento en el ámbito empresarial (Knowledge Discovery in Databases) con la extracción en una mina de materiales; por ejemplo: en una mina de oro y plata, existen varios procesos para extraer esos metales, esta la extracción, el cribado, muestreo, la molienda, la cianuración, la flotación, la fundición y por último la refinería, como puedes ver hay varios pasos para lograr ponerte ese piercing de oro, lo mismo aplica para las bases de datos existen varios procesos por los que atraviesa la base de datos para lograr contar con datos altamente “refinados”.
En la extracción de oro así como en la extracción de información de una base de datos, se requieren examinar una inmensa cantidad de material, y hacerlo inteligentemente y con soporte de varios procesos metodologícos.

Hablando exclusivamente con el enfoque empresarial y de marketing, las bases de datos de suficiente tamaño y calidad, con la tecnología de Data Mining puede generar nuevas oportunidades de negocios al brindar las siguientes posibilidades:

• Predicción automatizada de tendencias y comportamientos. Data Mining automatiza el proceso de encontrar información predecible en grandes bases de datos. Preguntas que tradicionalmente requerían un intenso análisis manual, ahora pueden ser contestadas directa y rápidamente desde los datos.

Un típico ejemplo de problema predecible es el marketing apuntado a objetivos (targeted marketing). Data Mining usa datos en mailing promocionales anteriores para identificar posibles objetivos para maximizar los resultados de la inversión en futuros mailing. Otros problemas predecibles incluyen pronósticos de problemas financieros futuros y otras formas de incumplimiento, e identificar segmentos de población que probablemente respondan similarmente a eventos dados.

• Descubrimiento automatizado de modelos previamente desconocidos. Las herramientas de Data Mining barren las bases de datos e identifican modelos previamente escondidos en un sólo paso. Otros problemas de descubrimiento de modelos incluye detectar transacciones fraudulentas de tarjetas de créditos e identificar datos anormales que pueden representar errores de tipeado en la carga de datos.

Las técnicas de Data Mining pueden originar beneficios de automatización en las plataformas de hardware y software existentes y puede ser implementadas en sistemas nuevos a medida que las plataformas existentes se actualicen y nuevos productos sean desarrollados.

El concepto de Data Mining no es nuevo, desde los años sesenta los estadísticos fue usado por colegas estadísticos, con la idea de ubicar correlaciones sin previas hipotésis, a finales de los años ochenta sólo dos empresas lo utilizabab, en el 2009 es ofrecido por más de 200 empresas de Research del mundo.

6 comentarios:

  1. Acertada analogía, me imagino pasarán algunos años más para que sea incluido en los planes de estudio...

    ResponderEliminar
  2. Mauricio E. Fuentes26 de enero de 2010, 4:25

    ¿Dónde puedo encontrar un e-book acerca del tema pero en español?

    ResponderEliminar
  3. Héctor, algunas universidades en España (cataluña) cuentan en su pensum la especialización en Data Mining, ya que valoran la utilidad para los negocios y acercan a sus estudiantes principalmente de -investigación científica- a desarrollar el uso de esta valiosa herramienta.

    En muchos países, tenlo por seguro no le brindarán la importancia que merece hasta que hayan pasado varios años, sin embargo la mundialización de las empresas hará que se acelere.

    ResponderEliminar
  4. te recomiendo compres literatura sobre data mining en amazon.com ahí encontrarás muy pocas publicaciones en español pero existen, debes buscar como "minería de datos", en inglés hay más de 40 libros escritos donde explican paso a paso el desarrollo de DM.

    ResponderEliminar
  5. Cómo exactamente se realiza el data mining, cuál es el software que se utiliza?

    ResponderEliminar
  6. Antes se llamaba "clementine", ahora tras la reciente adquisición de spss por parte de IBM, se llama : "IBM SPSS Modeler".

    ResponderEliminar

Gracias por tus comentarios