SECCIONES

___ Interés General
___ del Estudiante
___ Futuros Contadores
___ Economía
___ Management
___ Marketing
___ Recursos Humanos
___ Espectáculos
___ Informática
___ Turismo
___ Reflexiones
___Números Anteriores
___Humor
SERVICIOS
____Trueque
Deportes
Efemérides
Fútbol Europa
Ciencia al Día
Economía
Ciencia
Enfoque
Vía Libre
Semana en América Lat.
 


::  ENCUESTA

¿Estás estudiando la carrera de tus sueños?
Si. Es mi vocación y me facinan todas las materias.
Si. Aunque me aburren las materias.
No. Pero me ayuda a conseguir empleo.
No. Pero ya no quiero cambiarme.
     Resultados
 
 



  Accenture - Empleos Ciencias Económicas
Buscamos: Estudiantes o graduados universitarios de Adm. de Empresas, Contabilidad, Economía, Finanzas, RRHH. Nivel de inglés intermedio/avanzado. Se valorarán otros idiomas como Italiano, Alemán, Francés o Portugués. Te ofrecemos: Trabajos Desafiantes y Reales posibilidades de Crecimiento
Escribí palabra clave: Revista Facultades / Conocé nuestras oportunidades >

  Accenture - Empleos Ciencias Sociales
Buscamos: Estudiantes o graduados universitarios de Relaciones Laborales, Psicología, Comunicación Social. Nivel de inglés intermedio/avanzado. (Excluyente) Se valorarán otros idiomas como Italiano, Alemán, Francés o Portugués. Te ofrecemos: Trabajos Desafiantes y Reales posibilidades de Crecimiento
Escribí palabra clave: Revista Facultades / Conocé nuestras oportunidades >

banner regisoft
Cursos gratuitos de Formación Laboral

Fundación Ariel: Ciclos de Formación Laboral Más información
Claves para la búsqueda de empleo:
Inicios: 7 de septiembre y 19 de Octubre
Duración: 1 encuentro Arancel: Gratuito

Amia - Servicio de Empleo:
Más información
¿Cómo buscar empleo? - Club del Empleo - Cyber Empleo

Todos los Posgrados y MBAs de Argentina


Si estás interesado en realizar un Postgrado, MBA, Maestría o especialización y escuchar conferencias de destacados jóvenes empresarios, vení a Postgrados MBA Forum 2011 y encontrá la mejor oferta concentrada en un mismo lugar.

Si te registrás antes del 5 de octubre, es gratis!

 
 
Edición Nº 46

Data Mining: Descubriendo Potencial

¿Alguna vez has recibido un sobre por correo en tu casa, por el cual te ofrecen descuentos para determinadas compras? ¿Alguna vez te han llamado por teléfono para ofrecerte tal o cual producto? Si es así, entonces fuiste encontrado por el data mining…
Data Mining: Descubriendo Potencial

Ideas y Contenido Hugo Gustavo Peña.
Adaptación Pablo Guirín - Graduado en Licenciatura en Publicidad - pablo.guirin@facultades.info

Y ello es porque alguien usó una base de datos en la que estabas presente. Dos cosas pudieron haber sucedido: o te eligieron al azar (lo más ineficiente), o más probable, tu nombre surgió de algún modelo de Data Mining que te clasificó como un target valioso con propensión a la compra.

Interpretar datos

El Data Mining es el resultado de un largo proceso de investigación y desarrollo. Esta evolución comenzó cuando los datos de negocios fueron almacenados por primera vez en computadoras, que gracias a su evolución ya no se limita a solo almacenarla sino también a procesar una inmensa cantidad de datos.

Las computadoras e Internet permitieron almacenar grandes bases de datos, donde hoy es más fácil que nunca reunir millones, incluso miles de millones de datos que luego pueden ser analizados sistemáticamente desde diferentes perspectivas y así convertir la información en algo útil para la toma de decisiones.

En definitiva es un proceso por el cual se intenta descubrir los "patrones, relaciones y reglas" de comportamiento escondidos en los datos,  que son propios de una industria o negocio.
Técnicamente, es un conjunto de sofisticados algoritmos que permiten procesar la información con determinados objetivos y presentarla de una manera usable para el Área de Marketing de la empresa.

La ventaja principal que aporta esta técnica es que sus objetivos primordiales son conocer los "patrones de comportamiento" de la clientela para poder accionar en consecuencia, con lo cual permitirá obtener mejor rentabilidad del negocio logrando que el cliente consuma más e incluso reducir costos. Esto se consigue, en muchos casos, realizando acciones directas y personalizadas sobre un conjunto específico de clientes (Marketing Directo) sin necesidad de recurrir a la comunicación masiva, reduciendo de esta manera los costos de marketing.

"sus objetivos primordiales son conocer los "patrones de comportamiento" de la clientela para poder accionar en consecuencia"

En general, las técnicas de Data Mining son utilizadas para dos importantes procesos: el "descubrimiento de conocimientos" (Knowledge Discovery) y la "predicción" (Forecasting). El primero provee información explícita que puede ser entendida por el usuario; el segundo provee conocimiento acerca del comportamiento de futuros eventos.
Hay que tener siempre bien presente que el Data Mining NO puede resolver las hipótesis de relaciones causa-efecto entre atributos. Esto está fuera del alcance de toda técnica estadística. Sin embargo hay otras que si puede:

  • Analista de Crédito o Banco: ¿Le concederemos el crédito a este cliente?

  • Gerente del supermercado: los clientes que compran cerveza ¿Qué más consumen?
  • Jefe de Área de Comercialización: ¿Cuántos aparatos de TV venderemos el mes próximo?
  • Director de RR.HH: ¿Cuál es el perfil de mis empleados?

Aplicaciones

Desarrollaremos, como ejemplo, el caso de una cadena de supermercados cuyo objetivo es conocer la propensión al abandono de sus consumidores. Para la empresa es muy importante poder anticiparse a la actitud de sus clientes que puedan dejar de consumir por razones de precio, calidad, servicio, competencia u otros motivos extras.

La razón de hacer foco en estos consumidores reside en que, en general, es más costosa (en valores monetarios) la adquisición de un nuevo cliente que mantener a uno que ya lo es. En consecuencia, es más "valioso" para la empresa el proceso de "retener" que de "adquirir" un cliente..

Definido así el objetivo final, el siguiente paso es tomar conocimiento de la historia del consumo de los clientes. Para ello, la empresa cuenta con la historia de los registros transaccionales almacenados en su base de datos, gracias al uso de las "tarjetas magnéticas" que la empresa provee a cada cliente que la solicita, generalmente a cambio de un programa de "puntos" que le permite al consumidor canjear dichos puntos por regalos. 

"En general, es más costosa (en valores monetarios) la adquisición de un nuevo cliente que mantener a uno que ya lo es"

Cada transacción se registra y se almacena en la base de datos. La transacción contiene la información de cuándo y cuales productos (debidamente codificados) se adquirieron, es decir: el "ticket" de compra.

Obviamente, por los movimientos de todas las sucursales de una cadena de supermercados se pueden llegar a registrar millones de transacciones mensuales. Esto impide, en principio, trabajar con semejantes cantidades. Una de las ventajas de las técnicas de Data Mining reside en que siempre es posible (bajo ciertos criterios estadísticos de muestreo) extraer "muestras" aleatorias y trabajar con ellas.

Con la información de la muestra transaccional de los clientes y de sus datos demográficos, se comienza por un estudio exploratorio y descriptivo de las variables. La "historia" transaccional de los clientes es objeto de estudio para tratar de obtener atributos que puedan "discriminar" comportamientos tendientes al abandono.

Para ello se define, por ejemplo, el estado de abandono: como aquel en el que un cliente deja de consumir por 3 meses consecutivos, luego de haber estado "activo" durante los 6 meses anteriores.  De esta manera se observa que los clientes propensos al abandono poseen un valor medio del monto de su consumo que va evolucionando "a la baja" mes a mes. Esto no sucede para los clientes que se mantienen activos. Por lo tanto, esto puede indicar que el monto gastado por el cliente es un muy buen indicador de la posibilidad de un abandono.

De la misma forma, la cantidad de tickets también resulta ser un indicador con buen poder de discriminación entre ambos estados (de abandono o actividad). Y así siguiendo, se estudia por ejemplo la fecha de última compra (recencia), intervalo temporal entre compras, y otros atributos (o combinaciones entre ellos).

Una vez individualizados los atributos probables que discriminen entre ambos estados, comienza el proceso de  la aplicación de las técnicas de Data Mining. En este caso debemos pensar en una que nos permita obtener un "score" numérico que  pueda ser asignado a cada cliente. Dado que el objetivo es determinar el status o no de abandono, y como éste está representado por una variable dicotómica (si ó no, 1 ó 0), se puede usar con gran robustez una de las dos técnicas más comunes en estos casos: Regresión Logística o Naive Bayes. En este caso que tratamos, cualquiera de las dos da resultados similares. El output de estas técnicas asigna a cada cliente la probabilidad de pertenecer al estado de abandono (o su complemento, al estado de actividad).

"Luego de la aceptación del modelo, su aplicación es inmediata y extensible a cada cliente de la base de datos"

Lo importante a resaltar, es que luego de la aceptación del modelo, su aplicación es inmediata y extensible a cada cliente de la base de datos. De esta forma los clientes quedan "clasificados" como probables "abandonadores" de acuerdo a las probabilidades asignadas por el modelo.

Segmentados los clientes, de los más valiosos a los menos, y conocido su "riesgo de abandono, el siguiente paso es dar esta información, adecuadamente presentada, al Área de Marketing, que en función de los objetivos fijados, serán quienes en definitiva elucubrarán las acciones y elaborarán las campañas adecuadas a fin de "retener" a aquellos clientes propensos al abandono. También pueden efectuar encuestas a fin de conocer el porqué de la decisión de abandonar y así poder accionar en consecuencia (tal vez mejorar el servicio, la calidad de los productos, etc.).

Una vez un gerente importante de Coca Cola dijo: "Sé que la mitad de nuestra inversión publicitaria es derrochada, el problema es que no se que mitad…". A través de esta declaración resulta más claro entender porque surgen técnicas como el data mining. Donde el esfuerzo se centra en el análisis de las conductas de los consumidores y predecir su comportamiento, de manera que cada acción de marketing represente una reducción en esa "mitad que tanto" derrochan las empresas. *

Hugo Gustavo Peña
 
Analista y Consultor Estadístico en proyectos de Data Mining  y  Knowledge Discovery,  en el Departamento de CRM (Customer Relationship Management) de Wunderman Argentina.
 
Responsable de:
" Auditoria y Análisis de Base de Datos transaccionales.
" Investigación y Desarrollo de Algorítmos para Scoring y otras Métricas en Data Mining.
" Data Mining para cross-sell y up-sell de productos.
" Data Mining para Predicción de Comportamiento de clientes/consumidores.

Con el manejo experto de técnicas de Data Mining, como:
" Logistic Regression, Cluster Analysis,
" Decision Trees, Factor Analysis, Market Basket (reglas de Asociación)
" Survival Analysis, Naive Bayes
" Temporal Series Analysis, Spectral Analysis
" y otras.

Con aplicación a clientes/consumidores de las siguientes empresas:
Ford Arg, Supermercados Disco, Jumbo, Easy; Gillette Arg.; Unilever; Procter & Gamble; YPF-Repsol; Unifon; LoJack; Nobleza Piccardo; Movistar (telefonia celular en Puerto Rico); Coca Cola; Dell Computers; Diario La Nación; y otras.

Comentarios


javier aguirre
26.06.2009
en el caso de las bases de datos que reportan morosidad como veraz por ejemplo ellos usan un numero que determina la credibilifdad de pago que la persona tiene(score), esto acccesorio e independientemente de la info que tengan, esta practica es discriminatoria e ilegal porque los bancos rechazan clientes solo por su score bajo, usando el sistema de US., la ley 25326 de Habeas Data, no es muy especifica respecto a esto salvo que nos remitamos al art. 43 CN., y la accion a seguir es el amparo.- (jazzmdp@netzero.com)
Daiana Levit
14.01.2009
Estimado Sr. Peña: Soy estudiante avanzada de la carrera de actuario y docente de Tecnología de la información. Me gustaría saber si es posible cotactarme con ud. para consultarle algunso aspectos relacionados con su práctica. Estaría gustosa de que me brinde algunos minutos de su tiempo.
Daiana Levit - dailevit@hotmail.com
Pablo
15.07.2008
Cara y Susana, Gracias por el comentario y si bien en parte tienen razón. En líneas generales el Data Mining no atenta contra la Ley 25.326 de Protección de datos Personales porque la ley no se refiere al Data Mining. Lo que la ley prohibe es la comercialización de la información sin el consentimiento correspondiente y su uso ?irresponsable?.
Por ejemplo, los bancos, al requerir información al cliente, se comprometen a su uso exclusivo. Sin embargo, el banco debe solicitar la autorización explícita al cliente para que el mismo le permita que le sea enviada información sobre comercialización de sus productos bancarios, ofertas, publicidad, etc.
La ley impide el uso irresponsable desde el punto de vista del marketing.
Por otro lado, es una práctica muy común que las empresas que poseen la información de sus clientes tercericen a consultoras los proyectos de Data Mining. Para ello, existen contratos de ?confidencialidad? que deben cumplirse, so pena de atentar contra la ley. Estos contratos de ?confidencialidad?, no solo involucran a la empresa que recibe los datos, sino también a nivel individual, es decir, al(los) profesional(es) responsable(s) de su manipulación.
Quien cuente con la información, la puede usar para cualquier proyecto de Data Mining (que no son nada más que técnicas estadísticas) siempre y cuando sus resultados no inflinjan de alguna manera los contratos de confidencialidad correspondientes; y quien reciba los resultados no debe utilizarlos de manera irresponsable desde el punto de vista del marketing.
Cara
13.07.2008
La ley 25326 de Habeas Data declara ILEGAL estas prácticas:
- el receptor no da CONSENTIMIENTO para la transferencia de datos de la base de datos original a un tercero.
- el receptor no da CONSENTIMIENTO que sus datos se usen para otro fin distinto al de la base de datos original.
- seguramente la nueva base de datos no figura inscripta en la Dirección Nacional de Protección de Datos Personales (es ilegal su fuente)
- la fuente de la que se obtienen las Bases de datos de seguro NO son PÚBLICAS.
- la nueva Base de Datos contiene datos sencibles (gustos, personalidad, etc), penado por la ley.

TODO ES ILEGAL!!
Susana
13.07.2008
Todo genial... pero la ley 25326 de Habeas Data PROHIBE y sanciona dichas prácticas, ya que normalmente el futuro cliente no dió CONSENTIMIENTO que sus datos se usen para una FINALIDAD distinta a la que tenía la Base de Datos original, como así también no consintió la TRANSFERENCIA DE DATOS a terceros. ES ILEGAL en ARGENTINA estas prácticas!