PARTE 01 MÉTODOS Y M APLICACIONES DE DATOS PARTE 01 PARTE 02 MARCO DEL PROYECTO DE DATOS A N MÉTODOS Y APLICACIONES DE DATOS PARTE 02 U A MARCO DEL PROYECTO DE DATOS ANÁLISIS DE DATOS Y SERVICIOS L FINANCIEROS DIGITALES AGRADECIMIENTOS IFC y The Partnership for Financial Inclusion de Mastercard Foundation desean reconocer el generoso apoyo de las instituciones que participaron en los estudios de caso para este manual. Airtel Uganda, Commercial Bank of Africa, FINCA República Democrática del Congo, First Access, Juntos, Lenddo, MicroCred, M-Kopa, Safaricom, Tiaxa, Tigo Ghana, y Zoona. Este manual no hubiera sido posible sin la participación de estas instituciones. IFC y Mastercard Foundation desean dar un agradecimiento especial a los autores Dean Caire, Leonardo Camiciotti, Soren Heitmann, Susie Lonie, Christian Racca, Minakshi Ramji, y Qiuyan Xu, así como a los revisores y colaboradores: Sinja Buri, Tiphaine Crenn, Ruth Dueck-Mbeba, Nicolais Guevara, Joseck Mudiri, Riadh Naouar, Laura Pippinato, Max Roussinov, Anca Bogdana Rusu, Matthew Saal y Aksinya Sorokina. Por último, los autores desean extender un agradecimiento especial a Anna Koblanck y Lesley Denyes por su extenso apoyo editorial. Número ISBN: 978-0-620-76146-8 Primera Edición 2017 M A N U A ANÁLISIS DE DATOS Y SERVICIOS L FINANCIEROS DIGITALES vez más disponibles. El manual ofrece Parte 1: Métodos y Aplicaciones de Datos PRÓLOGO un resumen de los conceptos básicos Capítulo 1.1: Habla de la ciencia de datos e identifica las tendencias de uso en el en el contexto de Servicios Financieros mercado, y también ilustra una gama de Digitales y proporciona una visión aplicaciones prácticas y casos de proveedores general de los tipos de datos, fuentes y Este es el tercer manual sobre Servicios Financieros Digitales producido y publicado de Servicios Financieros Digitales que están metodologías, y herramientas utilizadas por The Partnership for Financial Inclusion, traduciendo sus propios datos o datos para derivar información a partir de datos. una iniciativa conjunta de IFC y Mastercard externos en información para sus negocios. También ofrece un marco guía de proyectos Capítulo 1.2: Describe cómo aplicar el Foundation para expandir las microfinanzas análisis de datos a Servicios Financieros y hacer avanzar los Servicios Financieros de datos para proveedores de SFD que deseen Digitales. El capítulo resume las técnicas Digitales en África Subsahariana. El primer aprovechar los insights de datos con el fin de utilizadas para obtener información sobre manual de la serie, Manual de Canales satisfacer mejor las necesidades de los clientes, el mercado a partir de datos y describe el de Distribución y Tecnología Alternativos, y mejorar las operaciones, los servicios y los papel que pueden desempeñar los datos ofrece una guía completa acerca de los productos. El manual se entiende como una en la mejora de la gestión operativa de los componentes de la tecnología financiera cartilla sobre datos y análisis de datos, y no Servicios Financieros Digitales. El capítulo digital, con especial atención en los presupone conocimiento previo de ninguno. incluye ejemplos de la vida real y estudios elementos básicos de hardware y software, Sin embargo, se espera que el lector entienda de caso de las lecciones aprendidas por para un despliegue exitoso. El segundo los Servicios Financieros Digitales, y esté los expertos en el campo. Finaliza con una Manual Servicios Financieros Digitales y familiarizado con los productos, la función descripción de cómo los expertos pueden Gestión de Riesgo, es una guía sobre los utilizar datos para desarrollar algoritmos de los corresponsales, aspectos de la gestión riesgos asociados al dinero electrónico y basados en los modelos de scoring operativa y el papel de la tecnología. El manual crediticio para la inclusión financiera. corresponsales bancarios, además ofrece está organizado de la siguiente manera: un marco para la gestión de dichos riesgos. El presente manual tiene el objetivo de Introducción: Presenta el manual y Parte 2: Marco del Proyecto de Datos proporcionar apoyo y orientación útil establece, a grandes rasgos, la plataforma Capítulo 2.1: Ofrece un marco para la sobre cómo aplicar la analítica de datos y las definiciones para Servicios Financieros implementación de proyectos de datos y una para expandir y mejorar la calidad de los Digitales y analítica de datos. guía paso a paso para resolver problemas servicios financieros. prácticos de negocios mediante la aplicación de este marco, para obtener valor de fuentes Este manual está diseñado para cualquier de datos existentes y potenciales. tipo de proveedor de servicios financieros que ofrezca o tenga la intención de tos Ap Capítulo 2.2: Proporciona un directorio de Da li ofrecer Servicios Financieros Digitales. e d dos de ca fuentes de datos y recursos tecnológicos, D to así como una lista de métricas de desempeño ci tos Los proveedores de Servicios Financieros y M ica on para evaluar proyectos de datos. También a é Digitales incluyen todo tipo de instituciones, ít es Anal tales como instituciones de microfinanzas, incluye un glosario que ofrece descripciones bancos, operadores de redes móviles, de los términos utilizados en esta guía y en la práctica de la industria. empresas de fintech y proveedores de Proy Ges cto servicios de pago. Los canales, productos Conclusiones: Incluye las lecciones y procesos habilitados por la tecnología aprendidas de los proyectos de datos a os ti ó n e generan datos muy valiosos sobre las la fecha, basadas en la experiencia de IFC d rs interacciones con los clientes; al mismo de e un cu Re en África subsahariana con el programa tiempo, se pueden habilitar vínculos con Da The Partnership for Financial Inclusion de tos fuentes de datos externos que están cada Mastercard Foundation. 4 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES Analítica de Datos y Métodos CONTENIDO PRÓLOGO 4 ACRÓNIMOS 7 RESUMEN EJECUTIVO 10 Aplicaciones de Datos INTRODUCCIÓN 14 PARTE 1: MÉTODOS Y APLICACIONES DE DATOS 16 Capítulo 1.1: Datos, Analíticas y Métodos................................................................................................................................. 16 Definición de Datos 16 Fuentes de Datos 19 Protección de Datos y Protección del Cliente 23 Gestión de un Proyecto de Datos  Ciencia de los Datos: Introducción 26 Métodos 29 Herramientas 32 Capítulo 1.2: Aplicaciones de Datos Para Proveedores de Servicios Financieros Digitales ........ 34 1.2.1 Analítica y Aplicaciones: Conocimiento de Mercado ​36 1.2.2 Analítica y Aplicaciones: Gestión de Operaciones y Desempeño 54 1.2.3 Analítica y Aplicaciones: Scoring crediticio 79 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 5 Recursos PARTE 2: MARCO DEL PROYECTO DE DATOS 100 Capítulo 2.1: Gestión de un Proyecto de Datos...............................................................................................................100 El Data Ring​ 100 Estructuras y Diseño 102 OBJETIVO (S) 104 Cuadrante 1: HERRAMIENTAS 107 Cuadrante 2: HABILIDADES 112 Cuadrante 3: PROCESO 117 Cuadrante 4: VALOR ​124 APLICACIÓN: Uso del Data Ring ​126 Capítulo 2.2 Recursos.............................................................................................................................................................................. 136 2.2.1 Resumen de las Clasificaciones de Casos de Uso Analíticos ​136 2.2.2 Directorio de Fuentes de Datos 137 2.2.3 Métricas para la Evaluación de Modelos de Datos 141 2.2.4 Data Ring y Data Ring Canvas 141 CONCLUSIONES Y LECCIONES APRENDIDAS 145 GLOSARIO ​149 BIOGRAFIAS DE LOS AUTORES ​156 6 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES ACRÓNIMOS IA Inteligencia Artificial ALA Anti Lavado de Activos API Interfaz de Programación de Aplicaciones ARPU Promedio de Ingresos por Usuario ATM Cajero Automático BI Inteligencia de Negocios CBA Banco Comercial de Africa CBS Sistema de Core Bancario CDA Canales de Distribución Alternativos CDO Chief Data Officer [Director de Datos] CDR Registros Detallados de Llamadas CFT Contra la Finaciación del Terrorismo CGAP Consultative Group to Assist the Poor COT Comisión Sobre Transacción Cross Industry Standard Process para la Minería CRISP-DM de Datos CRM Customer Relationship Management CSV Valores Separados por Comas BD Base de Datos ETL Extraer - Transformar - Cargar IF Institución Financiera FTC Comisión Federal de Comercio ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 7 MLG Modelo Lineal Generalizado GPS Sistema de Posicionamiento Global GSM Sistema Global para Comunicaciones Móviles Asociación del Sistema Global para las GSMA Comunicaciones Móviles TIC Tecnologías de Información y Comunicación ID Documento de Identificación IFC Corporación Financiera Internacional IMF Instituciones Microfinancieras PI Propiedad Intelectual TI Tecnología Informática JSON Notación de Objetos JavaScript KCB Banco Comercial de Kenya KPI Indicador Clave de Desempeño KRI Indicador Clave de Riesgo KYC Conozca a su Cliente MEL Monitoreo, Evaluación y Aprendizaje MiPyMe Micro, Pequeñas y Medianas Empresas MNO Operador de Telefonía Móvil NDA Acuerdo de Confidencialidad NPL Préstamos en Mora NU Naciones Unidas OLA Acuerdo de Nivel Operacional OPS Operaciones del Proyecto OTC Servicios Financieros en Mostrador P2P Persona a Persona 8 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES CeR Cartera en Riesgo PBAX Private Branch Automatic Exchange PIN Número de Identificación Personal PMV Producto Mínimo Viable PLN Procesamiento del Lenguaje Natural POS Punto de Venta PYME Pequeña y Mediana Empresa QA Garantía de Calidad RCT Prueba Aleatoria Controlada RDC República Democrática del Congo RFP Solicitud de Propuesta SFD Servicios Financieros Digitales SIG Sistema de Información Gerencial SIM Módulo de Identidad del Suscriptor SLA Acuerdo de Nivel de Servicio SMS Servicio de Mensajes Cortos SNA Análisis de Redes Sociales SOC Sistema de Originación de Créditos SQL Lenguaje de Consultas Estructuradas SVM Máquina de Vector de Soporte SVN Red de Vector de Soporte TCP Protocolo de Control de Transmisión TPS Transacciones por Segundo UE Unión Europea USSD Servicio Suplementario de Datos no Estructurados ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 9 Resumen Ejecutivo IFC apoya a las instituciones que buscan desarrollar Servicios Financieros Digitales para aumentar la inclusión financiera, y está dedicada a múltiples iniciativas en una gama de mercados a través de su portafolio de inversiones y proyectos de asesoría. Desde 2017, a través de su trabajo con The MasterCard Foundation y otros aliados, IFC trabaja con proveedores de SFD en África subsahariana en la expansión de la inclusión financiera a través de productos y servicios digitales. Las interacciones con clientes, así como la industria “Deje que el conjunto de datos en general en la región y más allá, han identificado la necesidad de una guía sobre cómo cambie su forma de pensar.” utilizar el campo emergente de la ciencia de datos para desatar el valor de la data que sale de – Hans Rosling estas implementaciones. A pesar que el análisis de datos ofrece a los proveedores de SFD la oportunidad de conocer a sus clientes a un nivel granular y utilizar estos conocimientos para ofrecer servicios de mayor calidad, muchos expertos aún no han implementado un enfoque sistemático orientado a los datos en sus operaciones y organizaciones. Hay algunos ejemplos que han recibido mucha atención por su éxito en ciertos mercados, como la incorporación de datos alternativos para evaluar el riesgo de crédito de nuevos tipos de clientes. Sin embargo, lo prometedor de los datos va más allá de una o dos aplicaciones en casos específicos. Las barreras comunes en la aplicación de la información o ideas proporcionadas por los datos en los SFD incluyen la falta de conocimiento, la falta de destreza y sentirse incómodos con un enfoque desconocido. Este manual busca proporcionar una perspectiva de la oportunidad de los datos para impulsar la inclusión financiera, junto con las medidas que los expertos pueden tomar para comenzar a adoptar un enfoque basado en datos en sus negocios y diseñar proyectos basados en datos para resolver problemas prácticos de negocio. En la última década, los Servicios Financieros Digitales han transformado la oferta al cliente y el modelo de negocio del sector financiero, especialmente en los países en desarrollo. Un gran número de personas de bajos ingresos, micro empresarios, pequeñas empresas y poblaciones rurales que antes no tenían acceso a servicios financieros formales, ahora están digitalmente bancarizados por medio de una serie de proveedores de servicios financieros antiguos y nuevos, incluyendo–proveedores no tradicionales tales como operadores telefónicos (MNOs en inglés) y fintechs emergentes. Esto ha mostrado un impacto en la calidad de vida, como se ilustra en Kenia, donde un estudio realizado por investigadores del Instituto de Tecnología de Massachusetts (MIT) ha demostrado que la introducción de servicios financieros tecnológicos puede ayudar a reducir la pobreza.1 1 Suri y Jack, ‘The Long Run Poverty and Gender Impacts of Mobile Money’, Science Vol. 354, Issue 6317 (2015): 1288-1292. 10 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES El estudio estima que desde 2008, el de teléfonos móviles en el mundo, de los pueden extraer de una gama cada vez más acceso a servicios de dinero electrónico cuales el 74 por ciento estaban en países amplia de fuentes: datos transaccionales, que permiten a los usuarios almacenar e en desarrollo.4 Se espera que el futuro sea registros de llamadas móviles, grabaciones intercambiar dinero, aumentó los niveles aún más rico en datos. A medida que los de call center, vinculaciones de clientes de consumo per cápita diario de 194.000 costos de los teléfonos inteligentes caen, y corresponsales, patrones de compra personas, o aproximadamente el dos por el acceso a Internet móvil aumentará del 44 de tiempo aire, información de buró de ciento de los hogares kenianos, sacándolos por ciento en 2015 al 60 por ciento en 2020. crédito, publicaciones en redes sociales y de esta manera de la extrema pobreza. En África subsahariana, se prevé que el uso datos geoespaciales. El impacto fue más destacado entre de teléfonos inteligentes aumentará del Estas fuentes emergentes de datos tienen los hogares encabezados por mujeres, 25% en 2015 al 50% de todas las conexiones la capacidad de impactar positivamente a menudo considerados particularmente en 2020.5 Los objetos cotidianos también en la inclusión financiera. La analítica marginados económicamente. Este es están cada vez más habilitados para puede mejorar los procesos de negocio un buen argumento para una inclusión enviar y recibir datos, conectándose y de las instituciones que sirven a hogares financiera más amplia y profunda en el comunicándose directamente entre sí de bajos ingresos al permitirles identificar África Subsahariana y otras economías y a través de la interfaz de usuario en y atraer a nuevos clientes de manera más emergentes. Los datos y el análisis de datos aplicaciones de teléfonos inteligentes, eficiente. Así, los datos pueden ayudar pueden ayudar a lograr esto. esto es conocido como el Internet de las a las instituciones financieras a vincular Cosas.6 Si bien este es principalmente un personas nuevas y previamente excluidas. Se estima que aproximadamente 2.5 fenómeno de los países desarrollados, También profundiza la inclusión financiera quintillones de bytes de datos se producen también hay ejemplos del mundo en ya que los clientes existentes aumentan cada día.2 Para hacerse una idea de esta desarrollo. En África oriental, por ejemplo, su uso de productos financieros. Al mismo cantidad, este volumen de datos llenaría hay dispositivos solares que producen tiempo, los encargados de la formulación aproximadamente 10 millones de discos información sobre el uso de la unidad y de políticas y otras partes interesadas Blu-ray. La mayoría de estos datos son los reembolsos de Servicios Financieros del sector público pueden ahora obtener jóvenes - el 90 por ciento de la data Digitales realizados por el propietario. una visión detallada de la inclusión existente en el mundo se creó en los Los datos se utilizan para realizar financiera examinando el acceso, el uso últimos dos años.3 La reciente revolución evaluaciones de crédito instantáneas y otras tendencias. Esta evidencia puede digital de datos se extiende tanto al mundo que, en última instancia, pueden impulsar desempeñar un papel en el desarrollo de en desarrollo como al mundo desarrollado. nuevos negocios. Para los proveedores de políticas y estrategias futuras para mejorar En 2016, había 7.8 billones de suscripciones Servicios Financieros Digitales, los datos se la inclusión financiera. 2 ‘The 4 Vs of Big Data’, IBM Big Data Hub, consultado el 3 de abril de 2017, https://www-01.ibm.com/software/data/bigdata/what-is-big-data.html 3 ‘The 4 Vs of Big Data’, IBM Big Data Hub, consultado el 3 de abril de 2017, https://www-01.ibm.com/software/data/bigdata/what-is-big-data.html 4 ‘The Mobile Economy 2017’, GSMA Intelligence 5 ‘Global Mobile Trends’, GSMA Intelligence 6 Internet of Things. In Wikipedia, La enciclopedia libre, consultada el 3 de abril de 2017, https://en.wikipedia.org/w/index.php?title=Internet_of_things&oldid=773435744 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 11 La mayor disponibilidad de datos presenta El uso de datos es relevante a lo largo en la automatización de los procesos y desafíos y oportunidades. El mayor desafío del ciclo de vida de un cliente para de la toma de decisiones, permitiendo que es cómo aprovechar su utilidad mientras obtener un entendimiento más profundo las instituciones se vuelvan escalables se garantiza la privacidad de las personas. de sus necesidades y preferencias. rápida y eficientemente. Aquí los datos Una gran proporción de nuevos datos A grandes rasgos existen tres aplicaciones, también juegan un papel importante en el disponibles se producen de forma pasiva para datos en Servicios Financieros monitoreo del desempeño y proporcionan como resultado de nuestras interacciones Digitales: desarrollar conocimiento de información sobre cómo se puede mejorar. con servicios digitales, tales como teléfonos mercado, mejorar la gestión operativa Por último, el uso extendido de Internet y móviles, búsquedas en Internet, compras y el scoring crediticio. Este manual hace teléfonos móviles son fuentes de nuevos en línea y transacciones almacenadas un extenso uso de estudios de caso para datos, lo que permite a los proveedores electrónicamente. Las características de demostrar el uso de analítica de datos para de Servicios Financieros Digitales hacer los individuos se pueden inferir a partir los profesionales. En particular, el universo una evaluación de riesgo más precisa de de los algoritmos complejos que hacen de datos está en constante expansión y personas previamente excluidas que no uso de estos datos, hecho posible debido las capacidades analíticas también están tienen historial financiero formal para a los avances en capacidad analítica. Así, mejorando con el aumento de la capacidad apoyar sus solicitudes de créditos. la privacidad se ve más comprometida por el tecnológica. Como tal, el potencial para el hecho de que los generadores primarios de uso de datos se extiende mucho más allá de El manual describe los pasos que los datos no son conscientes de los datos que las aplicaciones descritas en este manual. expertos pueden tomar para comprender están generando y las formas en que pueden los elementos esenciales necesarios para ser utilizados. Como tal, las empresas y El desarrollo de un conocimiento de diseñar un proyecto de datos y aplicarlo en los actores del sector público deben poner mercado basados en datos es clave sus propias instituciones. Se introducen dos en práctica salvaguardas adecuadas para para desarrollar un negocio orientado al herramientas para guiar a los directores de proteger la privacidad. Debe haber políticas cliente. Comprender los mercados y los proyectos por estos pasos: El Data Ring y y marcos legales claros tanto a nivel clientes a un nivel granular permitirá a los como complemento el Data Ring Canvas. nacional como internacional que protejan a expertos mejorar los servicios al cliente y El Data Ring es una lista de verificación visual, los productores de datos de los ataques de resolver sus necesidades más importantes, cuya forma circular centra el ‘corazón’ de los hackers y las exigencias de los gobiernos, liberando así el valor económico. cualquier proyecto de datos como una al tiempo que estimulan la innovación en el Un negocio orientado al cliente entiende meta estratégica de negocio. Se discute el uso de datos para mejorar los productos y sus necesidades y deseos, asegurando proceso de fijación de metas, seguido de servicios. Igualmente, a nivel institucional que los procesos internos y externos, las una descripción de las categorías de recursos deben establecerse políticas claras que iniciativas de marketing y la estrategia de básicos y estructuras de diseño necesarias regulen la aceptación y el rechazo de los producto, son el resultado de la ciencia de para implementar el proyecto. Estos usuarios para el uso de datos, extracción de datos que promueve la fidelidad del cliente. elementos incluyen recursos duros, tales datos, reutilización de datos por terceros, Desde la perspectiva de las operaciones, como la data misma, junto con herramientas la transferencia y la difusión. los datos desempeñan un papel importante de software, hardware de procesamiento y 12 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES almacenamiento; así como recursos suaves, posible aplicación en un proyecto de datos. una organización basada en los datos, con incluyendo habilidades, experiencia en el La base de datos tecnológica enlista las actividades competitivas impulsadas por tema y recursos humanos necesarios para herramientas esenciales en la industria los datos, es un viaje que requiere visión y la ejecución. Esta sección también describe de la ciencia de datos, y los productos compromiso a largo plazo. Puede requerir cómo se aplican estos recursos durante comerciales importantes para la gestión, cambios en la cultura organizacional la ejecución del proyecto para ajustar los análisis, visualización e informes de datos. y mejoras en las capacidades internas resultados y entregar el valor de acuerdo con También hay una lista de métricas para existentes. Es importante destacar que una estrategia de implementación definida. evaluar modelos de datos que serían las instituciones deben asegurar que los discutidos comúnmente por consultores procesos a través de los cuales se recopilan, La herramienta complementaria incorpora externos o proveedores de analítica. almacenan y analizan los datos respetan la estos elementos de diseño estructural en Se pueden descargar copias de las privacidad individual. un Canvas, un espacio donde los directores herramientas de Data Ring para referencia de proyectos pueden articular y diseñar Este manual tiene como objetivo brindar o uso. los recursos y definiciones clave de una orientación y apoyo útil a los proveedores manera organizada e interconectada. El manual hace uso extenso de estudios de SFD para ampliar la inclusión financiera Las herramientas ayudan a definir las de caso para ilustrar las experiencias de un y mejorar el desempeño institucional. La relaciones interconectadas entre las conjunto diverso de proveedores de SFD en ciencia de los datos ofrece una oportunidad estructuras de diseño del proyecto, la implementación de proyectos de datos única para que los proveedores de Servicios para ver visualmente cómo las piezas se dentro de sus organizaciones. Si bien estos Financieros Digitales conozcan a sus unen, para identificar dónde pueden existir expertos principalmente operan en África clientes, corresponsales y comerciantes, las brechas o donde los requisitos de recursos y están ofreciendo Servicios Financieros así como mejorar sus procesos internos necesitan un ajuste. El enfoque de Canvas Digitales a sus clientes en forma de dinero de operación y crédito, utilizando estos también sirve como una herramienta de electrónico o banca de corresponsales, conocimientos para ofrecer servicios de comunicación, proporcionando un esquema esto no quiere decir que el conocimiento mayor calidad. La ciencia de los datos de diseño de alto nivel en una hoja de proporcionado por los datos no pueda ser requiere que las empresas adopten papel que puede ser actualizada y discutida utilizado por cualquier tipo de Proveedor nuevas habilidades y maneras de pensar, durante la implementación del proyecto. de Servicios Financieros utilizando que pueden no ser familiares para ellos. Finalmente, se proporcionan tablas de diferentes modelos de negocio. Un común Sin embargo, estas habilidades son recursos. El directorio de datos enumera denominador visto en todos estos casos aceptables y permitirán a los expertos en fuentes prominentes de datos disponibles es que las instituciones pueden desarrollar Servicios Financieros Digitales optimizar para los expertos en Servicios Financieros sistemáticamente sus capacidades de datos tanto el desempeño institucional como la Digitales y una breve descripción de su a partir de pequeños pasos. Convertirse en inclusión financiera. ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 13 Introducción En los mercados emergentes, los individuos que antes no tenían acceso a servicios bancarios acceden cada vez más a servicios financieros formales a través de canales digitales. Se está aprovechando la capacidad de computación ubicua, la conectividad generalizada, el almacenamiento masivo de datos y las tecnologías analíticas avanzadas, para ofrecer productos y servicios financieros adaptados de manera más eficiente y más directa a una gama más amplia de clientes; en forma colectiva, estos productos y servicios se denominan Servicios Financieros Digitales. Los proveedores de SFD, es decir, las instituciones que apalancan SFD para proporcionar servicios financieros, abarcan un conjunto diverso de instituciones incluyendo Proveedores de Servicios Financieros tradicionales, tales como bancos e instituciones microfinancieras (IMF), así como Proveedores de Servicios Financieros emergentes como operadores telefónicos, fintechs y proveedores de servicios de pago. La data o datos son términos generales que se utilizan para describir cualquier información, hecho o estadística que se ha recopilado para cualquier tipo de análisis o para fines de referencia. Los datos existen en muchas formas, como números, imágenes, texto, audio y video. Tener acceso a datos es un activo competitivo. Sin embargo, no tiene sentido sin la capacidad de interpretarla y utilizarla para mejorar la orientación al cliente, impulsar las perspectivas del mercado y extraer valor económico. Las herramientas analíticas son las que ayudan a superar la brecha entre los datos y las ideas o insights en inglés. La ciencia de los datos es el término dado al análisis de los datos, que es un proceso creativo y exploratorio que toma prestadas destrezas de muchas disciplinas incluyendo negocios, estadística e informática. Se ha definido como un campo extenso y multidimensional que utiliza matemáticas, estadística y otras técnicas avanzadas para encontrar patrones y conocimientos significativos en los datos registrados.7 Las herramientas tradicionales de Inteligencia de Negocios (BI) han sido de naturaleza descriptiva, mientras que la analítica avanzada puede utilizar los datos existentes para predecir el comportamiento futuro del cliente. La naturaleza interdisciplinaria de la ciencia de los datos implica que cualquier proyecto de datos necesita ser realizado a través de un equipo que pueda apoyarse en múltiples habilidades. Requiere apoyo de la parte técnica. Sin embargo, también requiere la participación del equipo de negocios. Como ilustra el siguiente gráfico, la conversión de datos en un valor para las empresas y la inclusión financiera, es un todo 7 ‘Analytics: What is it and why it matters?’, SAS, consultado el 3 de abril de 2017, https://www.sas.com/en_za/insights/analytics/what-is-analytics.html 14 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES Analítica TOMA DE DECISIONES Datos Aplicaciones Figura 1: La Cadena de Valor de Datos un recorrido. Entender las fuentes de teléfonos inteligentes se extiende en los analizando y utilizando con fines específicos. datos y las herramientas analíticas es sólo mercados emergentes, los proveedores La privacidad de datos inadecuada puede una parte del proceso. Este proceso es de Servicios Financieros Digitales están resultar en robo de identidad y prácticas incompleto sin contextualizar los datos particularmente bien posicionados para irresponsables de préstamos. En el firmemente dentro de las realidades aprovechar los datos y la analítica con contexto del crédito digital, se requieren de negocios del proveedor de SFD. el fin de expandir su base de clientes y políticas para asegurar que la gente El proveedor adicionalmente debe integrar brindar un servicio de mayor calidad. entienda las implicaciones de los datos que los resultados del análisis en sus procesos La analítica de datos puede utilizarse están compartiendo con los proveedores de toma de decisiones. para un objetivo específico, como el score de SFD y para asegurar que tengan acceso crediticio, pero también se puede emplear a los mismos datos que el proveedor Para los proveedores de SFD, el análisis de manera más general para aumentar la puede consultar. Para poder desarrollar de datos presenta una oportunidad única. eficiencia operativa. Cualquiera que sea políticas, las partes interesadas, tales como Los proveedores de Servicios Financieros el objetivo, un proveedor de SFD basado proveedores, encargados de la formulación Digitales son particularmente activos en en los datos tiene la capacidad de actuar de políticas, reguladores y otros, tendrán mercados emergentes y atienden cada sobre la base de la evidencia, en lugar de la que reunirse para discutir las implicaciones vez más a clientes que pueden carecer observación anecdótica o reaccionando a de las inquietudes sobre la privacidad, de historias financieras formales tales lo que los competidores están haciendo en las posibles soluciones y el camino a seguir. como registros crediticios. Atender el mercado. Para los que están en el sector de la inclusión a estos nuevos mercados puede ser financiera, los proveedores pueden educar especialmente desafiante. Descubrir las Al mismo tiempo, es importante plantear proactivamente a los clientes sobre cómo preferencias y niveles de conocimiento la cuestión de la protección de los se recopila la información y cómo usarla, de los nuevos tipos de clientes puede consumidores y la privacidad, ya que los y se comprometen a sólo recoger los datos tomar más tiempo y esfuerzo. A medida productores primarios de datos a menudo que sean necesarios sin compartir esta que el uso de la tecnología digital y los no saben que los datos se está recopilando, información con terceros. ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 15 Da tos Ap li PARTE 1 e d dos to de ca D Métodos y Aplicaciones de Datos ci tos y M ica on a é ít es Capítulo 1.1: Anal Datos, Analíticas y Métodos Proy Ges cto os ti ó n e d rs de e un cu Da Re La creciente complejidad y variedad de datos que se están produciendo t o s  ha llevado al desarrollo de nuevas herramientas analíticas y métodos para explotar estos datos con el fin de obtener información importante -insights-. La intersección de datos y su conjunto de herramientas analíticas recae ampliamente en el campo emergente de la ciencia de los datos. Para los Proveedores de Servicios Financieros Digitales que buscan aplicar enfoques basados en datos a sus operaciones, esta sección brinda los antecedentes para identificar los recursos e interpretar las oportunidades operacionales desde el punto de vista de los datos, el método científico y el conjunto de herramientas analíticas. Definición de Datos Los datos son muestras de la realidad, registrados como mediciones y almacenados como valores. La forma en que se clasifican los datos, su formato, estructura y fuente determinan qué tipos de herramientas pueden utilizarse para analizarlos. Los datos pueden ser cuantitativos o cualitativos. Los datos cuantitativos generalmente son bits de información que pueden medirse objetivamente, por ejemplo, los registros transaccionales. Los datos cualitativos son bits de información sobre las cualidades y generalmente son más subjetivos. Las fuentes comunes de datos cualitativos son las entrevistas, observaciones u opiniones, y estos tipos de datos se utilizan a menudo para juzgar el sentimiento o el comportamiento del cliente. Los datos también se clasifica según su formato. En el sentido más básico, esto describe la naturaleza de los datos; número, imagen, texto, voz o biométricos, por ejemplo. La digitalización de los datos es el proceso que consiste en tomar estos bits de realidad observada o medida, y representarlos con números que las computadoras entiendan. El formato de datos digitalizados describe la forma en la que se codifica digitalmente una cierta medición. Hay muchas maneras de codificar la información, pero cualquier parte de la información digitalizada convierte las cosas en números que pueden proporcionar un análisis, sirviendo así, como una fuente potencial de conocimiento con valor operacional. La clasificación del formato es crítica porque ese formato describe cómo convertir la información digital de vuelta en una representación de la realidad y cómo usar las herramientas correctas de la ciencia de los datos para obtener resultados analíticos. 16 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES Los datos deben estar almacenados, esta combinación prácticamente infinita con el fin de estar disponibles para el de palabras y letras ejemplifica los datos no análisis. Pueden almacenarse de una estructurados. En su conjunto, los tweets forma estructurada o no estructurada. son, por tanto, datos semi-estructurados. Los datos estructurados tiene un conjunto de atributos y relaciones que se definen Los datos también se clasifican según durante el proceso de diseño de la base su fuente. Los Proveedores de Servicios de datos; estos datos encajan en una Financieros tienden a clasificar las organización predeterminada, también fuentes de datos como tradicionales o conocida como esquema. En una base de no tradicionales, donde las fuentes de datos estructurada, todos los elementos datos tradicionales se refieren a fuentes de la base de datos tendrán el mismo internas de datos tales como transacciones número de atributos en una secuencia básicas de sistemas de gestión de cuentas, específica. Los datos transaccionales encuestas de clientes, formularios de generalmente están estructurados; tiene registro o información demográfica. las mismas características y se guardan de Las fuentes de datos tradicionales la misma manera. Los datos estructurados también incluyen fuentes externas como son más fáciles de consultar y analizar. los burós de crédito. Generalmente, se Los datos no estructurados no se organizan de trata de datos estructurados. Los datos no acuerdo con esquemas predeterminados. tradicionales, o datos alternativos, pueden Son flexibles para crecer de manera y ser estructurados, semi-estructurados forma, donde los atributos fiables pueden o no estructurados, y no siempre están o no existir. Esto los hace más difíciles de relacionados con el uso de los servicios analizar, pero esto es una ventaja a medida financieros. Ejemplos de este tipo de datos que más datos se generan rápidamente a incluyen, datos de uso de voz y Servicio partir de nuevas fuentes como las redes de Mensajes Cortos (SMS) de los MNO, sociales, correos electrónicos, aplicaciones imágenes satelitales, datos geoespaciales, móviles y dispositivos personales. Los datos datos de redes sociales, correos no estructurados tiene la ventaja de poder electrónicos u otros datos proxy. Estos ser guardados en el estado en el que se tipos de fuentes de datos son cada vez más encuentra, sin necesidad de comprobar si utilizados por los Proveedores de Servicios cumple con regla organizacional alguna. Financieros para ampliar o profundizar Esto hace que su almacenamiento sea la comprensión del cliente, o se utilizan rápido y flexible. También hay datos que en combinación con datos tradicionales se consideran datos semi-estructurados. para obtener información operacional. Por Considere un tweet de Twitter, por ejemplo, una IMF que desee asociarse con ejemplo, que está limitado a 140 caracteres. una cooperativa lechera para conceder Esta es una estructura organizacional créditos a productores lecheros podría usar predeterminada, y el servicio está sus niveles de producción lechera como programado para verificar que cada tweet una variable sustitutiva (proxy) del salario satisfaga este requisito. Sin embargo, el con el fin de evaluar la capacidad de brindar contenido de lo que está escrito en un tweet crédito a los agricultores que carecen de no está ni predefinido ni es obligatorio; historial de crédito formal.8 8 Transcripción de la sesión ‘Deploying Data to Understand Clients Better’ The MasterCard Foundation Symposium on Financial Inclusion 2016, consultado Abril 3 de 2017 http://mastercardfdnsymposium.org/resources/ ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 17 1.1_ANALÍTICA DE DATOS Y MÉTODOS Big data es típicamente el término general utilizado para describir la vasta escala y la naturaleza sin precedentes de datos que se está produciendo. El Big Data tiene cinco características. Los primeros especialistas en Big Data ¿Qué es identificaron las primeras 3 características que se enumeran a continuación y que aún son llamadas ‘las tres Vs”. Desde entonces, las características de Big Data? Big Data han crecido a una lista más larga de cinco: 1. Volumen: La increíble cantidad de datos que se están produciendo es alucinante. La madurez de estos datos se ha vuelto cada vez más joven, es decir, que la cantidad de datos que tiene menos de un minuto de edad ha ido aumentando constantemente. Se prevé que la cantidad de datos en el mundo aumentará 44 veces entre 2009 y 2020. 2. Velocidad: Una gran parte de los datos disponibles se producen y se vuelven disponibles en tiempo real. Cada minuto se envían 204 millones de correos electrónicos. Como consecuencia, estos datos se procesan y almacenan a velocidades muy altas. 3. Variedad: La era digital ha diversificado los tipos de datos disponibles. Hoy en día, el 80 por ciento de los datos que se generan no son estructurados, en forma de imágenes, documentos y videos. 4. Veracidad: La veracidad se refiere a la credibilidad de los datos. Los administradores de negocios necesitan saber que los datos que usan en el proceso de toma de decisiones son representativos de las necesidades y deseos de sus clientes. Por lo tanto, es importante asegurar un proceso de limpieza de datos riguroso y continuo. 5. Complejidad: La combinación de los cuatro atributos anteriores requiere procesos analíticos complejos y avanzados. Han surgido una variedad de procesos analíticos para hacer frente a estos grandes conjuntos de datos. 18 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES Fuentes de Datos ser una tarea demasiado grande para los no todos los mercados emergentes tienen datos existentes. una infraestructura de centrales de riesgo Esta sección se centra en las principales totalmente funcional. fuentes de información que los proveedores Datos de Cliente y Corresponsales de SFD pueden considerar para posibles Estudios de Mercado Primarios Los expertos recopilan una gran cantidad insights operacionales o de mercado. Es de información sobre sus clientes durante La investigación de mercado se utiliza importante destacar que una fuente de los procesos de vinculación y solicitud de generalmente para comprender mejor a los datos no debe considerarse en forma aislada; créditos por razones tanto comerciales clientes y segmentos de mercado, seguir la combinación de múltiples fuentes como de cumplimiento con regulaciones. las tendencias del mercado, desarrollar de datos a menudo conducirá a una Asimismo, también recopilan información productos y buscar retroalimentación comprensión cada vez más matizada de sobre sus corresponsales como parte del de los clientes. Puede ser cualitativa o las realidades que codifican los datos. proceso de solicitud y durante las visitas de cuantitativa, y puede ser útil entender El capítulo 2.2, sobre la recopilación y el control. Para ambas categorías, esto puede cómo y por qué los clientes usan los almacenamiento de datos de SFD, brinda incluir variables como género, localización productos. El comprador secreto es un una visión general de las fuentes de datos e ingresos. Alguna parte de esta data método de investigación de mercados tradicionales y alternativas más comunes es verificada por medio de documentos común para probar si los corresponsales disponibles para los proveedores. oficiales, mientras que otra parte es brindan un buen servicio al cliente, Fuentes Tradicionales de Datos comentada y capturada durante las mientras que algunos proveedores de SFD Como se mencionó anteriormente, los entrevistas. En el caso de los prestatarios, buscan comentarios directos de los clientes Proveedores de Servicios Financieros gran parte de esta información del cliente a través de encuestas de satisfacción han obtenido datos de vinculación se captura digitalmente en un Sistema de generando una puntuación [Net Promoter de clientes, datos transaccionales y Originación de Créditos (SOC) o un módulo Score] que mide el grado de disposición de estudios de mercado primarios. Gran de originación en el Sistema de Core los clientes de recomendar un producto parte de los datos relevantes para el Bancario (CBS). Es sorprendentemente o servicio. crédito se han almacenado en forma de común que dicha información se guarde sólo en papel o en archivos escaneados. Datos de Call Center documentos (copias físicas o electrónicas de documentos), y sólo los datos básicos Los datos de call centers son una buena Terceros fuente para entender qué problemas de registros de clientes y actividad bancaria se han almacenado en bases Los burós de crédito y los registros son enfrentan los clientes y cómo se sienten de datos centralizadas. Un reto para los excelentes fuentes de datos objetivos sobre los productos y el servicio al cliente Proveedores de Servicios Financieros hoy y verificables. Brindan una verificación de un proveedor. Los datos del call center en día es asegurar que estos tipos de datos de la credibilidad de la información se puede analizar categorizando los tipos tradicional también se almacenen en un reportada por los solicitantes de créditos de llamada y los tiempos de resolución, formato digital que facilite el análisis de y a menudo pueden revelar información y utilizando analíticas de voz para examinar datos. Esto puede requerir un cambio en que el solicitante puede no divulgar de los registros de audio. Los datos de los call la forma en que se recopilan los datos, o la buena gana. La mayoría de los informes center son particularmente útiles para introducción de tecnología que convierta de burós de crédito y registros públicos entender los problemas que los clientes, los datos a un formato digital. Aunque hay pueden ya ser consultados en línea corresponsales o comerciantes están tecnología nueva disponible para digitalizar pudiendo visualizar los datos relevantes teniendo con los productos o la nueva datos tradicionales, la digitalización puede digitalmente. Sin embargo, un reto es que tecnología que acaba de ser lanzada. ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 19 1.1_ANALÍTICA DE DATOS Y MÉTODOS Número Imagen Texto Voz Biométrico Figura 2: Formatos de Datos Bases de datos Transaccionales Fuentes Alternativas de Datos puede combinarse con las señales de A medida que más de nuestra comunicación torres de celdas para generar ubicaciones Los datos transaccionales ofrecen y negocios se hacen a través de teléfonos de actividad del cliente. Los operadores información sobre los niveles de actividad móviles, tabletas y computadoras, hay telefónicos que ofrecen servicios de y las tendencias de uso del producto. más fuentes de datos digitalizados que dinero electrónico tienen acceso tanto Las comparaciones simples de pueden proporcionar información sobre a los datos CDR como a la base de datos transacciones por valor frente a volumen, la capacidad financiera y el carácter de transaccionales de SFD y, cuando se pueden ofrecer resultados muy diferentes los clientes. Estas fuentes nos pueden combinan para el análisis, es más probable sobre el comportamiento del consumidor. que esta información ayude a predecir Para las Instituciones Financieras, tales contar cómo pasan su tiempo y gastan su la actividad y el uso del cliente, que los dinero las personas, y dónde y con quién como bancos o microfinancieras, los datos demográficos simples. En algunos se lo gastan. datos sobre el uso de cuentas bancarias mercados, los MNOs y los Proveedores (depósitos, débitos y créditos) y otros Registros Detallados de Llamadas de Servicios Financieros se alían entre sí servicios (tarjetas, préstamos, pagos (CDR) de los MNOs para beneficiarse de los datos combinados. y seguros) por parte de los clientes se Por ejemplo, las recargas de tiempo aire Desde sus operaciones centrales, los capturan normalmente en el CBS. El uso pueden ser un buen indicador de los operadores móviles tienen acceso a de cuentas bancarias y servicios deja ingresos discrecionales. Los clientes que los CDR y las coordenadas de Torres rastros objetivos de datos que pueden ser gastan totalmente su tiempo de llamadas Retransmisoras. Los operadores telefónicos analizados para ver patrones que señalan y, rutinariamente y con frecuencia, hacen analizan los CDR para desarrollar diferentes niveles de capacidad financiera pequeñas recargas es probable que tengan campañas de marketing y promociones y sofisticación. Los diferentes patrones menos ingresos discrecionales que los que focalizadas y para ajustar los precios, por de uso también pueden indicar diferentes recargan con menos frecuencia, pero en ejemplo. Como mínimo, un CDR incluye 1) niveles de riesgo. Para procesar solicitudes cantidades mayores. llamadas de voz, tiempo de llamada, uso de créditos, las Instituciones Financieras de servicios de datos y datos de SMS en el pueden requerir documentación de otras emisor, el receptor, el tiempo y la duración, instituciones, como burós de crédito, y 2) tiempo aire, información de recarga sin embargo, esto tiende a ser en papel y es de datos, incluyendo tiempo, ubicación y difícil de digitalizar. denominación. Además, esta información 20 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES Datos de Transacciones Asistidos han permitido a los proveedores de y el comportamiento en línea, incluyendo el por Corresponsales Servicios Financieros Digitales examinar tiempo, ubicación, frecuencia y secuencia Comprender cuáles ubicaciones y y hacer referencias cruzadas entre los de un sitio web o una serie de sitios web. corresponsales son los más activos factores del lado de la demanda tales como Las redes sociales también pueden ser puede proporcionar información para el nivel de inclusión financiera, la ubicación indicativas del estatus socioeconómico de ayudar a mejorar el desempeño de la del cliente, los niveles de pobreza y el uso un individuo. Por ejemplo, las personas con red de corresponsales. Para muchos con móviles de voz y datos, actividad del un perfil de LinkedIn que tienen muchas proveedores de SFD, los corresponsales corresponsal, características rurales o conexiones pueden, en promedio, ser de son la cara principal frente al cliente y urbanas, presencia de infraestructura y menor riesgo que las que no las tienen. hacer seguimiento del patrón de uso y similares. Esto puede ofrecer información Eso no se debe a que registrarse en una actividad del corresponsal puede revelar que puede ser útil para la adquisición cuenta de LinkedIn indique la capacidad información sobre las preferencias del de clientes y estrategias de marketing, de atender una deuda per se, sino porque cliente y el desempeño del corresponsal. expansión de sucursales o corresponsales, LinkedIn se dirige a profesionales y, Dicha información puede ser registrada y análisis de competidores o del mercado en promedio, los profesionales ganan directamente desde teléfonos móviles, en general. Los datos geoespaciales pueden salarios más altos que los obreros. terminales de punto de venta (POS) ofrecer una visión más granular que los Los perfiles públicos de las redes sociales u computadores como puntos de indicadores socioeconómicos típicos, que también pueden ser útiles para verificar los transacción. Alternativamente, podría generalmente sólo están disponibles en datos de contacto y la información personal estar indirectamente asociado, como los formato agregado. básica del cliente. Sin embargo, las redes formularios de registro de corresponsales, sociales como fuente de datos tienen sus Perfiles en Redes Sociales limitaciones. Los Proveedores de Servicios que se tienen que integrar en el flujo de datos transaccionales para que se lleve a Cada vez más, los mercados de clientes Financieros generalmente sólo pueden cabo un análisis. potenciales y existentes se están acceder a las cuentas de redes sociales de desarrollando en línea y mantienen una los clientes que lo aceptan, y puede ser Datos Geoespaciales presencia en redes sociales como Facebook, difícil conseguir suficientes clientes que Los datos geoespaciales hacen referencia Twitter y LinkedIn. Los datos de conducta acepten esto para construir una base de a datos que contienen información de en línea puede ofrecer información sobre datos lo suficientemente grande como para localización, como las coordenadas la retroalimentación, las actitudes, estilos un análisis significativo. Algunos clientes del sistema de posicionamiento global de vida, metas y la forma en que los también pueden no ser activos en las redes (GPS), direcciones, ciudades y otros servicios financieros pueden desempeñar sociales, debido a su propia elección o sus identificadores geográficos o de un papel en la vida del cliente. Los datos circunstancias. Los datos de perfil, incluso proximidad. En los últimos años, los datos de las redes sociales incluyen datos sobre cuando están disponibles, también puede geoespaciales de carácter muy granular el grado de conexión social, tráfico iniciado estar sesgados. ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 21 1.1_ANALÍTICA DE DATOS Y MÉTODOS Fuentes de Datos Operacionales Informes del Sistema de Datos Internos Periféricos Hay muchos procesos de negocio Inteligencia de Negocio (BI) Datos de Private Branch necesarios para ejecutar operaciones de Cuando los productos de SFD son nuevos Automatic Exchange (PBAX) Servicios Financieros Digitales, en los que y hay un volumen de datos relativamente El PBAX controla las llamadas entrantes a cada departamento trabaja para completar bajo, es común que las empresas creen un call center y puede proporcionar datos tareas y cumplir objetivos de desempeño, informes personalizados a partir de datos sin sobre el volumen de llamadas entrantes, al tiempo que dependen de datos procesar utilizando herramientas sencillas el número de llamadas perdidas antes de procedentes de múltiples fuentes. como Excel. A medida que el negocio y que se contesten y el tiempo que se emplea Las posibles fuentes de datos externas e los datos crecen, y el análisis requerido en las llamadas. Estos datos son vitales para internas se ilustran en la figura siguiente se vuelve más complejo, esto pronto se la planificación eficiente de los patrones de y se enumeran con mayor detalle en el vuelve incontrolable. La mayoría de los cambio y tamaño, así como la medición y la Capítulo 2.2. Cada departamento genera y grandes sistemas de Servicios Financieros mejora general del desempeño del equipo. consume datos a través de este ecosistema. Digitales pondrán en marcha un almacén Algunas de las fuentes de datos más de datos que utiliza sistemas de BI para Sistemas de Tickets importantes son: El sistema de tickets hace seguimiento aprovechar múltiples fuentes de datos, que proporcionan algunos informes básicos, al proceso de resolución de conflictos de Sistema Core de Datos así como la capacidad de personalizar. negocio y proporciona una gran cantidad El sistema core proporciona la mayor parte de información, desde los tipos de de los datos. El motor transaccional es Archivos de Registro Técnico conflictos que se producen, hasta tiempos responsable de gestionar el flujo de trabajo Una rica fuente de datos se puede de resolución de conflictos. de transacciones e interacciones, enviando encontrar en los archivos de registro tantos datos granulares y metadatos como técnico. Los proveedores de Servicios sea posible a las bases de datos pertinentes. Financieros Digitales más avanzados Esto incluye el movimiento de fondos más utilizan proactivamente los paneles de tarifas y comisiones, así como cualquier modelo de negocio en torno al reparto control para asegurar continuamente la de comisiones y las normas tributarias. salud del sistema y proporcionar detección También debe proporcionar rastros de temprana de fallos. También es común flujos de trabajo completamente auditables tener monitores de desempeño y alertas de actividades no financieras tales como integradas en el sistema de monitoreo que cambios en el número de identificación pueden proporcionar información valiosa. personal (PIN), consultas de saldos, mini- Los proveedores que visualizan estos datos estados y descargas de datos, así como sólo cuando se requiere un análisis forense funciones internas como transferencias de específico, pierden información disponible fondos entre cuentas. y útil. 22 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES Protección de Datos y reputacionales negativos. En Kenia, muchos proveedores de crédito digital Protección del Cliente han surgido para satisfacer la demanda Sáquele más magia a los Las nuevas metodologías analíticas y de de crédito, pero operan fuera del ámbito Mapas de Google recopilación de datos plantean varias regulador del Banco Central.9 Uno de cuestiones relacionadas con los derechos estos proveedores incluyó en sus términos de privacidad del cliente y la protección y condiciones que el proveedor era libre del consumidor . En primer lugar, como se de publicar los nombres de los morosos ha señalado anteriormente, muchos de los en su web y en sus muros de las redes datos producidos y recopilados se recojen de sociales. En casos como este, los clientes forma pasiva, es decir, sin el conocimiento pueden no ser conscientes que están de del productor de los datos. A veces, estos acuerdo en suspender sus derechos de datos pueden ser compartidos con terceros privacidad hasta que sea demasiado tarde. sin el conocimiento del productor de los Descubrir Esto puede ser particularmente cierto en datos. Esto puede tener implicaciones Ver sugerencias de lugares para contextos de países en desarrollo en los negativas en la capacidad del individuo explorar, basado en donde ha estado que la alfabetización y la conciencia de los para obtener préstamos o seguros. problemas son bajas. El problema se agrava cuando el individuo ¿Comenzar encendiendo historial de ubicación? Crea un mapa privado de dónde va usted con sus no es consciente de esta información Cabe destacar, que incluso en los países dispositivos activos. MAS INFORMACIÓN. negativa o no tiene el derecho de disputar donde el consentimiento del usuario ELIMINAR ENCENDER la información negativa. En la actualidad, no es frecuente, los consumidores pueden existen políticas estándar de participación no entender los permisos que están para compartir datos. Algunos proveedores concediendo. A modo de ejemplo, los de SFD con aplicaciones que están usuarios en mercados sofisticados pueden instaladas en los teléfonos móviles de no ser conscientes de todas las aplicaciones sus clientes pueden tener la capacidad de en sus teléfonos inteligentes que hacen barrer la información de uso de Internet del uso de datos de ubicación. Los estudios Figura 3: Ejemplo de solicitud para cliente y otros datos, incluyendo mensajes muestran que el 80 por ciento de los guardar y acceder a la data del historial SMS, contactos y datos de ubicación, usuarios de móviles tienen inquietudes de ubicaciones de usuarios a través de la entre otros. sobre compartir su información personal aplicación Google Maps Dada la diversidad de proveedores de mientras usan Internet móvil o las Servicios Financieros Digitales, no todos aplicaciones.10 Sin embargo, el 82 por están bajo el mismo régimen de vigilancia, ciento de los usuarios están de acuerdo lo que lleva a diferentes políticas de con los avisos de privacidad sin leerlos privacidad de datos para cada uno. Algunas porque tienden a ser demasiado largos o de las violaciones a los derechos individuales usan terminología que no les es familiar. a la privacidad podrían tener impactos Debido a las inquietudes de seguridad y la 9 Ombija y Chege, ‘Time to Take Data Privacy Concerns Seriously in Digital Lending’, Blog de Consultative Group Against Poverty, 24 de octubre de 2016, consultado el 3 de abril de 2017, https://www.cgap.org/blog/time-take-data-privacy-concerns-seriously-digital-lending 10 ‘Mobile Privacy: Consumer research insights and considerations for policymakers’, GSMA ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 23 1.1_ANALÍTICA DE DATOS Y MÉTODOS Permisos App Permisos App Permisos App Cámara ON Sensores Corporales ON Calendario ON Contactos OFF Cámara OFF Cámara OFF Ubicación OFF Contactos OFF Ubicación ON Micrófono OFF Ubicación ON Contactos OFF Teléfono ON Micrófono ON Micrófono OFF SMS ON Teléfono OFF Teléfono ON Almacenamiento OFF SMS ON SMS OFF Figura 4: Ejemplos de configuración para permisos de aplicaciones en teléfonos inteligentes disposición declarada de los clientes a dejar desarrollados, en la Unión Europea (UE) enviar la información a otras empresas de usar las aplicaciones que encuentran el derecho a la privacidad y la protección y permitir a las empresas intercambiar demasiado intrusivas o que carecen de de datos está fuertemente regulado y se información cuando sea técnicamente seguridad, la mayoría de las aplicaciones aplica activamente,11 mientras que en los posible.12 Este tipo de regulación aumenta hoy en día ofrecen formas sencillas de Estados Unidos no existe una ley federal el empoderamiento del consumidor al aceptación y rechazo. integral de protección de datos. En el tiempo que mejora la competencia, ya año 2016, la UE emitió una regulación que los consumidores pueden ahora Las leyes de privacidad, donde existen, sobre protección de datos que obliga moverse entre los proveedores con su varían ampliamente por jurisdicción y más a que todos los generadores de datos historial de transacciones intacto. En los aún en cuanto al grado de obligatoriedad. puedan recibir de vuelta la información Estados Unidos, la Comisión Federal de En el contexto de los mercados que proporcionan a las empresas, Comercio (FTC) es el órgano regulador de 11 Regulación que gobierna la protección de datos en la UE incluye la Directiva de protección de datos de la UE 95/46 CE y la Directiva de la UE sobre Privacidad y Comunicaciones electrónicas 02/58 CE (modificada por la Directiva 2009/136) 12 Reglamento (UE) 2016/679 del Parlamento Europeo y del Consejo (2016), consultado el 3 de abril de 2017, http://eur-lex.europa.eu/legal-content/EN/TXT/PDF/?uri=CELEX:32016R0679&from=EN 24 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES la privacidad de los datos. Sin embargo, Los flujos transfronterizos de datos hincapié en la necesidad de acelerar el el Código de principios justos de constituyen un asunto delicado, desarrollo y la adopción de normas legales, información de la FTC es sólo un conjunto especialmente porque pueden afectar técnicas, geoespaciales y estadísticas con de recomendaciones para mantener asuntos de seguridad nacional. respecto a: prácticas de captura de datos orientadas al La regulación en países como Angola, Sudáfrica y Tanzania estipula • La apertura y el intercambio de consumidor y respetuosas de la privacidad específicamente que los datos sólo puede metadatos - no es aplicable por ley. En ausencia de ser transferidos a países donde la ley cualquier regla federal de privacidad, en los • Protección de datos personales como provee normas de protección igual o Estados Unidos han desarrollado estatutos derecho humano15 más estricta para los datos personales y regulaciones federales y estatales para en cuestión. Zambia va aún más lejos Así las cosas, por el momento, no existe una abordar la privacidad de la información al prohibir cualquier transferencia off- política uniforme que rija las cuestiones personal y la seguridad de los datos, shore de datos que no esté anonimizada.13 de protección de datos. El primer paso tanto en un sentido general como en una En el otro extremo del espectro, el proyecto para entender las implicaciones de la base sectorial a la cual todos los negocios de ley sobre protección de datos de Kenia de 2016 ha sido duramente criticado por privacidad es asegurar una discusión relevantes deben adherirse. expertos por no incluir ninguna disposición sectorial que involucre a los proveedores En lo que se refiere a África subsahariana, para la jurisdicción extraterritorial.14 de SFD, reguladores, encargados de la Ghana, Sudáfrica y Uganda parecen formulación de políticas, otros actores Sin embargo, la privacidad de los datos de destacarse como las mejores prácticas del sector público, inversionistas e los clientes es un nuevo campo de políticas, regionales. Lo que distingue a estos tres Instituciones Financieras de desarrollo y países como Mozambique y Zimbabue países es el hecho de que la regulación para diseñar soluciones y estándares. Al siguen confiando en la Constitución para está guiada por un principio de orientación mismo tiempo, en el sector de la inclusión interpretar los derechos de privacidad como al cliente y, como tal, la regulación se resultado de no tener leyes regulatorias financiera, los proveedores de Servicios centra en: específicas. En este contexto, los mercados Financieros Digitales deben reconocer emergentes buscan frecuentemente que, si bien los datos representan una • Empoderar al consumidor para tomar mercados y reguladores más establecidos oportunidad para mejorar la rentabilidad, decisiones pertinentes sobre el uso de para obtener pistas sobre cómo abordar también subraya la obligación de agregar sus datos personales, especialmente los temas en cuestión. valor. Esto puede lograrse utilizando los en relación con la toma de decisiones datos para mejorar el acceso a los servicios automatizada Dado este contexto, pero consciente de financieros. Los proveedores de SFD las diferencias entre el uso de la tecnología • Establecer mecanismos claros a través pueden intentar educar a la gente acerca en mercados emergentes y desarrollados, de los cuales el consumidor puede de cómo se usará su información personal las Naciones Unidas (ONU) han ofrecido solicitar compensación alguna orientación general en términos mientras sólo recopile información que • Dar al cliente el ‘derecho a ser olvidado’ del desarrollo de políticas. La ONU hace sea necesaria. 13 ‘Global Data Privacy Directory’, Norton Rose Fulbright 14 Francis Monyango, ‘Consumer Privacy and data protection in E-commerce in Kenya’, Nairobi Business Monthly, Abril 1 de 2016, consultado Abril 3 de 2017, http://www.nairobibusinessmonthly.com/politics/consumer-privacy-and-data-protection-in-e-commerce-in-kenya/ 15 ‘A World That Counts: Mobilizing the Data Revolution for Sustainable Development’, Grupo Asesor de Expertos Independientes sobre la Revolución de la data para el Desarrollo Sostenible del Secretario General de la ONU ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 25 1.1_ANALÍTICA DE DATOS Y MÉTODOS Ciencia de los Datos: y la experiencia empresarial y sectorial. Introducción Es una disciplina exploratoria y creativa, que busca encontrar soluciones innovadoras La ciencia de los datos es el uso a problemas complejos a través de un interdisciplinario de métodos científicos, enfoque analítico. La ciencia de los datos procesos y sistemas para extraer se refiere al método científico de análisis: información y conocimientos de diversas los científicos de datos se dedican a la formas de datos con el fin de resolver resolución de conflictos estableciendo problemas específicos. Combina las ciencias una hipótesis comprobable y probando y numéricas tales como la estadística y las refinando asiduamente esa hipótesis para matemáticas aplicadas, con la informática obtener resultados fiables y validados. 01 Hacer Observaciones ¿Qué veo en la naturaleza? Esto puede ser de las experiencias, 06 pensamientos o 02 Comunicar lecturas propias Pensar en preguntas resultados interesantes Sacar conclusiones y ¿Porqué ocurre ese reportar hallazgos para patrón? que otros entiendan y repliquen Refinar, alterar, expandir o rechazar 05 hipótesis 03 Recopilar datos para probar predicciones Formular hipótesis Datos relevantes ¿Cuáles son las causas encontrados en la literatura, 04 generales del fenómeno nuevas observaciones/ sobre el que tengo experimentos formales inquietudes? Ensayos rigurosos requirieron replicación para verificar resultados Desarrollar predicciones probables Si mi hipótesis es correcta, entonces espero a, b, c Figura 5: El método científico, el proceso analítico que se utiliza de manera similar para la ‘ciencia de los datos’ 26 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES Ciencia de Datos El termino científico de datos fue acuñado en 2008 por DJ Patil y Jeff Estadísticas/ Hammerbacher para describir sus funciones de trabajo en LinkedIn y Matemáticas Facebook. Hicieron hincapié en que sus funciones no eran sólo procesar cifras y encontrar patrones en esos números, sino que aplicaron un proceso creativo y exploratorio para construir conexiones a través de esos patrones. Ciencia “La ciencia de datos trata sobre el uso de datos complejos para contar historias”, dijo de Datos Patil, agregando que toma tanto del periodismo como de la informática. Por esta Informática razón, Patil y Hammerbacher consideraron un título alternativo para sus trabajos: Conocimiento Artista de Datos. de Negocios Figura 6: Ciencia de Datos, la intersección de varias disciplinas Para entregar BI, todos los análisis datos grandes y pequeños, tradicionales cuatro casos de uso principales: descriptivo, relacionados con datos deben comenzar y alternativos. Las computadoras más diagnóstico, predictivo y prescriptivo. por definir metas de negocio e identificar las rápidas y algoritmos complejos aumentan Las metodologías menos complejas preguntas o hipótesis de negocio correctas. las posibilidades analíticas, pero ninguno suelen ser descriptivas por naturaleza, El método científico brinda una orientación de los dos reemplaza ni desplaza las proporcionando descripciones históricas útil (véase la Figura 5). Es importante herramientas validadas en el tiempo y del desempeño institucional, cifras destacar que no es un proceso lineal. En su los enfoques para obtener resultados agregadas y estadísticas resumidas. lugar, siempre hay un ciclo de aprendizaje basados en datos con el objetivo de También tienen menos probabilidad de y retroalimentación para asegurar una resolver problemas de negocio. Más bien, ofrecer una ventaja competitiva, pero son mejora incremental. Esto es clave para es importante entender las fortalezas de todos modos críticas para el monitoreo obtener resultados que permitan la toma que ofrecen diferentes herramientas y del funcionamiento operacional y el de decisiones fiables y basadas en evidencia. aumentarlas adecuadamente para obtener cumplimiento regulatorio. En el extremo El capítulo 2.1 de este manual proporciona los resultados deseados de una manera opuesto, los análisis más innovadores y un proceso paso a paso para implementar oportuna y rentable. complejos son prescriptivos, optimizados proyectos de datos para proveedores para la toma de decisiones y ofrecen de SFD, utilizando la metodología del La Figura 7 proporciona una descripción información sobre las expectativas Data Ring. de alto nivel de los métodos analíticos de futuras. Esta progresión también ayuda BI, clasificados por su uso operacional y su a clasificar los entregables y la estrategia La ciencia de los datos facilita el uso de relativa sofisticación. Muchas categorías y de implementación de un proyecto de nuevos métodos y tecnologías para BI, sus técnicas e implementaciones asociadas datos, que se analiza más adelante en el y análisis útiles se pueden derivar de se superponen, pero es útil dividirlas en Capítulo 2.1. ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 27 1.1_ANALÍTICA DE DATOS Y MÉTODOS Marco Analítico de la Ciencia de los Datos para la Inteligencia de Negocios Descriptiva Diagnóstica Predictiva Prescriptiva Alertas, consultas, Análisis de regresión, Aprendizaje automático, SNA, Análisis de gráficos, redes búsquedas, informes, Pruebas A|B, correlación reconocimiento de patrones neuronales, aprendizaje visualización, paneles de de patrones, minería geoespacial, visualizaciones automático y profundo, IA Técnicas control, tabletas, gráficos, de datos,pronósticos, interactivas narrativas, correlaciones, segmentación análisis estadístico simple Análisis Prescriptivo ¿Cómo podemos hacer que suceda? Analíticas Predictivas Sistemas integrados ¿Qué pasará en el futuro? Ventaja Competitiva Analíticas Diagnósticas Modelamiento ¿Porqué pasó? Analíticas Descriptivas ¿Qué pasó? BI Tradicional ¿Qué está pasando ahora? Informes Información Optimización Complejidades de analítica Figura 7: Las cuatro categorías de Análisis de Negocio 28 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES Métodos agregando valores frecuentemente. las relaciones entre una variable Es un método de segmentación, que dependiente, usualmente una métrica Los casos de uso analítico descritos en la permite que los agregados se tabulen de interés comercial, y un conjunto de Figura 7 ayudan a determinar el método, por sexo o ubicación, por ejemplo, u variables independientes con las que el tiempo, el costo y la complejidad de otros segmentos de interés. Excel utiliza se correlaciona. Identificar las variables los proyectos de datos. Los siguientes el término tabla dinámica para describir estadísticamente significativas16 puede métodos generalmente se incluyen dentro este tipo de análisis. orientar la estrategia, ayudar a enfocar de las herramientas del científico de datos, los objetivos y estimar los resultados. y ayudan a combinar los métodos generales Analítica de Diagnóstico con propósitos analíticos. Estos métodos • Segmentación: La segmentación es un La búsqueda de los factores clave o la son especialmente relevantes para las método de clasificación de grupos en comprensión de los patrones de datos discusiones con consultores externos o subgrupos basados en criterios definidos, cambiantes es el análisis de diagnóstico. proveedores de soluciones para ayudar a comportamiento o características. Se trata de preguntar por qué sucedió enmarcar lo que están entregando o para La segmentación puede ayudar a algo; por ejemplo, preguntando por qué evaluar una propuesta. identificar categorías de demografía los patrones de transacción cambiaron de clientes o categorías de uso del Analítica Descriptiva para determinar si no sólo hay correlación, producto, con umbrales cuantificados sino causalidad. La analítica de diagnóstico La analítica descriptiva ofrece informes y estadísticamente significativos. Esto generalmente requiere métodos más agregados de alto nivel de registros se utiliza a menudo junto con el análisis sofisticados y diseños de investigación, históricos y responde a preguntas sobre de regresión o técnicas de modelación como se describe a continuación. qué ocurrió. Los Indicadores Clave de más sofisticadas para predecir a Desempeño (KPI) también están dentro de qué segmento podría pertenecer un • Pruebas A|B: Se trata de un método esta categoría. prospecto de cliente no identificado. estadístico en el que dos o más variantes • Estadísticas Descriptivas: También de un experimento se muestran a los • Análisis geoespacial: Este método conocidas como estadísticas de usuarios al azar para determinar cuál agrupa los datos de acuerdo con su resumen, las estadísticas descriptivas funciona mejor para un objetivo de ubicación en un mapa, o en relación con incluyen promedios, sumas, conteos conversión dado. Las pruebas A | B el lugar y la proximidad. Esto también y agregaciones. Las estadísticas de permiten a los negocios probar dos puede ayudar a identificar segmentos correlación que muestran las relaciones escenarios diferentes y comparar los de clientes y de comportamiento, tales entre las variables también ayudan a resultados. Es un método muy útil como desde dónde y hacia dónde envían describir los datos. para identificar las mejores estrategias dinero, o qué sucursal tienden a visitar. promocionales o de marketing entre las Combinado con técnicas más avanzadas, • Tabulación: El proceso de organizar opciones probadas. también puede permitir que los servicios los datos en un formato de tabla se conoce como tabulación. La tabulación • Regresión: La regresión estadística basados en la localización conecten cruzada resume los datos de una o más es uno de los tipos más básicos de de manera proactiva a los clientes que fuentes en un formato conciso para el modelado, y es muy potente. Permite están cerca de la gente o de lugares análisis o la presentación de informes, el análisis multi-variable para estimar de interés. 16 Estadísticamente significante es la posibilidad de que una relación entre dos o más variables sea causada por algo distinto al azar ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 29 1.1_ANALÍTICA DE DATOS Y MÉTODOS Análisis Predictivo • Modelamiento: Existen dos métodos fácilmente interpretables, por ejemplo; Las predicciones permiten una toma de modelización primaria: regresión y mientras que el método de bosque de decisiones orientada hacia el futuro clasificación. Ambos se pueden utilizar aleatorio está en el otro extremo del y estrategias basadas en datos. Desde para hacer predicciones. Los modelos espectro, proporcionando buenas el punto de vista de la ciencia de los de regresión ayudan a determinar un predicciones, pero una comprensión datos, esto es posiblemente la categoría cambio en una variable de salida con insuficiente de lo que las genera. más importante de los métodos, ya que variables de entrada dadas; por ejemplo, ¿cómo aumentan las calificaciones Análisis Prescriptivo los algoritmos complejos y la potencia crediticias con los niveles de educación? Los métodos en esta categoría tienden computacional se utilizan a menudo para Los modelos de clasificación ponen los a ser categorizados por la predicción impulsar modelos. Desde una perspectiva datos en grupos o a veces en grupos o la clasificación de los aspectos de de negocio, los modelos predictivos pueden múltiples, respondiendo a preguntas comportamiento en las relaciones proporcionar eficiencias operacionales como si un cliente es activo o inactivo, complejas, e incluye un conjunto identificando segmentos de clientes de o a qué rango de ingresos pertenece. avanzado de métodos, que se describen a alta propensión y expandiendo el alcance Existen numerosos tipos de técnicas continuación. La inteligencia artificial (IA) a menores costos a través de campañas de modelización para cualquiera, y los modelos de aprendizaje profundo de marketing focalizadas. También pueden con detalles técnicos matizados. pertenecen a este grupo. Sin embargo, ayudar a mejorar el soporte al cliente Los enfoques de modelado tienden esta clasificación se enmarca mejor previendo proactivamente las necesidades a generar mucha atención, pero es dentro de la infraestructura que se estima de servicio. importante señalar que el método necesaria para usar los resultados de un • Aprendizaje Automático (Machine de modelado probablemente no análisis, asegurando que ofrece valor Learning): Este es un campo de estudio es una especificación de diseño de operacional. Por ejemplo, esto podría tomar que construye algoritmos para aprender análisis importante. Normalmente, la forma de un conjunto de herramientas y hacer predicciones sobre los datos. se intentan muchos tipos de modelos de los paneles de control, necesarias para En particular, este método permite a un y luego se selecciona el mejor en ejecutar una visualización interactiva en un proceso analítico identificar patrones en métricas de desempeño predefinidas; sitio web, o la infraestructura de tecnología los datos sin una instrucción explícita en otras ocasiones se combinan, de la información (TI) para automatizar un del analista y permite que los métodos creando un enfoque de conjunto. modelo de scoring crediticio. Lo que define de modelado identifiquen variables Un consultor debe describir por qué se un producto basado en datos es la integración de interés y factores incluso para selecciona un enfoque recomendado, de un algoritmo o proceso basados en patrones no intuitivos. Es una técnica y no simplemente declarar, por ejemplo, datos en un sistema operativo mayor, más que un método en sí mismo. Los que la solución se basa en un método o como filtro en un proceso automatizado enfoques basados en el aprendizaje específico, como el conocido método de que depende de él para brindar un servicio. automático se clasifican en términos de ‘bosque aleatorio’. Decidir qué método ‘aprendizaje supervisado’ o ‘aprendizaje usar para el modelado debe considerar la no supervisado’, dependiendo de si importancia de ser capaces de interpretar hay evidencia empírica para entrenar por qué se han dado unos resultados el algoritmo de aprendizaje, donde en comparación con la exactitud de la las metodologías supervisadas tienen predicción. Los modelos de regresión evidencia empírica. tienden a ser muy transparentes y 30 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES Lecciones de la Industria: Google tiene Gripe Modelado Predictivo y Ajuste de Modelos: Riesgo de Fiabilidad de los Modelos Sin Supervisión Los investigadores del buscador pública son obvios. El modelo fue un identificadas como correlaciones Google se preguntaban si podría éxito y fue lanzado públicamente estadísticamente poderosas en 2008. haber una correlación entre las como Google Flu Trends Pero muchos de estos términos personas que buscan palabras [Tendencias de Gripe de Google]. de búsqueda eran en realidad como “toser”, “estornudar” o El impresionante modelamiento de predictores de las estaciones, y las “congestión nasal” - síntomas de big data de Google fue destacado en estaciones a su vez se correlacionaron gripe o resfriado - y la prevalencia la revista científica Nature en 2008. con la gripe. Cuando los patrones actual de la gripe. En los Estados Sin embargo, seis años más tarde, de gripe cambiaron antes o después Unidos, la propagación de la gripe el fracaso del mismo modelo se de lo que había sido en 2008, esos tiene datos rezagados; la gente se describió de manera prominente en términos de búsqueda ya no se enferma y visita al médico, entonces la revista Science. ¿Qué pasó entre correlacionaban, tan fuertemente, el médico reporta las estadísticas, 2008 y 2014? con la gripe. Combinado con el y por lo tanto los datos capturan lo que ya ha sucedido. ¿Podrían los El número de usuarios de Internet cambio demográfico de los usuarios, modelos impulsados por palabras creció sustancialmente durante el modelo se volvió poco fiable. de búsqueda proporcionar datos en estos seis años y los patrones de Google Flu Trends se dejó en piloto tiempo real a medida que se propagaba búsqueda de 2008 no permanecieron automático, utilizando métodos realmente la influenza? Este enfoque constantes. La cuestión central fue de aprendizaje no supervisado para reducir los retrasos en los que Google Flu Trends se desarrolló y las correlaciones estadísticas se datos se conoce como nowcasting. utilizando técnicas de aprendizaje debilitaron con el tiempo incapaz de Para problemas como la gripe automático no supervisado: 45 frases mantenerse al día con los patrones estacional, los beneficios para la salud de búsqueda impulsaron el modelo, de cambio. Cuando se utilizan métodos similares para las decisiones de negocios o para asuntos de salud pública, es importante tener en cuenta que la pérdida de fiabilidad con el tiempo puede presentar riesgos significativos. ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 31 1.1_ANALÍTICA DE DATOS Y MÉTODOS Método de Bosque Aleatorio • Minería de Texto (Procesamiento del Herramientas Lenguaje Natural): La minería de texto La ciencia de los datos y sus métodos se El método de bosque es el proceso de obtener información desarrollan con lenguajes de programación aleatorio ha generado de alta calidad a partir del texto. de computadoras, o los algoritmos se mucha expectativa en El texto puede ayudar a identificar las ejecutan en plataformas computacionales. la ciencia de los datos opiniones y los sentimientos de los Los datos que alimenta estos algoritmos porque tiende a impulsar modelos clientes sobre productos utilizando se extraen de las bases de datos. altamente precisos. Es una forma mensajes de redes sociales, Twitter o El conjunto de herramientas del científico de modelo de clasificación que utiliza mensajes del CRM. El procesamiento de datos también incluye conocimientos una estructura de decisión tipo árbol del Lenguaje Natural (PLN) combina la profundos sobre la computación técnica o diagrama de flujo combinada con lingüística computacional y los métodos y las habilidades blandas necesarias para enfoques de selección aleatorios de Inteligencia Artificial para ayudar desarrollar e implementar algoritmos para identificar una ruta óptima a las computadoras a comprender de datos. Las especificaciones técnicas entre el resultado deseado y un la información de texto para su de estas herramientas están fuera del conjunto de variables de entrada procesamiento y análisis. alcance de la Analítica de datos de ‘bosque’. Es importante entender • Análisis de Redes Sociales (SNA) Este SFD. Sin embargo, algunas tecnologías que algunos métodos de la ciencia es el proceso de análisis cuantitativo prominentes se destacan para anotar de los datos se entienden fácilmente y cualitativo de una red social. algunas herramientas que los científicos de en un contexto de negocios, datos tenderán a utilizar. Los productos de Para propósitos de negocios, el SNA mientras que otros no. El método datos exitosos requieren una combinación puede emplearse para evitar la rotación, del bosque aleatorio puede, por de métodos, herramientas y habilidades, detectar fraude y abuso, o para inferir ejemplo, generar modelos altamente como se comentará más adelante en atributos, como la capacidad crediticia precisos, pero su complejidad el Capítulo 2.1: Gestión de un Proyecto basada en grupos de pares. produce una ‘caja negra’ que hace de Datos. que sea muy difícil de interpretar. Procesamiento • de Imágenes: Esto podría ser potencialmente Este enfoque utiliza algoritmos Herramientas Duras problemático para un modelo de informáticos para realizar análisis • Bases de Datos: La estructura de los score crediticio; podría identificar a con el propósito de clasificación, datos guiará la solución de base de datos las personas más solventes dados extracción de características, análisis de apropiada. Los datos estructurados los datos de entrada, pero no puede señales o reconocimiento de patrones. suelen ser gestionados por bases de ayudar a describir lo que hace que Los negocios pueden utilizar esto para datos relacionales con esquemas fijos que estas personas sean solventes o reconocer a las personas en las imágenes pueden soportar la fiabilidad integral qué determina la recomendación para ayudar con la detección de fraude o de los datos, lo que puede ayudar a los de crédito. para detectar características geográficas analistas a identificar anomalías en el relevantes para situar corresponsales valor de los datos o evitar que guarden mediante imágenes satelitales. datos erróneos desde el principio. 32 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES Las bases de datos relacionales organizan • Frameworks: Estos son conjuntos de Herramientas Blandas conjuntos de datos en tablas que están paquetes de software que combinan • Lenguajes: ‘R’ y Python son dos relacionadas entre sí por una clave, es decir, una solución de almacenamiento de lenguajes de programación que se un atributo de metadatos compartido datos con un interfaz de programación han vuelto esenciales para la ciencia entre las tablas. Las soluciones de de aplicaciones (API) que integran de los datos. Ambos ofrecen los centros de datos empresariales y el beneficios de elaboración rápida de herramientas de gestión o analíticas almacenamiento de datos transaccionales prototipos y el análisis exploratorio que en la base de datos. En otras palabras, pueden poner proyectos de datos en suelen utilizar bases de datos relacionales. se trata de soluciones de fuente única marcha rápidamente. Ambos también Los productos conocidos incluyen: para administrar y analizar datos. incluyen bibliotecas complementarias Oracle, SQL Server y MySQL. Los datos no Los productos prominentes incluyen construidas para la ciencia de datos, estructurados suele ser gestionados por permitiendo técnicas sofisticadas de Spark y Hive. Hadoop, mencionado bases de datos no relacionales que carecen aprendizaje automático o técnicas de anteriormente, es un producto entre una de esquemas rígidos, comúnmente modelamiento con relativa simplicidad base de datos NoSQL y un framework. Se denominados bases de datos NoSQL. de programación. Los frameworks y Ofrecen ventajas en escala y distribución, utiliza para administrar y escalar datos bases de datos también tienen sus y se depende de estas a menudo para distribuidos utilizando un método de propios conjuntos de lenguajes de Big Data y las aplicaciones interactivas búsqueda conocido como MapReduce, programación. SQL es necesario para los un método desarrollado por Google para sistemas de bases de datos relacionales, en línea. A medida que los conjuntos de mientras que otras soluciones pueden datos grandes se hacen más grandes, almacenar y consultar datos a través de requerir Java, Scala, Python o Pig para el espacio en disco duro se vuelve limitado sus vastas redes de datos. Hadoop. y el tiempo computacional de búsqueda • Computación en la Nube: Los • Diseño y Visualización: Los lenguajes tarda más. La ventaja de las bases de proveedores externos ofrecen básicos de la ciencia de datos básica datos NoSQL es que están diseñadas suelen incluir bibliotecas de visualización soluciones de hosting que proporcionan para ser escalables horizontalmente, para ayudar a explorar los patrones de acceso a la potencia computacional, lo que significa que otra computadora, datos y visualizar los resultados finales. almacenamiento de datos y frameworks. o dos, o cien, pueden ser añadidas de Como muchos proyectos de datos Esta es una excelente solución para manera transparente para aumentar el producen paneles de control interactivos las empresas que quieren participar o herramientas de monitoreo basadas espacio de almacenamiento y la potencia en analítica de datos más sofisticada, en datos, hay una serie de proveedores computacional de búsqueda. Si bien las especialmente Big Data, pero no tienen externos que ofrecen soluciones soluciones relacionales también pueden la capacidad de invertir en servidores completas. Algunos proveedores externos escalarse y distribuirse, a menudo son de computadoras y contratar a técnicos de productos incluyen: IBM, Microsoft, más complejas de manejar y afinar Tableau, Qlik, Salesforce, DataWatch, cuando se guardan datos en múltiples para administrarlos. Los productos Platfora, Pyramid y BIME, entre otros, computadoras. Los productos más conocidos incluyen: Amazon Web algunos de los cuales se ejemplifican conocidos incluyen: Hadoop, MongoDB y Services (AWS), Cloudera, Microsoft en los estudios de casos operativos del BigTable. Azure y IBM SmartCloud. Capítulo 1.2. ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 33 Da tos Ap li PARTE 1 e d dos de ca to D Capítulo 1.2: Aplicaciones de ci tos y M ica on a é ít Datos Para Proveedores de es Anal Servicios Financieros Digitales Proy Ges cto os ti ó n e d rs de e un cu Da Re Este capítulo cubre las tres áreas principales en las que el análisis de datos t o s  permite a las empresas enfocarse en el cliente, construyendo así una mejor propuesta de valor y generando valor de negocio para el proveedor de Servicios Financieros Digitales. En primer lugar, examina el papel que el análisis de los datos puede desempeñar para mejorar el conocimiento de los clientes por parte del proveedor de SFD. En segundo lugar, ilustra cómo la datos pueden desempeñar un papel más importante en las operaciones cotidianas de un proveedor de Servicios Financieros Digitales típico. Finalmente, analiza el uso de datos alternativos en las evaluaciones y decisiones de crédito. Estas secciones presentarán una serie de casos de uso para demostrar el potencial de la ciencia de los datos para los proveedores de SFD, pero no son exhaustivos. Las posibilidades de negocios que ofrece la ciencia de los datos está limitada sólo por la disponibilidad de datos, métodos y habilidades necesarias para utilizar los datos. Seguidamente, presentamos una serie de ejemplos para alentar a los proveedores de Servicios Financieros Digitales a comenzar a pensar formas en que los datos puede ayudar a sus operaciones existentes a alcanzar el siguiente nivel de desempeño e impacto. La Figura 8 ilustra cómo el análisis de datos puede desempeñar un papel de apoyo en la toma de decisiones de un negocio de Servicios Financieros Digitales, a lo largo del ciclo de vida del cliente y en las tareas operativas correspondientes. Como tal, los datos juegan un papel clave en ayudar a los proveedores de SFD a enfocarse más en el cliente. No hace falta decir que todas las organizaciones dependen de la fidelidad del cliente. La orientación al cliente consiste en establecer una relación positiva con los clientes en cada etapa de la interacción, con el objetivo de impulsar la fidelidad, beneficios y los negocios de los clientes. Esencialmente, los servicios orientados al cliente proporcionan productos basados en las necesidades, preferencias y aspiraciones de su segmento, incorporando esta comprensión en los procesos operativos y en la cultura. 34 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES Ciclo de Vida del Cliente Reducir deserción Dirigirse al cliente de clientes más propenso a utilizar SFD Identificar necesidad de mejoras del producto/proceso Medir el impacto Inspirar Adquirir del marketing Predicción del comportamiento del cliente Proveedor de SFD Orientado al Cliente Mejorar actividad Creación de Retener Desarrollar del cliente programas de fidelización Construir Examinar relaciones más retroalimentación cercanas con del cliente clientes valiosos Estrategia de precios Figura 8: Oportunidades existentes para aplicaciones de datos a lo largo del Ciclo de Vida del Cliente ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 35 1.2_APLICACIONES DE DATOS Ser receptivo a los clientes es clave del consumidor para este segmento Estos datos pueden ser manipulados y cuando se desea enfocar en el mismo. es mayor porque podrían tener menos analizados para ofrecer un conocimiento Es útil entender por qué los clientes se van y acceso a información, menores niveles de granular del mercado. Este tipo de análisis cuándo es más probable que se vayan, para alfabetización y un mayor riesgo de fraude suele implicar un conjunto diverso de que se puedan tomar medidas apropiadas. en comparación con otros segmentos. métodos y datos cuantitativos y cualitativos. Algunos clientes se irán inevitablemente Los proveedores de SFD tendrán que Esta sección comienza con un estudio y se convertirán en antiguos clientes. entender las necesidades particulares de de caso para ilustrar cómo los pequeños El uso de analítica de datos para entender estos clientes y luego diseñar procesos pasos, para incorporar un enfoque basado cómo estos clientes se han comportado a operativos que reflejen esta comprensión. en datos, pueden aportar mayor precisión lo largo del ciclo de vida puede ayudar a los Así, entender a los clientes y la entrega al entendimiento de las preferencias del proveedores a desarrollar indicadores que de valor al cliente es crucial para los cliente. A continuación, sigue con una alerten al negocio cuando sea probable proveedores de SFD, y los datos pueden discusión de cómo se pueden utilizar los que los clientes se vayan. También puede ayudar a ser más orientados al cliente. datos para entender la gestión de clientes ofrecer nociones sobre cuáles de estos con un producto de Servicios Financieros clientes pueden ser recuperados por el 1.2.1 Analítica Digitales con el fin de mejorar la actividad proveedor de servicios y cómo hacerlo. y Aplicaciones: del cliente y reducir la rotación de los mismos. Luego, explica cómo utilizar la Los proveedores de Servicios Financieros Conocimiento de segmentación para identificar grupos Digitales suelen atender a personas Mercado específicos dentro de la base de clientes que anteriormente no tenían acceso a bancos u otros servicios financieros, así Esta sección muestra cómo usar los datos y cómo utilizar este conocimiento para como a otros clientes mal atendidos. para desarrollar un entendimiento más mejorar los esfuerzos de focalización. Esto plantea desafíos especiales para los preciso y matizado de los clientes y los Esto es seguido por una discusión de proveedores ya que primero tienen que mercados, lo que a su vez puede ayudar cómo los proveedores de Servicios establecer confianza y fe en un nuevo a un proveedor de servicios a desarrollar Financieros Digitales pueden aprovechar sistema para sus clientes. Tales clientes productos y servicios que estén alineados las nuevas tecnologías para predecir el pueden tener ingresos irregulares, con las necesidades del cliente. Como comportamiento financiero y mejorar la ser más susceptibles a los shocks se describió en el capítulo anterior, adquisición de clientes. Por último, esta económicos y pueden tener un los proveedores de Servicios Financieros sección examina formas de interpretar comportamiento de gastos diferente. Digitales tienen acceso a datos valiosos la retroalimentación de los clientes para Por último, la necesidad de protección de clientes en una variedad de formas. mejorar los productos y servicios existentes. 36 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES CASO 1 Zoona - Pruebas de estrategias de marketing para un impacto óptimo Como Desarrollar Hipótesis para Mensajes de Marketing Exitosos y Probarlos Zoona es un Proveedor de Servicios para el lanzamiento a nivel nacional. piloto inicial, por lo que 1.3 indica de Pagos con operaciones en Zambia, La primera estrategia se llamó que los resultados son un 30 por Malawi y Mozambique, donde busca ‘Gratificación instantánea’, y otorgó ciento mejores que el piloto de convertirse en el principal proveedor a todos los clientes que abrieron una referencia. El análisis muestra que de transferencias de dinero y cuentas cuenta un brazalete gratis, así como la metodología de lotería fue la de ahorro simples para las masas. una alta probabilidad de recibir menos popular, mientras que el El marketing es a menudo una un pequeño reembolso de efectivo mayor número de cuentas abiertas actividad que consume mucho cada vez que hicieran un depósito. fue acreditado a la estrategia del tiempo y requiere muchos recursos, En la segunda estrategia, llamada embajador. Estas cuentas también y puede ser difícil medir el impacto. ‘Lotería’, los clientes tenían una baja tenían altos valores de depósito. Zoona manejó algunos de estos probabilidad de ganar un premio Zoona también analizó las tasas de desafíos utilizando un enfoque grande, con sólo cuatro ganadores actividad de los clientes, medidas orientado al cliente para probar tres seleccionados durante dos meses. como el número de depósitos por El tercer enfoque incluía embajadores estrategias de marketing diferentes cuenta. El enfoque de gratificación de apertura de cuentas que acudían para un producto nuevo de depósito instantánea fue el claro ganador. a áreas de alta actividad, como los llamado Sunga. Primero, realizó un En la Figura 9, el 24 de noviembre mercados, para invitar a las personas piloto de tres meses del producto a abrir cuentas. es la fecha en que los depositantes Sunga en una zona, luego extendió comenzaron a ganar pequeños el piloto a otros tres municipios para Las estadísticas del primer mes de reembolsos de efectivo cada vez probar tres estrategias de marketing este piloto ampliado se presentan a que depositaban en sus cuentas: la diferentes, todo con el fin de continuación. Los números se han línea azul muestra que los depósitos identificar el enfoque más impactante indexado con respecto al municipio aumentan significativamente. Comparación de Estrategias de Marketing, Tabla de Resultados INDEXADO (Primeros 30 días) #Registros Valor Depositado Piloto 1.0 1.0 P1: Gratificación Instantánea 1.4 1.9 P2: Lotería 1.1 1.8 P3: Embajador 3.0 3.8 Tabla 1: Comparación de Resultados, estrategia ‘embajador’ aumenta aperturas ANÁLISIS de cuentaDE 300% DATOS Ysobre línea SERVICIOS base FINANCIEROS DIGITALES 37 1.2_APLICACIONES DE DATOS 2.0 1.9 1.8 1.7 Observe aumento línea azul. No. Depósitos por cuenta 24 Noviembre 2016 1.6 1.5 Pueblo Registro 1.4 PILOTO P1: GI 1.3 P2: LOTERIA P3: EMBAJADOR 1.2 1.1 1.0 Nov 01 Nov 14 Nov 28 Dic 01 Dic 14 Dic 28 Fecha Figura 9: Resultados de las pruebas de campaña de incentivos para clientes El resultado del análisis fue apoyado de los del grupo de gratificación y ‘Gratificación instantánea’ - la por llamadas de seguimiento a los instantánea le contó a un familiar primera para estimular las aperturas clientes. La retroalimentación reveló o amigo acerca del producto. de cuentas y la segunda para que la gratificación instantánea Como resultado, la estrategia de estimular los niveles de actividad de también impulsó el marketing boca- marketing a nivel nacional ahora los clientes. a-boca, ya que el 88 por ciento combina las estrategias ‘Embajador’ Este estudio de caso ilustra que un enfoque riguroso para probar las estrategias de marketing no tiene que conllevar metodologías complicadas. Por el contrario, un enfoque sistemático y la planificación, utilizando la iteración rápida de las técnicas medidas por las tasas de respuesta de los clientes, pueden crear resultados medibles. También se destaca el beneficio de combinar metodologías para llegar al comportamiento deseado del cliente. 38 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES Caso de Uso: Entendiendo la para desarrollar mensajes efectivos para ayudar al proveedor de servicios a efectuar Interacción con el Producto para el producto o para desarrollar acciones cambios en todo el negocio para alinearse Ofertas de SFD para gestionar la interacción del cliente con el comportamiento y las necesidades Entender cómo un cliente usa o no usa con el producto. Los altos niveles de del cliente. Por ejemplo, este tipo de análisis un producto o servicio es importante registro combinados con bajos niveles puede ayudar a informar estrategias de para hacer mejoras en el área apropiada de actividad suelen implicar que el marketing, estrategias de reclutamiento de operaciones con el fin de extender el costo de adquirir y mantener activos a de corresponsales o la adopción de alcance y aumentar la adopción. Los datos los clientes es innecesariamente alto. procesos de mejores prácticas para transaccionales y los datos de perfil del Los datos transaccionales, así como los corresponsales. La Figura 10 proporciona cliente proporcionan información valiosa datos geoespaciales, puede ofrecer a los una ilustración sencilla de cómo se pueden sobre cómo los clientes se vinculan con proveedores información sobre los niveles interpretar los datos transaccionales. un producto con el paso del tiempo. de actividad tanto de los clientes como de los El proceso analítico de datos también se Esta retroalimentación puede utilizarse corresponsales. Esta información pueden explora con mayor detalle en el Capítulo 2.1. Acciones Impulsadas Construir Hipótesis Recoger Datos Analizar Datos por Datos • ¿Qué pasó? • Datos transaccionales • Análisis estadístico sencillo • Cambio de estrategia • ¿Porqué pasó? • Comparación de • Tablas basado en hallazgos • ¿Qué está pasando comportamientos según • Correlaciones • Más investigación ahora? niveles de uso entre primaria grupos • Datos KYC • Datos CDR Figura 10: El Proceso de Análisis e Interpretación de Datos ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 39 1.2_APLICACIONES DE DATOS Mejorando la Actividad de Clientes a los clientes existentes es mucho menos los proveedores de SFD prestan servicios costoso que adquirir nuevos. Un gran al mercado masivo en contextos de países Un análisis transaccional simple como se número de clientes que nunca han en desarrollo como un solo segmento o ha visto anteriormente puede, por ejemplo, hecho transacciones indican un enfoque utilizan segmentación demográfica básica revelar que los clientes muy activos están inadecuado en la etapa de vinculación. para entender a los clientes. La razón de la asociados con corresponsales específicos. Un número elevado de clientes inactivos limitada incorporación de la segmentación Para poder actuar sobre esta información, puede indicar otras limitaciones en la en la generación de información de clientes será necesario averiguar por qué este es oferta de servicios, que pueden mejorarse tiene dos vertientes. En primer lugar, el caso. ¿Podría ser debido a las mejores mediante pequeñas mejoras de productos los proveedores de SFD asediados en prácticas adoptadas por los corresponsales, o procesos. mercados altamente competitivos pueden debido a la ubicación geográfica, o debido verse alentados por el éxito de ciertos a alguna otra variable? Como ejemplo, Caso de Uso: Segmentación productos y pueden sentirse obligados se podrían realizar entrevistas para Los segmentos pueden ser delineados por a adoptar un enfoque centrado en el comprender mejor las técnicas de los marcadores demográficos, marcadores producto, en lugar de orientado al cliente. corresponsales, y los datos geoespaciales de comportamiento tales como patrones Así, los proveedores de SFD pueden dejar de podrían utilizarse para comprender mejor de uso de SFD, datos geográficos u otros pensar en los diferentes usos posibles para el impacto de la ubicación en la actividad datos externos de MNOs, tales como sus ofertas en función de las necesidades y de los corresponsales y los clientes. uso y compra de tiempo aire y datos. preocupaciones del cliente. Por el contrario, Gruposde actividad muy alta o muy Comprender los segmentos es necesario pueden optar por resaltar casos de uso muy baja indican amenudo la necesidad para descubrir las necesidades y deseos particulares y mensajes para un producto. investigación y discusiones de grupos de grupos específicos, así como para Por ejemplo, mientras que el producto focales más profundas, para entender las diseñar estrategias de ventas y marketing de transferencia de dinero electrónico razones detrás de estas. bien orientadas. La información de la de M-Pesa fue muy exitoso en Kenia, los segmentación, destinada a ampliar las MNOs en otros mercados no han tenido Reduciendo la Rotación perspectivas de generación de ingresos el mismo éxito, enfatizando la necesidad de Clientes en cada segmento único, es fundamental de mirar el mercado y el comportamiento Mirar de cerca los datos transaccionales dentro la hoja de ruta estratégica de una de los clientes y sus necesidades, mercado puede proporcionar pistas sobre por qué institución. La segmentación de clientes es por mercado antes de desplegar productos. un aspecto crucial para convertirse en una los clientes están abandonando el servicio En segundo lugar, hay una falta de organización orientada al cliente, que los y cómo conservarlos. La frecuencia con la conciencia sobre cómo segmentar atienda bien, tome decisiones inteligentes que los clientes interactúan con un servicio eficazmente la base de clientes y cómo de inversión y mantenga un negocio puede indicar si se acaba de adquirir, usar este análisis de segmentación. saludable. si son clientes activos del servicio o si es La segmentación no necesita ser necesario volver a ganárselos de vuelta En principio, muchos proveedores de complicada o costosa. Expertos en el área al servicio. Diferentes mensajes y canales Servicios Financieros Digitales reconocen deben definir claramente los objetivos son relevantes para los clientes en cada la importancia de la segmentación. de negocio, los cuales pueden guiar el una de estas etapas. En general, mantener Sin embargo, en la práctica, la mayoría de ejerciciode segmentación. 40 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES Segmentación de Clientes Super Usuario Usuario pasivo Usuario inactivo Envía dinero cada Recibe dinero de Cambió su SIM. No dos semanas a hijos empleador y retira entiende el producto, estudiando en la dinero de inmediato lo usó una vez, nunca ciudad más lo usó NECESIDADES NECESIDADES NECESIDADES Programa fidelización Información del Información sobre el producto producto, ayuda adicional del corresponsal Figura 11: Ejemplos de Segmentos de Clientes de SFD según actividad del producto El siguiente marco presentado por el Consultative Group to Assist the Poor (CGAP) ilustra cómo los diferentes tipos de segmentación pueden ser empleados por un profesional dependiendo de sus necesidades:17 Tipo de Ejemplo Necesidades de Datos Ventajas Desventajas Segmentación Demográfica • Rural vs. Urbano Información de Vinculación y • Sencillo • Falta de uniformidad dentro • Hombre vs. Mujer Conozca a Su Cliente (KYC) • Los datos son fáciles de de los grupos • Adulto vs. Joven encontrar • Menos esclarecedor Comportamiento • Nunca realizó transacciones • Base de Datos transaccional • Los datos son fáciles de • Falta de conclusiones sobre la vs. usuarios inactivos vs. encontrar vida del cliente, necesidades, activos • Fácil de atribuir valor al aspiraciones • Ahorradores vs. Retiradores cliente • Menos útil para los mensajes de marketing Demográfica y por • Estudiantes • Información de Vinculación • Asigna valor a un cliente y • Los datos son relativamente Comportamiento • Trabajadores migrantes que y KYC proporciona información más difíciles de encontrar envían dinero a casa • Base de Datos transaccional sobre su vida y necesidades • Puede tener segmentos • Investigación primaria de • Mensajes de marketing más superpuestos mercado fáciles de desarrollar Psicográfica • Mujeres que quieren un sitio • Datos transaccionales • Respuesta fuerte a las • Datos difíciles de encontrar seguro para ahorrar históricos profundos y ricos aspiraciones del cliente • Puede tener segmentos • Los clientes que creen que el • Investigación primaria • Propuesta de valor fuerte superpuestos acceso al dinero electrónico • Mensajes de marketing más • Podría ser un segmento muy implica mayor estatus fáciles de desarrollar dinámico, es decir, quiere, • Consciente de su podría cambiar Presupuesto Tabla 2: Marco de Segmentación del Cliente CGAP 17 CGAP (2016). Customer Segmentation Toolkit ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 41 1.2_APLICACIONES DE DATOS CASO 2 Tigo Cash Ghana Aumenta el Uso de la Billetera Electrónica Activa Modelos de segmentación de clientes mejoran la vinculación y activación de clientes Tigo Cash, lanzado en Ghana en y el mantenimiento de las tasas de con el fin de identificar usuarios abril de 2011, es el segundo mayor actividad siguieron siendo un objetivo móviles de voz y datos que tuvieran proveedor de dinero electrónico en clave después del lanzamiento del alta probabilidad de convertirse términos de usuarios registrados. servicio. Una base de clientes con en usuarios activos de dinero A pesar de las altas tasas de transacciones activas no es sólo un electrónico. Para ello, un equipo de desafío en Ghana; el GSMA estima científicos de datos analizó durante inscripción, conseguir que los clientes que las tasas de actividad globales seis meses casi dos terabytes de CDR realicen varias transacciones por son tan bajas como del 30 por ciento. y datos transaccionales. medio de dinero electrónico sigue siendo un reto y un enfoque clave. En 2014, Tigo Cash Ghana se asoció Los resultados del análisis sugieren Las tasas de vinculación de clientes con IFC para un análisis predictivo que existen diferencias entre los Tasa de adopción a nivel de distrito: Tigo Cash Adopción pronosticada (basada en CDR): Tigo Cash Principales Distritos Objetivos: Tigo Cash Figura 12: DE 42 ANÁLISIS DATOS Y actuales, Distritos SERVICIOS previstos y principales FINANCIEROS DIGITALES en el uso de dinero móvil clientes a través de un gran número de una pequeña proporción de usuarios factores clave que se utilizaron para métricas de uso de teléfonos móviles, de dinero electrónico informó que la identificar a los potenciales usuarios la estructura de la red social y la no disponibilidad de corresponsales activos de dinero electrónico. Lo movilidad individual y de grupo. Hay les impidió utilizar servicios de que comenzó como un análisis de fuertes diferencias entre suscriptores de dinero electrónico. Los bajos niveles las CDRs históricas, aportó un voz y sólo datos, suscriptores inactivos de uso estaban más estrechamente valor de prueba de concepto y llevó de dinero electrónico y suscriptores vinculados a la falta de conocimiento a desarrollar un enfoque basado activos de dinero electrónico. Se puede de las personas acerca de la propuesta en datos que permitió a Tigo Cash observar una fuerte correlación entre de valor del dinero electrónico o la superar la marca de 65 por ciento de los altos usuarios de los servicios percepción de que no tenían suficiente actividad entre sus clientes de dinero tradicionales de telecomunicaciones y dinero para usar los servicios. electrónico. La base de clientes la probabilidad de que esos usuarios activos creció de 200.000 antes Nuevos Clientes del ejercicio, a más de 1 millón de también se conviertan en usuarios regulares de dinero electrónico. El modelado predictivo resultó en clientes activos en 90 días. 70.000 nuevos usuarios activos de Con la ayuda de algoritmos de dinero electrónico debido al uso Cambio de Mentalidad Institucional aprendizaje automático, el equipo de del modelo único. Los resultados El resultado de la colaboración se investigación identificó perfiles que trazaron el grupo de posibles convirtió en la base de todo el trabajo coinciden, entre clientes de voz y sólo adoptantes de dinero electrónico de adquisición de clientes de Tigo datos que aún no son suscriptores e identificaron lugares en los que Cash Ghana. Por encima de todo, de dinero electrónico, pero que es las actividades de marketing no la analítica de datos mostró el valor probable que se conviertan en usuarios convencionales estaban logrando el de conocer a los clientes. Tigo Cash activos. El equipo también geo-mapeó mayor impacto. Tener una idea ex- Ghana planea aumentar su capacidad los datos (ver Figura 12) para su ante del potencial de marketing en interna de ciencia de datos, así como posterior análisis. Además, el análisis diferentes áreas evita la sobreoferta mejorar aún más su entendimiento de los CDRs y los datos transaccionales de personal de ventas y aumenta la del cliente con investigación primaria se complementaron con encuestas para eficiencia del marketing. El enfoque adicional. El objetivo ahora ha no sólo comprender lo que sucedió, basado en datos proporcionó pasado de vincular nuevos clientes sino también el por qué. una forma más inteligente y más que se espera que sean activos, a informada para orientar a los pensar a futuro sobre maneras de Determinantes en la Adopción de Dinero suscriptores telefónicos existentes a mantener niveles de actividad alta de Electrónico adoptar el dinero electrónico. una manera sostenible. La necesidad de más educación al cliente y la adaptación del producto Mejores Tasas de Actividad es algo que salió claramente a través El uso de SMS y el alto volumen de las encuestas individuales. Sólo de voz y uso de datos móviles son Un enfoque institucional hacia la adquisición y retención de clientes puede cambiarse y mejorarse de forma fundamental simplemente haciendo uso de los datos existentes para tomar decisiones operativas más informadas. ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 43 1.2_APLICACIONES DE DATOS Programas de Marketing primaria para identificar qué le preocupa Los datos necesarios para este tipo de Focalizados a los segmentos. Todos los datos de los análisis son datos demográficos de los clientes pueden utilizarse para desarrollar clientes, datos transaccionales y datos Focalizarse en los grupos de mercado programas de marketing focalizados. Sin sobre la rentabilidad del cliente. adecuados, con las campañas de embargo, es probable que los resultados publicidad y marketing adecuadas, puede sean más precisos si el análisis se realiza en Esto es igualmente aplicable a la aumentar mucho la eficacia de una los miembros de segmentos determinados identificación de corresponsales de alto campaña en términos de captación y de clientes. desempeño basándose en la segmentación. uso. Usando una combinación de fuentes Trabajando con FINCA en la República de datos, los proveedores de Servicios Campañas de Fidelización y Democrática del Congo (RDC), IFC analizó Financieros Digitales pueden segmentar Promoción los datos transaccionales de corresponsales datos transaccionales por parámetros y los formularios de vinculación en la Puede haber segmentos de clientes demográficos para identificar grupos República Democrática del Congo para que realicen un número muy alto de estratégicos dentro de su base de clientes. mostrar que ser mujer y estar involucrada transacciones en el canal SFD. Estos Los programas de marketing se pueden en un negocio orientado a servicios está segmentos pueden desear recompensas de personalizar para enfocarse en estos altamente correlacionado con ser un fidelidad para transacciones específicas tales grupos, a menudo con mayor eficiencia corresponsal de alto desempeño.18 como pagos a ciertos tipos de comerciantes. y eficacia que los enfoques estándar. Alternativamente, el proveedor de SFD puede Se ha visto que los proveedores de SFD Mejoras en Productos o Procesos ser capaz de empujar a otros segmentos hacia combinan el conocimiento de segmentos La clasificación de los clientes en segmentos ciertos tipos de transaccionesofreciendo con los datos sobre la rentabilidad a fin campañas promocionales. Las transacciones también permite a los proveedores de SFD de enfocar los esfuerzos de marketing en específicas en la base de datos y los perfiles prestar mayor atención a las necesidades segmentos con probabilidad de optimizar de clientes ayudarían a identificar qué específicas de una cohorte representativa. los beneficios. Del mismo modo, otros grupos se beneficiarían de dichas campañas. En un grupo más grande, estas necesidades proveedores de SFD han utilizado los ciclos pueden perderse de vista - pero prestar de vida del cliente para hacer las ofertas Relaciones de Alto Valor con atención a los segmentos más pequeños de productos correctas para los clientes Clientes permite a los proveedores de SFD afilar adecuados. El principal desafío aquí es La segmentación de los clientes basada su enfoque y explorar las necesidades encontrar qué preocupa a los grupos de en rentabilidad es una aplicación o deseos desatendidos o ignorados. clientes con el fin de diseñar una campaña común del proceso de segmentación. Por ejemplo, dentro de un grupo de de marketing adecuada. Mientras que Además, se pueden evaluar los grupos personas que no utilizan un servicio, podría el universo de datos disponibles para los propensos a convertirse en importantes haber algunos que son clientes inactivos, proveedores de SFD está creciendo cada en el futuro. Los proveedores de SFD o aquellos que transaron un par de veces, día, en ausencia de análisis para arrojar pueden usar esta información para pero luego dejaron de usar el servicio. luces sobre esto, una vez que se identifican aumentar su cuota de mercado de este Hablar con estos usuarios podría revelar los grupos de clientes, los proveedores grupo y para reducir la asignación de la necesidad de realizar pequeños cambios de SFD pueden utilizar la investigación recursos a grupos menos rentables. en el producto o proceso. De forma 18 Harten and Rusu Bogdana, ‘Women Make the Best DFS Agents’. IFC Field Note 5, The Partnership for Financial Inclusion 44 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES alternativa, los clientes de un segmento demográfica es menos predictiva de la las necesidades y aspiraciones del cliente, pueden utilizar la gama completa de relación futura de una institución con lo que dificulta el desarrollo de mensajes productos ofrecidos por un proveedor un cliente que la segmentación basada perceptivos en torno a estos segmentos. de SFD, mientras que otro segmento en características de comportamiento. puede utilizar sólo uno o dos de estos La agrupación de clientes basada en La realización de un ejercicio de productos. En tales casos, la segmentación datos demográficos tiende a dar el mismo segmentación en la base de datos de proporciona información para una tratamiento a todos los clientes de un clientes requiere recursos dedicados investigación de mercado focalizada y para grupo, independientemente de su nivel y un plan detallado. En particular, el desarrollo de productos con el objetivo de actividad en el canal. La demografía las estrategias de segmentación que hacen de desbloquear la demanda de los clientes. también puede ser de naturaleza estática, uso de múltiples fuentes de datos son más donde - particularmente en el mundo del exitosas a la hora de describir de manera Oportunidad de Mercado y acceso financiero habilitado por tecnología útil y precisa a los grupos de clientes. Así, el Productos Prioritarios - el comportamiento del cliente es dinámico proceso para desarrollar la segmentación Una vez completado el ejercicio de y en constante cambio. del cliente debe incorporar este enfoque. segmentación, los proveedores de Servicios La analítica de datos juega un papel Financieros Digitales pueden evaluar El acceso a las bases de datos importante en este proceso, ya que permite hasta qué punto su oferta de productos transaccionales puede transformar la a los proveedores de SFD segmentar satisface las necesidades y deseos de cada segmentación tradicional en una poderosa exactamente por las variables que juegan segmento. Pueden estimar qué segmentos herramienta para generar información de un papel en dirigir el uso y la adopción. representan la mayor oportunidad a lo los clientes. Con la mayor disponibilidad de Este informe sólo analiza el papel de largo del tiempo y qué tan competitiva datos, nuevas herramientas de análisis de la analítica de datos para facilitar este es su oferta dentro de estos segmentos datos y múltiples canales disponibles para proceso, pero es importante señalar que cruciales de crecimiento. De esta forma, un los clientes, los proveedores de Servicios esos segmentos pueden crearse a través de análisis basado en la segmentación puede Financieros Digitales ahora tienen la opción múltiples tipos de investigación y análisis. jugar un papel importante en la hoja de de usar información de comportamiento ruta estratégica de un proveedor de SFD. individual. Esta información predice mejor las necesidades y usos financieros de las La segmentación demográfica tradicional personas. Además, refleja las necesidades - que puede basarse en la edad, en los y actividades cambiantes del cliente. ingresos o en la geografía - es útil, pero la Sin embargo, los datos de comportamiento experiencia demuestra que la segmentación pueden no tener mucha información sobre ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 45 1.2_APLICACIONES DE DATOS CASO 3 Airtel Money - Aumento de Actividad con Modelos Predictivos de Segmentación de Clientes Modelo de Segmentación con Aprendizaje Automático Ofrece Valor Operacional y Visión Estratégica Airtel Money, la oferta Servicios automático, un modelo predictivo orientar a los clientes por encima Financieros Digitales de Airtel fue capaz de identificar a los posibles o por debajo de un punto de corte Uganda, se lanzó en 2012. usuarios activos con una precisión del determinado. Si bien no es tan preciso La adopción inicial fue baja, con 85%. Esto produjo 250.000 clientes como otros modelos, proporcionó sólo una fracción de sus 7.5 millones de Airtel Money de ‘alta probabilidad’, un sólido ‘corte rápido’ que se podía de suscriptores GSM vinculándose nuevos y activos, de la base de utilizar contra los KPI para evaluar al servicio. Los niveles de actividad suscriptores GSM para que Airtel rápidamente las expectativas. también fueron bajos, con alrededor les llegara con marketing focalizado. del 12,5 por ciento de usuarios activos. El análisis de redes geoespaciales Finalmente, el estudio analizó los IFC y Airtel Uganda colaboraron y de clientes ayudó a identificar corredores del movimiento de dinero en un estudio de investigación para nuevas áreas de interés estratégico, electrónico dentro de la región. utilizar la analítica de Big Data y el mapeadas en función del nuevo Encontró que el 60 por ciento de todas modelado predictivo para identificar potencial de adopción. las transferencias ocurren dentro de un a los clientes GSM existentes con radio de 19 kilómetros en Kampala probabilidad de convertirse en El modelo de aprendizaje automático y sus alrededores. El entendimiento usuarios activos de Airtel Money. identificó algunas variables con alta fiabilidad estadística, pero que no de esta necesidad de remesas de corta El proyecto analizó seis meses de tenían sentido comercial, tales como la distancia también informó los esfuerzos transacciones de CDR y Airtel Money. ‘entropía de duración de voz’. Como de marketing de Airtel Money para El análisis buscó segmentar usuarios de resultado, un análisis complementario transferencias P2P. Por otra parte, dinero electrónico muy activos, activos dio métricas de reglas de negocio, este análisis de redes de transacciones y no activos. El estudio identificó tres o indicadores que tenían una buena P2P identificó otras ciudades y zonas categorías diferenciadoras: Los niveles correlación con la actividad potencial rurales con corredores de actividad de actividad GSM, el gasto móvil y también tenían relaciones altas con que podrían dar lugar a relaciones mensual y la conectividad del usuario. KPIs del negocio. Cada métrica tenía estratégicas más allá de Kampala para Usando métodos de aprendizaje un punto de corte numérico para que Airtel se centre en el crecimiento. 46 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES Transacciones P2P enviadas por número de origen Ubicación de los clientes del CDR Mitya n a M ba ra ra M ba le Ma sin di Gulu Kampala ta See ja Jin Masaka Figura 13: Análisis de red (izquierda) de los flujos P2P entre ciudades y robustez del canal. También se muestra la densidad geoespacial de las transacciones P2P de Airtel Money (centro), en comparación con la distribución de uso GSM (derecha). Datos a 2014. El análisis avanzado de analítica de datos puede proporcionar información sobre segmentos de clientes activos y altamente activos que pueden impulsar modelos de propensión para identificar clientes potenciales con alta precisión. El análisis de redes y geoespacial puede proporcionar información para priorizar la planificación estratégica del crecimiento. ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 47 1.2_APLICACIONES DE DATOS Caso de Uso: Pronóstico del El análisis predictivo puede ayudar a los El análisis predictivo podría ayudar a Comportamiento del Cliente expertos en el área a alcanzar los siguientes identificar a los clientes en la etapa de objetivos: vinculación que son mucho más propensos El modelado predictivo es una herramienta a convertirse en usuarios activos en el de toma de decisiones que utiliza datos • Adquisición de nuevos clientes futuro a través de una técnica estadística pasados de clientes para determinar • Desarrollo de una oferta de producto conocida como modelado de respuesta. la probabilidad de resultados futuros. óptima El modelado de respuesta utiliza el Los proveedores de Servicios Financieros • Identificar los objetivos del cliente y conocimiento existente de una base de Digitales evalúan la información clientes potenciales para proporcionar predecir el comportamiento del cliente multidimensional de los clientes para una score de propensión a cada cliente • Prevención de la rotación identificar las características del cliente que potencial. Cuanto mayor sea el score, más están correlacionadas con los resultados • Estimar el impacto del marketing probable es que el cliente se convierta deseados. Como parte del modelado, en un usuario activo. Los MNO que son Nueva adquisición e a cada cliente se le asigna un score o proveedores de Servicios Financieros Identificación de Objetivos clasificación que calcula la probabilidad del Digitales han utilizado este tipo de Como lo demuestran las investigaciones modelado para predecir qué miembros de cliente de tomar una determinada acción. y la experiencia de los especialistas, los su base de clientes de voz y datos pueden Para una institución orientada al cliente, el expertos en el área han registrado con éxito convertirse en usuarios activos de sus SFD. modelo predictivo puede informar cómo un gran número de nuevos clientes para El modelo se basa en la hipótesis de que los entiende y responde a las necesidades sus SFD. Sin embargo, la transformación clientes que probablemente gasten más del cliente. Sin embargo, quedan algunos de estos clientes registrados en clientes en voz y datos también son propensos a activos sigue siendo una tarea difícil que adoptar Servicios Financieros Digitales. impedimentos que evitan su uso más sólo unos pocos proveedores de SFD han Usando datos CDR, el modelo es capaz de extendido. Hay una percepción - que podido dominar. En promedio, alrededor predecir con un alto grado de exactitud la ahora está cambiando gradualmente de un tercio de los clientes registrados probabilidad de que un cliente se convierta entre los proveedores de SFD – que los han realizado una sola transacción en en un usuario activo de SFD. proveedores ya conocen su base de clientes los últimos 90 días.19 Una de las razones lo suficientemente bien como para entender Desarrollo de Ofertas Óptimas de identificadas para estos bajos niveles de qué productos y campañas de marketing Producto actividad es la focalización inadecuada en funcionan. Alternativamente, algunos la etapa de vinculación. La mayoría de las Existen modelos predictivos que pueden proveedores de Servicios Financieros ofertas de Servicios Financieros Digitales usarse para descubrir qué paquetes Digitales miran lo que ha funcionado en apuntan al vasto mercado masivo. Como de productos pueden ser utilizados otros lugares y tratan de replicar productos tal, son capaces de vincular un gran conjuntamente por los clientes. Así, y servicios similares en sus propios mercados. número de clientes, pero han tenido un el modelo identificará segmentos que Muchos proveedores tampoco saben éxito limitado convirtiendo a estos clientes tienden a utilizar sólo un único producto exactamente cómo y dónde comenzar en una base de clientes activa y generadora como las transferencias P2P y otros el proceso. de ganancias. que hacen uso de múltiples productos, 19 ‘State of the Industry Report on Mobile Money’, Decade Edition 2006 - 2016, GSMA 48 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES como servicios de depósito, compra cliente y desarrollo futuro de productos. Estimar el Impacto del Marketing de tiempo aire y transferencias P2P. Este tipo de predicción también se puede El marketing de Servicios Financieros Sin embargo, el segundo grupo nunca utilizar a nivel individual del cliente o a Digitales tiende a ser intensivo en recursos puede usar el servicio para microcréditos. nivel agregado para un segmento como debido a su relativa novedad en muchos Esta es la información que el proveedor un todo. mercados. Esto se ve favorecido por la de Servicios Financieros Digitales comprensión de que un producto requiere puede utilizar para fines de marketing y En particular, un análisis predictivo completo creación de conciencia antes de lograr la desarrollo de productos. del valor del cliente requiere un alto nivel aceptación del cliente. Sin una herramienta de clientes activos en las áreas de producto para medir el éxito, los gerentes se ven Predicción del Comportamiento y canal. Esto puede no ser realista para obligados a confiar en su intuición y en del Cliente muchos proveedores de SFD. Sin embargo, datos generales de ventas para evaluar el Este análisis también puede usarse para a medida que las organizaciones crecen, valor de sus esfuerzos de marketing. Dado entender el valor potencial futuro de cada ser capaces de pronosticar los patrones y que los clientes están ahora interactuando cliente. Esto incluye el valor del cliente, tendencias de los clientes futuros no sólo con los proveedores de SFD en múltiples la fidelidad del cliente, la compra esperada será posible, sino imprescindible para hacer canales, digitales y de otro tipo, también y el comportamiento de uso, y la respuesta crecer un negocio saludable. Así, estar al es difícil aislar los efectos de campañas esperada a campañas y programas. tanto de esta funcionalidad puede ayudar específicas, ya que los clientes están Del mismo modo, los proveedores de Servicios a los proveedores de SFD a incorporarla en expuestos a múltiples mensajes en un Financieros Digitales pueden aumentar sus su proceso de toma de decisiones cuando momento dado. oportunidades de venta mejorada y venta sea relevante. cruzada al predecir el uso futuro a través de El modelado predictivo permite la canasta actual de productos y patrones de Prevención de Rotación medir el impacto del marketing en el uso. Determinar qué paquetes de productos La rotación del cliente ocurre cuando un comportamiento del cliente. Dependiendo funcionan juntos a través de analítica de de los datos disponibles, el análisis cliente deja el servicio de un proveedor de datos transaccionales también presenta puede permitir a los proveedores de SFD. El costo de la rotación incluye tanto la una oportunidad para la venta cruzada. SFD estimar el alza en las ventas que se pérdida de ingresos futuros del cliente, así Por ejemplo, un Proveedor de Servicios de pueden atribuir al marketing. El modelado como los costos de marketing y adquisición Pago puede encontrar que los usuarios están predictivo identificará cómo las medidas relacionados con la sustitución del cliente usando la billetera electrónica como una específicas de marketing pueden afectar perdido. Adicionalmente, en el momento cuenta de almacenamiento, una indicación el comportamiento del cliente entre de la rotación, los ingresos obtenidos de que estos clientes pueden ser atendidos segmentos. Puede demostrar, por ejemplo, del cliente pueden no haber cubierto la más eficazmente a través de una cuenta de que una determinada acción de marketing adquisición de ese cliente. Así, la analítica ahorros. o publicidad en un determinado canal en torno a la rotación de clientes tiene dos puede tener una respuesta mucho mayor Esta información puede utilizarse a través objetivos: predecir qué clientes van a rotar de ciertos segmentos en comparación con de varias funciones operativas: diseño y entender qué pasos de marketing pueden la respuesta promedio de la población. de campañas y marketing, proyecciones convertir a un cliente con un alto riesgo de financieras, asignación de la inversión del abandonar, en un cliente retenido. ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 49 1.2_APLICACIONES DE DATOS Mensajes de Marketing propuesta de valor general no específica Entender 2. a los Clientes: Personalizados para Servicios Financieros Digitales. Posteriormente, los proveedores de Las secciones anteriores ya han discutido Por último, el mensaje de marketing SFD necesitan examinar estos datos y cómo el marketing objetivo puede utilizar correcto hará que el cliente tome medidas considerar la segmentación en grupos un entendimiento más profundo de basándose en los mensajes que reciben, basados en características comunes. los segmentos de clientes. El Marketing presumiblemente porque hablan de los Desarrollar Mensajes e Interactuar 3. personalizado es marketing focalizado en puntos críticos para el cliente. con los Clientes: Los proveedores de un nivel extremadamente individualizado, SFD deben luego desarrollar mensajes Algunos mensajes personalizados pueden donde los deseos y las necesidades de un e identificar los canales adecuados fallar en sus objetivos específicos, ya que cliente individual se anticipan usando su para comunicar mensajes a su base de los mensajes no solicitados pueden ser comportamiento pasado y otra información clientes. El siguiente paso es involucrarse ignorados fácilmente o, lo que es peor, reportada. Muchos clientes potenciales con la base de clientes a través pueden causar asociaciones negativas tienen experiencia limitada con los servicios de mensajería. con el proveedor de SFD. Así, los mensajes financieros y muchas veces desconfían de la 4. Prueba de la Eficacia de la Mensajería: personalizados deben ser cuidadosamente capacidad de ser relevantes para sus vidas. El impacto del mensaje se puede diseñados y focalizados a fin de garantizar La mensajería personalizada permite a los medir usando las pruebas A|B. que están llegando a los clientes que proveedores de SFD ‘hablar’ a sus clientes La personalización debe ir acompañada requieren la información. como si los conocieran, lo que permite a de pruebas para que sea posible evaluar los proveedores ganar la confianza de los ¿Cómo pueden los proveedores de SFD su impacto. clientes. Además, los clientes pueden tener personalizar mensajes de marketing? 5. Refinar el Mensaje: La retroalimentación una relación altamente personalizada de los clientes y la medición del con su proveedor. En los mercados 1. Recopilar datos e identificar clientes: impacto deben alimentar el refinamiento competitivos, mensajes personalizados En primer lugar, los proveedores de del mensaje. ayudarían a construir una afinidad por un SFD necesitan recopilar datos sobre servicio sobre otro. Los clientes son mucho sus clientes. Las fuentes de estos más propensos a responder a la mensajería datos incluyen transacciones, datos que responde a sus intereses, en lugar de demográficos, preferencias e inputs en mensajería impersonal que se refiere a una redes sociales de los clientes. 50 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES CASO 4 Juntos Envía Mensajes Escalables y Personalizados para Involucrar a los Clientes Fuentes de Datos: Los datos Cualitativos y Cuantitativos Mejoran la Segmentación y Alcance Juntos, una compañía de tecnología Los buenos datos respaldan este Para comenzar, los mensajes se le de Silicon Valley, se asoció con enfoque. En primer lugar, Juntos envían a los usuarios, y los usuarios proveedores de Servicios Financieros realiza una investigación etnográfica pueden responder a esos mensajes. Digitales para construir relaciones para comprender mejor a los clientes Esto desarrolla la relación de de confianza con los usuarios finales; del mercado. El involucramiento confianza requerida. Más importante mejorando las tasas generales de está siempre basado en datos aún, esas respuestas son recibidas actividad de los clientes. A nivel cuantitativos proporcionados por el por un “chatbot” automatizado de global, muchos proveedores de SFD aliado de SFD, por la investigación Juntos que analiza los resultados de cualitativa conductual hecha en acuerdo a tres KPIs: experimentan inactividad alta y bajo el país y por los aprendizajes uso del servicio. Esto desalienta a • Porcentaje de Participación: ¿Qué extraídos de la experiencia a nivel los proveedores, cuyas inversiones porcentaje de usuarios respondió global. Habiendo desarrollado un pueden sufrir rendimientos al chatbot? ¿Con qué frecuencia entendimiento inicial del usuario financieros insuficientes y cuyos respondieron? final, Juntos lleva a cabo una serie clientes pueden tener acceso a de pruebas controladas aleatorizadas • Contenido de Respuestas: ¿Qué servicios que no están utilizando (RCTs) antes del lanzamiento dicen las respuestas? ¿Qué lo suficiente. Juntos ofrece una completo del producto. Estos información compartieron o solución a este problema mediante experimentos controlados están solicitaron? el uso de mensajes personalizados de diseñados para probar el contenido, • Comportamiento Transaccional: involucramiento de clientes basados la sincronización de los mensajes o ¿Cambió el comportamiento en estrategias de segmentación los patrones de distribución, y para transaccional después de recibir según datos, que dan resultados identificar el enfoque más efectivo mensajes durante una semana? cuantificados. para la gestión de clientes. ¿Un mes? ¿Dos meses? ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 51 1.2_APLICACIONES DE DATOS Estos experimentos permiten genérico se compara con un mensaje rango de ingresos; y patrones de entender qué clientes inactivos se personalizado con un indicador de uso, fusionando esta información activaron debido al alcance de los tiempo. Los datos etnográficos base con datos etnográficos sobre el mensajes de Juntos, y comprender de Juntos mejoran la comprensión sentimiento del consumidor. qué mensajes habilitaron una cualitativa de los clientes, ayudando actividad más alta y más consistente. a construir una hipótesis respecto Al probar una amplia variedad de Por ejemplo, se envía un mensaje de cuál de los mensajes tiene mensajes, Juntos puede segmentar de control a un grupo de usuarios más probabilidad de tener eco y, grupos de usuarios de acuerdo a los seleccionado al azar: “¡Usted puede para seguidamente, someter estos mensajes que muestran una mejora usar su cuenta para enviar dinero a mensajes a pruebas estadísticas. estadística con el uso a lo largo del casa!” Otros podrían extraer datos tiempo. Esto significa que se pueden La primera pregunta es si los del servicio para incluir el nombre elaborar mensajes muy cautivadores mensajes de prueba producen del cliente: “Hola Juan, ¿sabías que resultados estadísticamente mejores creados para todos, desde mujeres puedes usar tu cuenta para enviar en comparación con el mensaje de rurales, a hombres jóvenes, hasta dinero a casa?” Tal vez otros datos se control genérico. Cuando la respuesta personas de altos ingresos en incorporarán en el mensaje: “Usted es “sí”, es importante profundizar entornos urbanos. El enfoque de usó su cuenta por última vez hace un poco más y preguntarse sobre Juntos se adapta a cada contexto y se 20 días, ¿Adónde le gustaría enviar el encuestado y encuestar entre ajusta continuamente para acomodar dinero hoy?” Estos son sólo ejemplos, segmentos tales como rural o ágilmente a los clientes que cambian pero muestran cómo un mensaje urbano; masculino o femenino; sus interacciones con el tiempo. La recolección del sentimiento cualitativo del cliente y los datos de mercado mejoran el entendimiento del comportamiento del cliente, lo que ayuda a los proveedores a elaborar mensajes que a la gente le gusta ver. Las pruebas estadísticas de hipótesis identifican qué mensajes tienen más eco con grupos específicos, permitiendo mensajes personalizados para públicos objetivo. 52 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES Caso de Uso: Entendiendo la 2. Análisis de Sentimientos: El análisis de como Servicios Financieros Digitales, los retroalimentación del Cliente y sentimientos o ‘minería de opinión’ es proveedores deben encontrar un método Analítica de Texto una herramienta basada en algoritmos para catalizar los niveles de educación utilizada para evaluar el lenguaje, tanto entre las bases de clientes potenciales, Los proveedores de Servicios Financieros hablado como escrito, para determinar especialmente entre los clientes que Digitales también pueden extraer si la expresión de opinión es positiva, construyen el entusiasmo y el impulso para conclusiones útiles sobre las preferencias y negativa o neutra y en qué medida. actitudes de los clientes a través de nuevas el producto dentro de la base de clientes A través de este análisis, los proveedores técnicas basadas en algoritmos llamadas objetivo. Normalmente, los clientes están de SFD entienden cómo los clientes se minería de texto o analítica de texto. más motivados para hablar acerca de uno sienten acerca de sus productos, cómo Hoy en día, muchas compañías pueden o dos casos de uso específicos; rara vez se relacionan con la marca y cómo acceder a información sobre los gustos de se extenderá un mensaje genérico sobre estas actitudes están cambiando con el los clientes a través de las redes sociales, tiempo. Los picos o valles en el análisis de la marca. Las fuentes de redes sociales correos electrónicos, sitios web y de las sentimiento son de especial interés. y otra información en la web se pueden transcripciones de las conversaciones en utilizar para identificar influenciadores por Actualmente, las evaluaciones de la analítica su nivel de conexión, nivel y naturaleza los call centers. Cabe destacar que estos de texto pueden aplicarse en tres áreas: de la interacción y alcance potencial. Este métodos se han aplicado en contextos de países desarrollados en Europa y América tipo de análisis depende de datos de redes Mejora de Productos y Servicios del Norte. Sin embargo, los proveedores sociales no estructurados, datos de sitios Los proveedores de SFD podrían de SFD en los mercados emergentes evaluadores de contenido y datos de blogs. hacer mejoras rápidas a los productos también pueden querer analizar estos y servicios si pudieran escuchar Impacto de Marketing y Monitoreo datos para ayudar a crecer los negocios. directamente de los clientes. de Retroalimentación La analítica de texto también puede Las redes sociales, correos electrónicos y realizarse manualmente. Con los avances La minería de opinión permite a los otros mecanismos de retroalimentación tecnológicos, es probable que estos proveedores de SFD entender el proceso directa son una excelente manera de métodos se vuelvan más baratos y más escuchar de inmediato y directamente a los del pensamiento de un gran número adaptables a los contextos y lenguajes de clientes. La investigación de mercado puede de clientes. A través del análisis de los países en desarrollo. ser una fuente limitada de comentarios de sentimiento, es posible rastrear lo que los clientes a este respecto. dicen los clientes sobre nuevos productos, La aplicación más común para la analítica publicidad, servicios, marcas y otros de texto es a través de dos métodos: Marketing Boca a Boca aspectos del marketing. Este análisis El marketing boca a boca sigue siendo también puede usarse para entender 1. Métodos de Resumen de Texto: Estos la forma más fiable de publicidad para cómo el mercado percibe los productos y métodos proporcionan un resumen de muchos clientes. Para los productos y servicios de la competencia. Estos datos toda la información clave de un texto. los proveedores de SFD que tienen bases de las redes sociales, blogs, sitios web de Este resumen se puede crear utilizando grandes de clientes existentes, no es revisión y otros sitios web en el ámbito sólo el texto original (enfoque extractivo) difícil motivar a los clientes satisfechos social también son no estructurados. o utilizando texto que no está presente para impulsar el marketing boca en boca. en el texto (enfoque abstractivo). Sin embargo, para nuevos productos, ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 53 1.2_APLICACIONES DE DATOS 1.2.2 Analítica y Aplicaciones: Este equipo tiene un papel importante en la estructura organizacional, siendo Gestión de Operaciones y Desempeño independiente de otras funciones básicas y El equipo de operaciones es responsable de operar la ‘sala de máquinas’ que es clave para también estando integrado en las principales el negocio de los Servicios Financieros Digitales porque realiza una variedad de tareas, actividades empresariales. La naturaleza de las responsabilidades del equipo incluyendo: recogida de datos, almacenamiento de datos y asegurar su conectividad requiere habilidades técnicas, así como el fluida entre varios sistemas y aplicaciones para todo el entorno TI del proveedor de SFD; conocimiento del negocio. Esta combinación monitorear constantemente la calidad de los datos; inducción y gestión del desempeño permite interpretaciones significativas de de los corresponsales; asegurar que la tecnología esté funcionando según lo diseñado; los datos que eventualmente pueden ayudar prestar apoyo al cliente; suministrar la información y las herramientas necesarias para en los procesos de toma de decisiones de las el equipo comercial, incluyendo la medición del desempeño, la supervisión del riesgo y principales partes interesadas del negocio. la presentación de informes reglamentarios; resolver los problemas; monitoreo eficiente de los indicadores, excepciones y anomalías; gestión del riesgo; y asegurar que el negocio En esta sección se describe el papel cumpla con las obligaciones regulatorias. Esto no se puede hacer eficientemente sin que pueden desempeñar los datos para acceso a datos precisos, presentados en una forma que sea relevante, fácilmente digerible optimizar las operaciones diarias de y oportuna. un proveedor de SFD típico. Comienza por describir cómo los datos pueden convertirse en información útil, dando ejemplos de la vida real de analítica de Ciclo de Vida del Corresponsal datos en acción. Esto incluye algunos consejos sobre las mejores prácticas en Ciclo de Vida Aliado el uso de datos en Servicios Financieros Ciclo de Vida del Cliente Negocios Digitales. A medida que el uso del panel de control de datos se vuelve cada vez más común, proporciona información sobre la creación y el contenido de los paneles de control. Desarrollar y Gestionar Riesgo & Cumplimiento Tareas de Producto Caso de Uso: Visualización del Operaciones Desempeño con Paneles de Control A menudo se dice que una imagen vale más que mil palabras. Así, encontrar una forma gráfica de representar datos es una manera poderosa de comunicar Facturación, Ingresos, Operaciones Técnicas Comisión información y tendencias rápidamente, lo cual es crítico para el monitoreo Conciliación del Dinero constante del desempeño del negocio y Electrónico crítico para identificar los riesgos antes que se materialicen. Los paneles de control bien estructurados, adaptados a varios grupos de usuarios, deben reflejar la demanda de las Figura 14: Tareas de Operaciones unidades de negocio y ayudarles a tomar decisiones más informadas. 54 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES Convertir los datos en gráficos y otras respecto a las cuentas de baja actividad • Ventas: Desempeño del corresponsal; formas de visualización facilitan la para reactivar al cliente y no dejar que desempeño del comerciante y del comunicación de la información revelada la cuenta se vuelva inactiva. Algunos de facturador; desempeño del equipo de y también ayuda a detectar tendencias y estos paneles de control permitirían a los ventas. anomalías en los datos. Muchas personas usuarios finales manipular los datos para • Operaciones: Gestión de liquidez de en la organización no tienen el tiempo visualizar varios cortes y segmentos de corresponsales. o los recursos para analizar los datos datos. A menudo, estos tipos de paneles de • Atención al Cliente: Estadísticas e ellos mismos; simplemente quieren las control se presentan en tiempo real en una información del call center. respuestas a las preguntas que les ayudarán pantalla grande en el espacio de trabajo a hacer su trabajo más eficazmente. del equipo para que todos lo puedan ver. • Operaciones Técnicas: Información Para el personal de campo, donde el acceso sobre operaciones técnicas. Un panel de control da una foto instantánea a Internet puede ser de calidad variable, de los KPIs relevantes para un departamento Las herramientas de gestión de datos los paneles de control en línea se pueden o para el negocio en general. Si raramente comercialmente disponibles han avanzado descargar y almacenar en caché localmente es necesario tomar medidas basadas en enormemente en los últimos años. para su uso en el campo. los datos reportados, las métricas de los Es probable que los paneles de control paneles de control probablemente son Otros paneles de control administrativos estándar estén disponibles como parte del incorrectas. Con el fin de diseñar paneles de proporcionan conclusiones a través del paquete de productos de los proveedores control robustos, es importante incorporar análisis de datos del día, la semana, el mes de tecnología. Con el fin de obtener las retroalimentación de los usuarios finales, o el año anterior y, por lo tanto, pueden conclusiones más profundas necesarias y con el fin de satisfacer sus necesidades entregarse de múltiples formas, incluidos hacerlo de una manera reproducible, hay dos específicas. Sin esta retroalimentación, informes, presentaciones o por un portal en enfoques estándar: los paneles de control podrían quedar línea. En consecuencia, cada departamento obsoletos y todos los esfuerzos para y equipo de proyecto necesita paneles de 1. Volver al Proveedor: A menudo hay desarrollarlos se desperdiciarían. Así, el control personalizados para las metas presupuesto disponible para que los desarrollo de los paneles de control es un e iniciativas del departamento. Por lo proveedores hagan cambios en los proyecto compartido entre los equipos general, como mínimo, las soluciones de paneles de control, pero las solicitudes de operaciones y de negocios, que podría SFD deben tener múltiples paneles de de varios departamentos y los clientes de pasar por varias iteraciones para recorrer control de operaciones que abarcan las varios proveedores que compiten por la el ciclo de retroalimentación de las diversas atención pueden conducir a problemas siguientes áreas, cada una de las cuales partes interesadas. de capacidad y retrasos. proporciona acceso basado en roles para Algunos paneles de control deben ser en audiencias específicas: Utilizar 2. Excel para Manipular tiempo real. Por ejemplo, un equipo de Informes sin Procesar Descargados • Riesgo: Fuga de ingresos; Préstamos de ‘Cubos de Datos’ del sistema: operaciones técnicas tiene que actuar en Mora (NPLs); conclusiones sobre Anti respecto de las alertas elevadas en tiempo Cuando se hace una pregunta al equipo Lavado de Activos (ALA); suficiencia de real: los gerentes de atención al cliente de soporte de decisiones de negocios, capital; detección de fraude. evalúan en forma activa los volúmenes de éste creará un del panel de control llamadas para asignar trabajo de equipo y • Finanzas: Percepciones de ganancias personalizado y entregará un informe o gestionar incidentes, los equipos de gestión y pérdidas; supervisión de dinero una presentación de PowerPoint con un de riesgo son informados constantemente electrónico. intento de respuesta. Esta es otra forma sobre los impagos, y los equipos de • Marketing: Información de los clientes y ad hoc de creación de paneles de control. ventas pueden tomar acciones tempranas tendencias para diversas ofertas. ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 55 1.2_APLICACIONES DE DATOS La última generación de herramientas de Informes de Operaciones Estándar de crear un informe, se debe identificar gestión de datos permite la libertad de Con el fin de mejorar sus negocios, los exactamente lo que quiere saber y investigar áreas de interés sin necesidad proveedores de Servicios Financieros confirmar que se tomarán medidas como de experiencia en manipulación de datos. Digitales están tratando de encontrar la resultado de obtener los datos. Sin embargo, las bases de datos respuesta a preguntas tales como: subyacentes deben diseñarse y optimizarse Los KPIs departamentales bien para desplegar y utilizar con éxito este tipo • ¿Cuál fue el volumen y el valor de la estructurados proporcionan a los equipos de herramientas. Cualquiera que sea el transacción? de operaciones una información a partir proceso de gestión de datos o el sistema de la cuál pueden medir el desempeño • ¿Cuántos clientes y corresponsales que se esté utilizando, éstos son los puntos frente a los objetivos. Ayudan a los equipos estaban activos? a tener en cuenta al crear un panel: a comprender lo que está sucediendo • ¿Qué ingresos hicimos? sobre el terreno y dónde existe el potencial 1. Piense en Contestar “¿Y qué?”: Los • ¿Cómo se compara esto con el mes de mejora. resultados deben ser accionables, no pasado y con el presupuesto? sólo ‘bueno saberlos’. Muchos paneles Los informes estándar de KPI sobre los • ¿Hay indicadores de riesgo fuera de de control sólo muestran el estado principales motores del negocio suelen rangos aceptables? actual del negocio y no dan contexto estar segmentados por área operativa. ¿Existen • transacciones inusuales Los KPI principales de cada área operacional de resultados anteriores o tendencias recurrentes, picos de actividad o respectiva se encuentran en la Tabla 3 basadas en el tiempo. cualquier anomalía que señale actividad a continuación. Decidir qué Pregunta se está 2. inusual? Respondiendo Antes de Empezar: A menudo, los informes son el vertedero El punto de partida es centrarse en los KPIs, para todos los datos disponibles, sean o métricas con objetivos cuantificables útiles o no. Este tipo de informes no que la estrategia operacional está contiene las métricas motivacionales tratando de conseguir y con relación a y las medidas que aumentan el qué tipo de desempeño se está evaluando. desempeño. Los KPI generales del negocio deben Diseñar el Informe para Contar 3. relacionarse directamente con los una Historia: Una vez que los datos objetivos estratégicos de la organización correctos son medidos y recopilados, y, como resultado, determinar los KPIs el informe debe contener información específicos de cada departamento. llamativa para llevar al lector a los Los datos más útiles son aquellos que puntos más importantes. Que sea visual, pueden convertirse en la información interesante y útil. necesaria para tomar decisiones. Antes 56 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES Departamento Temas de Prioridad para los KPIs Finanzas y Tesorería Ingresos, ingresos y gastos por intereses, comisiones y honorarios, cantidad retenida en depósito, volumen y valor de transacción, volumen de clientes y corresponsales (activos), costos indirectos y emisión de dinero electrónico para no bancarios, reconciliación de estados de cuenta bancarios. Ciclo de Vida de los Aliados Vinculación, niveles de actividad, resolución de conflictos, administración de desempeño, reconciliación Comerciales (comerciantes, y liquidación. facturadores, conmutadores, corresponsales, bancos aliados, otros PSP) Gestión del Ciclo de Vida del Cliente Administración de KYC, niveles de actividad, comportamiento transaccional, resolución de conflictos (servicio al cliente) y gestión de cuentas. Operaciones Técnicas Monitoreo del desempeño del producto, monitoreo de los niveles de servicio de los socios, gestión del cambio, integración de socios, resolución de fallos, administración de incidentes y gestión de acceso de usuarios. Riesgo Crediticio Estructura de riesgo del portafolio, préstamos en mora, bajas y pérdidas por riesgo, provisión de créditos. Riesgo Operacional y Cumplimiento Administración de riesgo operacional, monitoreo y seguimiento de actividades sospechosas, cumplimiento regulatorio, debida diligencia e investigaciones ad hoc. Ciclo de Vida de la Red de Vinculación, niveles de actividad, administración de conciliación del fondo de dinero electrónico y efectivo, Corresponsales (específicamente resolución de conflictos, administración de desempeño, conciliación y liquidación, y auditoría. de SFD) Otro Dependiendo de la naturaleza de los Servicios Financieros Digitales, pueden requerirse otros informes, por ejemplo, las organizaciones que ofrecen crédito realizarán calificaciones crediticias, recuperación de cartera y tareas relacionadas. Tabla 3: Principales KPIs por Área Operacional Dependiendo de la estrategia de negocio apoyo, ya que siempre existe la tentación pueden ser mejorados, pero generalmente y los objetivos departamentales, una de incluir datos periféricos, que no son no tienen que ser reportados a un público selección de los datos anteriores se estrictamente necesarios para entender la más amplio a menos que haya un punto presentan como los KPI del negocio salud de su departamento, dentro de los específico que se deba hacer. Un buen y sus departamentos. Éstos pueden, informes de administración. Esto puede ejemplo de esto es el enfoque que se ilustra idealmente, presentarse como paneles de distraer o dar lugar a una priorización a continuación con el uso de los paneles de control, o como un conjunto de informes. inadecuada. Los datos de apoyo son vitales control de MicroCred. Es importante que cada departamento para ayudar a entender los factores que segregue sus datos en KPIs y datos de impulsan los KPIs y determinar cómo ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 57 1.2_APLICACIONES DE DATOS CASO 5 MicroCred Utiliza Paneles de Control para Mejores Sistemas de Gestión Visualizaciones de Datos y Paneles de Control para el Desempeño Diario y el Monitoreo del Fraude MicroCred es una red de microfinanzas centrada en la inclusión financiera en África y Asia. En Senegal, opera un negocio de microfinanzas en crecimiento que ofrece servicios financieros a personas que carecen de acceso a bancos u otros servicios financieros. El alcance se ha extendido a todo el país mediante la creación de una red de más de 500 corresponsales de Servicios Financieros Digitales. Los dispositivos POS del corresponsal pueden realizar transacciones de venta de mostrador (Servicios Financieros en Mostrador) para pagos de facturas y remesas, y también facilitar el depósito y los retiros a cuentas de MicroCred. La confirmación de la transacción es proporcionada mediante un recibo vía SMS. A finales de 2016, casi un tercio de los clientes registraron su cuenta para usar el canal de corresponsales y más de un cuarto usaban activamente los puntos de venta de corresponsales para realizar transacciones. Esto generó importantes datos Figura 15: Ejemplo de Datos del Panel de Control de MicroCred operativos y de desempeño del canal. 58 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES MicroCred fue uno de los primeros • Actividad del corresponsal, con • Uso de sucursales de MicroCred vs. en adoptar los sistemas de gestión alertas para mostrar corresponsales corresponsales de datos de próxima generación, de bajo desempeño que no están Adopción y uso por parte del • adquiriendo e implementando BIME, haciendo transacciones cliente de SFD una herramienta de visualización para Actividad sospechosa y posibles • • Despliegue del canal de Servicios ayudar a optimizar las operaciones. alertas de fraude, como actividad Financieros Digitales Este sistema permitió a MicroCred inusual del corresponsal o del cliente • Evolución de los KPIs fundamentales desarrollar paneles de control interactivos, diseñados para responder • Monitoreo del proceso de inscripción frente a los objetivos a largo plazo a preguntas operativas específicas. a SFD, con énfasis en vinculaciones Con herramientas de visualización no exitosas MicroCred utiliza con mayor como BIME, es fácil crear gráficos Distribución geográfica • de las para ilustrar los datos operativos, lo frecuencia dos paneles de control: transacciones que facilita la detección de tendencias Paneles de Control de Operaciones y anomalías y la comunicación eficaz. Panel de Control Estratégico Mensual Diarias La implementación del sistema de Esto da una visión más estratégica Esto da una perspectiva diaria de los gestión de datos también presentó a más largo plazo y es utilizada portafolios de ahorros y préstamos, algunos desafíos, tanto técnicos como destacando cualquier problema. principalmente por el equipo culturales. MicroCred recomienda Presenta datos durante un período administrativo para visualizar medidas que se adopte un enfoque paso a paso, de tres meses, pero puede ajustarse de negocio críticas más complejas. comenzando con algunos paneles de de acuerdo con las necesidades Fue desarrollado para considerar el control básicos y construyendo con del usuario. Este panel de control comportamiento durante el ciclo de el tiempo paneles de control más utiliza alertas automatizadas para vida del cliente, incluyendo cómo el sofisticados. advertir al equipo de operaciones de uso del servicio evoluciona a medida posibles problemas. Los informes, que los clientes se familiarizan con la personalizados para los equipos tecnología y los servicios ofrecidos. operativos, incluyen medidas tales También es posible realizar fácilmente como: análisis ad hoc para dar seguimiento • Seguimiento de KPIs, incluyendo a cualquier pregunta planteada por volúmenes de transacciones, los datos presentados en el panel de comisiones y cargos control. Se enfoca en: Las herramientas de visualización y los paneles de control interactivos se pueden integrar en los sistemas de gestión de datos y proporcionar informes dinámicos adaptados que sirven para el monitoreo de operaciones, gestión y desempeño estratégico. ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 59 1.2_APLICACIONES DE DATOS Datos Utilizados en Paneles ingresos y el siguiente es potencialmente Digitales exitosos, ya que requiere una de Control neutral en términos de costos - y debido intervención práctica regular de un equipo Hay dos niveles principales de registro a sus implicaciones para la estrategia de de ventas de campo, así como un soporte de datos necesarios para desarrollar marketing. de operaciones de back-office. Puede los paneles de control: transacción y de ser problemático difundir información, Datos de los Clientes porque el equipo y los corresponsales cliente. Atienden a diferentes objetivos, pero ambos son importantes. Tener un identificador de cliente único es están geográficamente dispersos con crucial, especialmente cuando el panel de distintos niveles de conectividad y suelen Datos de Transacción control está obteniendo datos de múltiples estar equipados con tecnología básica. Los datos de transacción se caracterizan aplicaciones. A través de la integración de Sin embargo, sus necesidades de datos son por su alta frecuencia y heterogeneidad. datos, los proveedores pueden controlar muchas. Los administradores de relaciones, Sin embargo, los proveedores de la integridad de los datos y así garantizar los agregadores y los corresponsales con Servicios Financieros Digitales deben múltiples puntos de venta en múltiples la calidad del registro de datos, lo cual tratar de estandarizar la tipología de localidades necesitan información sobre es necesario para el seguimiento de la transacciones con el fin de rastrear la el desempeño y la administración de la concentración del portafolio, el cálculo de la rentabilidad del producto, monitorear conciliación. Los trabajadores de la fuerza penetración del producto, la venta cruzada y analizar el comportamiento de los de ventas de campo que rara vez regresan a y la cobertura del personal de ventas y el clientes (y corresponsales) y elevar las la oficina necesitan acceder a la información análisis de otras métricas importantes. alertas tempranas de bajo desempeño remotamente. El corresponsal necesita Generalmente hay dos grupos grandes de o baja actividad de cuentas. Los tipos información sobre su propio desempeño datos que tienen que ser grabados a nivel de de transacciones deben ser claramente en términos de transacción y conteo de cliente: demográfico y financiero. Las listas diferenciados y deben ser fácilmente clientes, volumen de negocios, eficiencia completas de métricas de datos se pueden identificables en la base de datos, incluso de ventas (conversión) y rentabilidad. encontrar en el Capítulo 1.2. La combinación Potencialmente, será útil la información cuando las transacciones parecen de datos a nivel de transacciones y de sobre los servicios de reposición de efectivo técnicamente similares. Por ejemplo, una causa común de confusión ocurre cuando clientes puede proporcionar información disponibles, particularmente en mercados hay múltiples maneras de obtener fondos útil sobre el comportamiento de ciertos donde los corresponsales pueden en una cuenta de cliente, como P2P segmentos de clientes y puede conducir a proporcionar servicios de conciliación entrante, pagos masivos o crédito, pero una gestión óptima del desempeño. de dinero electrónico y servicios de todos los datos se combinan y simplemente administración de efectivo entre sí. Caso de Uso: Gestión del se reportan como “depósitos”. Estos tres En los mercados con aliados independientes Desempeño del Corresponsal de gestión de efectivo, los corresponsales tipos de transacciones deben tratarse por separado debido a su impacto muy La gestión de corresponsales es también deben disponer de datos sobre diferente en los ingresos - uno es un probablemente el reto más importante los niveles del fondo de dinero electrónico costo directo, el otro es una fuente de para proporcionar Servicios Financieros y efectivo. 60 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES La gestión de desempeño del corresponsal que entre 200 y 600 clientes activos por Cómo Identificar los necesita datos granulares, vinculados cada corresponsal activo son óptimos para Corresponsales más Débiles directamente a los equipos responsables los proveedores de Servicios Financieros En la mayoría de los mercados, alrededor de la gestión de los puntos de venta. Los Digitales, dependiendo de las condiciones del 80 por ciento de los corresponsales datos de desempeño del corresponsal del mercado. Una tarea clave de ventas están activos. Esto significa que los clientes tienen que segmentarse fácilmente es monitorear los datos del corresponsal que deseen realizar transacciones con de la misma manera que el equipo de y del cliente, controlando el crecimiento y el otro 20 por ciento de corresponsales ventas está estructurado; cada sección la ubicación de los puntos de venta de los probablemente no podrán hacerlo porque corresponsales para asegurar que estén y cada individuo pueden ver su propio no hay fondos suficientes o el corresponsal en línea con la actividad del cliente. desempeño. Esta es la base para establecer está ausente. Los corresponsales de bajo objetivos de desempeño que pueden ser Cómo Identificar a los desempeño tienen que ser llevados a un evaluados y recompensados con precisión. Corresponsales más Fuertes nivel aceptable, o si esto resulta imposible, En el siguiente ejemplo, tanto los equipos ser retirados del servicio. Debido a que la Los corresponsales de calidad deben como las personas responsables de cada falta de liquidez del dinero electrónico ser recompensados por sus esfuerzos. nivel de la jerarquía de corresponsales, tiene una fuerte correlación con el Los incentivos, incluidas las actividades desde el director de ventas hasta los incumplimiento, una métrica clave utilizada de marketing y extra cupo, o bonos representantes de ventas del distrito, a menudo para el análisis del desempeño relacionados con el desempeño, pueden necesitan datos precisos y oportunos del corresponsal es el número de días en basarse en estos datos. Tener objetivos relacionados directamente con sus personalizados de corresponsales basados que no disponen de stock por mes (es decir, responsabilidades. La información más útil en las condiciones del mercado local, y niveles de conciliación por debajo de un que se puede dar al equipo de ventas se tener una manera de mostrar claramente valor de umbral). refiere a los corresponsales por los que son al corresponsal cómo se desempeña responsables. comparado con sus propios objetivos y Este tipo de analítica de datos de sus pares, puede ser muy poderoso. Los corresponsales es muy eficaz, pero Cobertura de Brechas bastante detallado y a menudo se realiza objetivos incluyen la liquidez y la actividad de Corresponsal manualmente, lo que puede ser lento e del cliente. Una característica clave de No hay respuestas definitivas para un buen corresponsal es que rara vez se intensivo en mano de obra. Proporcionar al el número óptimo de corresponsales les acaba el dinero electrónico o efectivo equipo de ventas herramientas de gestión necesarios para que cada cliente tenga en caja. Los objetivos del agregador de de datos automatizadas que pueden un acceso razonablemente fácil a un corresponsales debe basarse en la actividad utilizar en el campo, así como métricas corresponsal y para que cada corresponsal de gestión de liquidez, para cuyo apoyo se de desempeño personalizadas, puede ser tenga suficientes clientes para generar un le contrató, así como en el desempeño de muy eficaz. El estudio de caso de Zoona a ingreso aceptable. La investigación indica su equipo de corresponsales. continuación demuestra bien estos puntos. ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 61 1.2_APLICACIONES DE DATOS CASO 6 Zoona Zambia - Optimización de la Gestión de Desempeño del Corresponsal Cultura de Datos: Un Enfoque Integrado Basado en Datos para Productos, Servicios y Generación de Informes Zoona es el proveedor líder de de corresponsales para identificar la ubicación de los competidores en Servicios Financieros Digitales en qué configuraciones maximizan el estas rutas. Zambia, que ofrece transacciones de crecimiento del negocio. Factores servicios financieros en mostrador a como el número de clientes atendidos Ciclo de vida del Corresponsal través de una red de corresponsales por día por corresponsales existentes Un corresponsal relativamente Zoona dedicados. Los servicios de y tiempo de espera se utilizan para nuevo en una carretera principal corresponsales incluyen: registro de determinar la demanda local y puede no ser tan productivo clientes, envío y recepción de pagos el potencial de crecimiento hasta como un corresponsal maduro en de remesas, suministro de depósitos que se alcance la saturación. Para un mercado activo, debido a la o retiros en efectivo para cuentas asegurar la fiabilidad, los escenarios ubicación y que el corresponsal y desembolso de pagos masivos de modelados son referenciados con maduro haya desarrollado una base terceros, tales como salarios y pagos los inputs del equipo de ventas de de clientes leales. Sin embargo, un de G2P. Zoona tiene una cultura campo, que tiene conocimiento local servicio robusto de SFD necesita empresarial basada en datos y de la zona y los puntos de venta bajo corresponsales en ambas ubicaciones cuenta con un equipo centralizado de la mayor presión. En ubicaciones - y los objetivos establecidos para analistas de datos para perfeccionar clave, el equipo también usa Google cada corresponsal deben ser realistas constantemente la sofisticación y la Maps y camina físicamente por y alcanzables. Zoona analiza los datos eficacia de sus servicios y operaciones. las calles, observando el nivel de actividad y dónde pueden estar los de los corresponsales para proyectar Ubicación del Corresponsal puntos calientes potenciales. Por las expectativas de desempeño futuro Zoona ha desarrollado un ejemplo, miles de personas pueden de los segmentos de corresponsales, simulador interno para determinar llegar a una estación de autobuses, como urbano y rural, produciendo la ubicación óptima de los quioscos luego se dispersan en varias curvas de “desempeño en el tiempo” de corresponsales. El enfoque direcciones; Zoona traza las rutas para cada corresponsal, hasta utiliza simulaciones20 Monte más populares, creando corredores el nivel del suburbio. Estos son Carlo para probar millones de donde es probable encontrar clientes compatibles con los KPIs de gestión escenarios posibles de localización potenciales. Zoona también mapea de corresponsales. 20 Las simulaciones Monte Carlo toman muestras de una distribución de probabilidad para cada variable para producir miles de resultados posibles. Los resultados se analizan para obtener probabilidades de los diferentes resultados que se producen. 62 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES Gestión de Liquidez Los corresponsales requieren una fuente de liquidez cómoda para atender las transacciones, por lo que se incluye en los escenarios de ubicación la proximidad a los bancos cercanos o cajeros automáticos (ATM). La dificultad para reponer el fondo también puede deberse a una sobreconcentración de corresponsales, que colectivamente cargan las fuentes del fondo cercanas y socavan el valor de la red de corresponsales locales. Las simulaciones de Zoona miran ambos escenarios como parte de la optimización. Además, entendiendo que la conciliación del corresponsal es un factor clave en el desempeño, Zoona está pilotando una solución innovadora para recoger los saldos de efectivo y fondos de dinero electrónico de un corresponsal para ayudar a los corresponsales a administrar su conciliación de manera más eficaz. Esto proporciona a los corresponsales acceso a herramientas de administración de desempeño, que se desarrollan utilizando la herramienta de visualización de gestión de datos Qlikview. Este proporciona a Zoona datos que los corresponsales podrían no querer informar. Las analíticas pueden soportar muchos aspectos de las operaciones y desarrollo de producto: optimización de la ubicación de corresponsales, administración de desempeño y herramientas que crean incentivos para el informe voluntario de datos. Una cultura empresarial basada en datos impulsa la integración. ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 63 1.2_APLICACIONES DE DATOS Administración de Back Office del pero con requerimientos regulatorios Establecer • nuevos objetivos de Corresponsal diferentes (y no necesita administración de desempeño e incentivos El equipo de back office del corresponsal es conciliación). En consecuencia, las métricas • Enviar solicitudes de servicio del responsable de todas las tareas necesarias claves que necesitan son similares a las corresponsal y consultas directamente al de los corresponsales, pero con algunos para configurar nuevos corresponsales y equipo de operaciones procesos de negocio y objetivos diferentes. administrar sus interacciones con SFD en • Capturar potenciales interesados para curso. A menudo, esto también incluye Optimización de la Eficiencia del nuevas locaciones de puntos de venta de obtener los datos necesarios por el equipo de Corresponsal corresponsales ventas (arriba). Para ser eficaces, necesitan Los datos pueden ser utilizados con mayor una gran cantidad de datos, incluidos los El acceso a este tipo de datos puede eficiencia por los equipos de gestión de informes estándar y el acceso a los datos resultar en corresponsales más motivados corresponsales cuando tienen acceso móvil para ejecutar informes ad hoc centrados y exitosos, así como mejorar el desempeño y en línea a estos datos. Algunas de estas en consultas específicas. Además de general del negocio de SFD. Se pueden tareas incluyen: proporcionar los datos del equipo de ventas, abordar preguntas importantes como: también deben medir el tiempo que demoran • Planificación de la carga de trabajo ¿Cuánto fondo de dinero electrónico sus procesos de negocios, para asegurar necesitan los corresponsales? Con el fin • Registro de entradas y salidas de los que su equipo tenga capacidad de cumplir puntos de venta del corresponsal en las de administrar efectivo y fondos digitales, contra los niveles de servicio internos. Esto visitas de campo es útil comprender los momentos más se logra midiendo los problemas planteados • Actualizar o verificar la ubicación y otra ocupados del día, la semana y el mes, por tipo y volumen, y midiendo el tiempo de información demográfica del punto de y proporcionar orientación sobre los resolución de conflictos, a menudo a través venta requerimientos de fondos esperados. de un sistema de tickets. También es útil tener indicadores en el • Mostrar estadísticas de desempeño Back Office para Aliados sistema de tal manera que, si el fondo personalizados al corresponsal de Negocio directamente al llegar de un corresponsal cae por debajo de un nivel mínimo, la persona responsable de la Para efectos de la administración del back • Mostrar comisión percibida tanto hasta office, se pueden combinar varios tipos gestión del fondo del corresponsal reciba la fecha como en el mes de aliados de negocios no corresponsales. una alerta automatizada. En operaciones • Mostrar los ingresos percibidos de Estos incluyen facturadores y otros PSP, más sofisticadas, los algoritmos se pueden los clientes que el corresponsal está comerciantes, organizaciones que usan el utilizar para predecir proactivamente atendiendo SFD para propósitos de administración de cuántos fondos necesitará cada • Permitirles agregar fotos a la base de corresponsal cada día y para aconsejarles negocios, incluyendo pagos de nómina y datos acerca del balance óptimo inicial antes de otros pagos masivos, y otras Instituciones Financieras, incluyendo bancos y • Rellenar directamente las medidas comenzar a comercializar o después del proveedores de SFD. El equipo de back básicas de la encuesta de corresponsales cierre de transacciones. Esto también se office de administración de aliados de de Garantía de Calidad (QA) puede hacer para la cantidad de efectivo negocio es responsable de tareas similares • Notificar que la información de KYC está que el corresponsal deba tener a mano a la administración de corresponsales, en tránsito para atender retiros. 64 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES CASO 7 FINCA DRC – Cómo es Un Corresponsal Exitoso y Cómo Poner los Resultados en Marcha Recopilación de Datos: Optimización del Proceso para Tener Mejor Información y Una Implementación Exitosa Con una tasa de penetración expansión. Más aún, la disponibilidad • Datos Transaccionales de bancaria apenas por debajo del 11 de una red de corresponsales exitosa Corresponsales: Estos datos por ciento, la RDC tiene una de las que los clientes pueden utilizar incluyen información sobre el tasas más bajas de acceso financiero para pagar convenientemente sus volumen y número de transacciones en África. En 2011, la institución préstamos ayuda a FINCA DRC a de depósito, retiros y transferencia microfinanciera FINCA DRC reducir su riesgo de cartera. realizadas por corresponsales introdujo su red de corresponsales, individuales. El modelo predictivo definió empleando propietarios de pequeños “corresponsales exitosos” tanto en negocios para ofrecer servicios La disponibilidad de datos y la calidad términos de números de transacciones bancarios. La red de corresponsales de los mismo fueron los principales como en volúmenes más altos. creció rápidamente, y en el momento desafíos en el desarrollo del modelo Los datos para el modelo lineal en que comenzó la recopilación de de desempeño de los corresponsales. generalizado (MLG) provienen de datos de corresponsales en 2014, Los datos digitalizados son necesarios tres fuentes principales: recibía más del 60 por ciento para las fuentes que normalmente de las transacciones totales de Formularios de Solicitud de • sólo se recopilan en papel, como la FINCA DRC. Para el año 2017, Corresponsales: Estos proporcionan aplicación de los corresponsales y las transacciones de corresponsales información sobre los datos del formularios de monitoreo. Los datos habían crecido hasta el 76 por negocio y sociodemográficos del que faltan deben minimizarse, tanto ciento del total de transacciones. Sin propietario. para que los conjuntos de datos sean embargo, el crecimiento se concentró Formularios de Monitoreo de • más robustos como para permitir la principalmente en la capital del país, Corresponsales: Los oficiales fusión de conjuntos de datos mediante Kinshasa y en uno de los centros de FINCA DRC monitorean campos de metadatos coincidentes. comerciales del país, Katanga. FINCA regularmente a los corresponsales, DRC buscó expandir la red a áreas Esto requiere la estandarización de recopilando información sobre rurales y así construyeron un modelo datos recopilados por diferentes el efectivo y fondo electrónico predictivo para identificar los criterios personas, que pueden estar utilizando del corresponsal, la condición del que definen a un corresponsal exitoso. almacén, los datos de sentimiento diferentes métodos de recopilación. Los resultados se incorporaron sobre la interacción del cliente La falta de datos consistentes puede a las encuestas de reclutamiento con el corresponsal y el branding conducir a una reducción significativa de corresponsales, ayudando a del producto FINCA DRC. de la muestra, socavando la precisión FINCA DRC a seleccionar buenos Esto se compila en una calificación y el desempeño de predicción del corresponsales para las áreas de de monitoreo. modelo. ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 65 1.2_APLICACIONES DE DATOS Los corresponsales exitosos en como un criterio clave, revelando la República Democrática del otra oportunidad de investigación. Congo se identifican por los Como un estudio de seguimiento, siguientes criterios estadísticamente FINCA DRC e IFC utilizarán una significativos: ubicación geográfica, metodología RCT para identificar la sector del negocio principal de un ubicación óptima del corresponsal. corresponsal, género del corresponsal y si reinvierten los beneficios. Los corresponsales de propiedad de mujeres son, por ejemplo, un 16 por ciento más rentables con su negocio de corresponsales que los negocios de sus contrapartes masculinas; el valor de su inventario de negocios es un 42 por ciento más alto. También se encontró que devuelven más dinero al inventario del negocio, en lugar de guardarlo en una cuenta bancaria que da poco interés. Esto dio como resultado un promedio total de transacciones un 5 por ciento más alto mensualmente. Estos resultados se implementaron para mejorar y agilizar el proceso de selección de corresponsales, lo que en última instancia ayudó a expandir la red hacia las zonas rurales mediante la incorporación de factores en las encuestas de corresponsales y la estrategia de despliegue. Para 2016, la red de corresponsales había crecido hasta albergar el 70 por ciento del total de transacciones. El modelo identificó la ubicación Comparar los datos de los perfiles de los corresponsales con las métricas del corresponsal puede resaltar las características clave que conducen a un mejor desempeño del corresponsal. La integración de estos aprendizajes con los procesos de gestión y direccionamiento de corresponsales garantiza el aprovechamiento completo de los datos para la gestión de desempeño. 66 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES Caso de Uso: Administración del para recopilar información de apertura y retroalimentación pueden digitalizar Back Office de cuenta. Múltiples errores que se los cierres de cuentas. Las analíticas producen a lo largo del proceso de la avanzadas, que se describen en el capítulo Automatización de Procesos digitación manual obligan a que estos anterior y las cuales pueden incluir la A pesar que los proveedores de Servicios formularios atraviesen múltiples ciclos de generación de prospectos para campañas Financieros Digitales están poniendo reelaboración. Eventualmente, después de ventas o gestión multicanal, pueden mucho esfuerzo en el desarrollo de de pasar por un proceso de verificación utilizarse para descubrir oportunidades automatización de front-end (móviles, de varios pasos, la información clave se y riesgo no explotados dentro de la banca en línea), algunos todavía luchan registra en el sistema manualmente por el cartera. Una vez identificadas, las para desarrollar funciones de back- front o middle-office, creando una carga notificaciones automatizadas pueden end altamente automatizadas. Tareas adicional sobre el personal y causando una enviarse directamente al personal de front- automatizadas que pueden ayudar a las repartición de tiempo ineficiente. Estos office o directamente a los clientes. Por operaciones de back-office - tales como formularios luego tienen que guardarse ejemplo, para la prevención de la rotación, la suscripción y originación de créditos, en almacen físico y mantenerse durante los clientes que se acercan al estado el procesamiento de transacciones y la cierto período de tiempo. Racionalizar y inactivo pueden recibir mensajes de texto conciliación automatizada - tienen un simplificar el proceso de recopilación de o correos electrónicos de reactivación. Los valor tremendo. Los proveedores están datos a través de la interfaz de front-end prestatarios pueden recibir notificaciones ahora avanzando hacia la automatización y mediante un sistema de controles de sobre los próximos pagos o productos robótica de los procesos simples y datos incorporados aumenta la eficiencia y de mejor precio disponibles para la repetidos, que pueden ser llevados a reduce los costos laborales. Por supuesto, refinanciación. Algunas funciones que cabo de manera mucho más barata y con el fin de registrar los datos de una requieren intervenciones humanas, tales precisa por las máquinas que por los seres manera robusta, la arquitectura de TI debe como el análisis financiero y de negocios humanos. De acuerdo con AT Kearney, ser lo suficientemente fuerte como para y la gestión de relaciones personales, la Automatización Robótica de Procesos clasificar correctamente, corroborar y complementarán y se beneficiarán del (RPA) hace operaciones en promedio 20 almacenar datos. proceso automatizado. veces más rápido que los seres humanos El procesamiento de datos puede ser Supervisión del Riesgo y e incluye beneficios del 25 al 50 por ciento automatizado en casi todas las etapas Cumplimiento Regulatorio de ahorro de costos para los que los adoptan.21 Varias áreas de automatización de la relación con el cliente. Establecer Después de la crisis financiera de 2008, generalmente se pueden agrupar en la pasos estándar de verificación que los reguladores nacionales han estado automatización del registro de datos y el puedan acelerar la apertura de cuentas ajustando continuamente la regulación procesamiento de datos. y cambios de cuentas, y las decisiones de la industria financiera para proteger crediticias para ciertos segmentos se tanto a los clientes como a la industria en El enfoque principal del registro de datos pueden activar por medio de modelos general. El aumento de los requisitos de radica en la digitalización de flujos de de scoring probados, bien estructurados. capital, liquidez y transparencia imponen trabajo hechos en papel. Observamos Además, los mapas de calor para acción una pesada carga a la industria financiera que muchos proveedores todavía usan pueden automatizar los desembolsos, y regulada, al tiempo que crean una ventaja formularios de solicitud hechos en papel los formularios automatizados de solicitud competitiva para los actores no regulados, 21 ‘Robotic Process Automation: Fast, Accurate, Efficient’, A.T. Kearney, consultado Abril 3 de 2017, https://www.atkearney.com/financial-institutions/ideas-insights/robotic-process-automation ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 67 1.2_APLICACIONES DE DATOS como los proveedores de tecnología Este repositorio unificado también permite falsa - mientras se evitan o reducen financiera. En consecuencia, los bancos al proveedor de SFD ejecutar análisis los riesgos operativos y financieros. tienen que presupuestar mayores costos de escenarios y pruebas de estrés para Las nuevas intervenciones y regulaciones de cumplimiento para cumplir con los cumplir con los requisitos reglamentarios. sobre ciberseguridad requerirán que requisitos reglamentarios. Los informes El cumplimiento regulatorio incurre en los proveedores de SFD desarrollen y regulatorios requieren reunir datos de costos directos a través del mayor costo del mantengan herramientas que apuntan diversos sistemas, entre ellos: contabilidad capital, así como de los costos indirectos, a proteger contra amenazas externas y financiera, sistema de contabilidad, tales como el establecimiento de procesos posibles actividades delictivas. Mantener tesorería, monitoreo de la calidad de los de informes, la repartición del tiempo del y agregar los datos apropiados necesarios activos y bases de datos de cobro, entre personal y, en algunos casos, la inversión en para construir modelos de prevención otros. Las pruebas de estrés periódicas tecnología nueva. del fraude y del riesgo operacional puede requieren una sólida infraestructura de TI reducir la exposición del proveedor de SFD. con una alta capacidad para almacenar Prevención del Fraude La transmisión y procesamiento de datos y procesar grandes cantidades de datos. Con las tendencias globales avanzando en tiempo real les permite detectar fraudes Además, el cumplimiento de los requisitos hacia la computación en la nube, la gobierno con mayor rapidez y precisión, reduciendo de KYC requiere datos reales para la toma y la protección de datos se vuelven cada así los posibles riesgos de pérdidas. Por de decisiones oportunas y seguras. Los vez más importantes. Los proveedores de ejemplo, si las tarjetas de crédito o de datos necesarios para medir y monitorear SFD tienen que prestar mayor atención débito de un cliente se utilizan desde una los riesgos de mercado, crédito, AML, y al comportamiento transaccional de ubicación geográfica inusual o con una liquidez están idealmente alojados en un los clientes. También deben efectuar frecuencia inusual, los proveedores de SFD repositorio unificado para permitir que cumplimiento con KYC para detectar pueden alertar al cliente y potencialmente un proveedor de SFD tenga una visión posibles actividades fraudulentas - tales bloquear el procesamiento de estas completa del riesgo en toda su cartera. como el lavado de dinero y la identidad transacciones sospechosas. Seguimiento de Datos para Detección de Fraude En el contexto de los proveedores de Servicios Financieros Digitales que ofrecen servicios P2P, los proveedores pueden utilizar una variedad de herramientas para determinar si las transacciones se depositan de forma fraudulenta en la cuenta de otra persona con el fin de evitar cargos. En lugar de usar su propia cuenta y pagar cargos, los clientes pueden iniciar una transferencia P2P pagada desde la cuenta de otra persona. La velocidad de transacción puede dar una indicación básica; si el dinero se deposita en una cuenta y luego se retira de nuevo en un período muy corto de tiempo, hay una buena probabilidad de que se trate de un depósito directo. La ubicación de la transacción da una indicación aún mejor porque si la ubicación de los corresponsales que realizan el depósito y el retiro se encuentra a cierta distancia, es improbable, o incluso imposible, que el cliente pudiera haber viajado entre esos puntos en el intervalo entre las transacciones. Debe ser posible generar alertas para este tipo de comportamiento, y los corresponsales que hacen cantidades inusualmente altas de depósitos directos se les puede dar seguimiento. Esto no capturará las transacciones entre clientes que viven cerca, así que muchos proveedores de SFD también realizan investigación de comprador secreto para entender mejor los niveles de depósitos directos. 68 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES Caso de Uso: Gestión de Definir patrones de ‘comportamiento tales como la falta de corresponsales, Interacción con el Usuario normal’ es fundamental para la gestión límites restrictivos de transacciones y La gestión de los clientes a lo largo del de riesgo. Los patrones de actividad que tiempos de espera de transacción cortos. ciclo de vida, fomentar un mayor uso, y el se desvían de las normas acordadas, Es importante, entonces, recopilar datos manejo de nuevos comportamientos se en particular los datos transaccionales y estadísticos sobre las llamadas recibidas, encuentra dentro del alcance del equipo de uso de servicios, deben generar alertas. incluidas las quejas y sugerencias. de marketing. Sin embargo, también hay Estos patrones deben ser revisados para El aprovechamiento de este tipo de datos un aspecto operacional de la gestión de determinar si el comportamiento atípico se ejemplifica en el Caso 8 a continuación. clientes que es sobre todo motivo de era legítimo, o era un posible caso de preocupación para los equipos técnicos, fraude. Además del comportamiento de El monitoreo del número de llamadas de servicio al cliente, y riesgo. Estos equipos los clientes y los corresponsales, también a medida que el servicio crece ayuda a son responsables de asegurar que la es aconsejable perfilar la ‘actividad normal’ determinar cuántos asesores de call center interacción del usuario, según fue diseñada, de las interacciones de los empleados en son necesarios. Para algunos servicios esté detectando y arreglando cualquier el sistema. Por ejemplo, ¿hay un empleado de alta demanda, sólo una proporción problema. También son responsables de mirando significativamente más registros de las llamadas presentadas realmente gestionar la interacción del usuario para de clientes que un empleado ‘normal’ en llegan a una línea de atención al cliente. clientes empresariales y usuarios internos. el mismo rol, o está entrando al sistema En este caso, los intentos de llamadas fuera de sus patrones normales de turno? frente a las llamadas presentadas son A este respecto, es importante definir el uso Esta actividad anormal podría apuntar a una cifra importante, ya que esto indica y el comportamiento esperado ‘normal’ del una actividad fraudulenta potencial. un problema importante o niveles de sistema, de manera que se puedan hacer pronósticos tanto para la planificación personal inadecuados. Los problemas Mejoras en la Eficiencia del técnica como para la comercial. de call center más frecuentes son PINES Servicio al Cliente Las medidas suelen establecerse de arriba olvidados, teléfonos o tarjetas perdidos, Los equipos de servicio al cliente en los call hacia abajo, como metas mensuales de transacciones enviadas a los destinatarios centers son los empleados más cercanos al negocios y objetivos estratégicos. Dicho equivocados y códigos de comprobantes cliente de SFD en el día a día. Debido a esto, esto, algunas métricas de resultados deben perdidos. El número de llamadas que se pueden proporcionar una alerta temprana recogerse de ‘abajo hacia arriba’, tales como pueden realizar depende de la velocidad las mediciones del uso promedio de un de cualquier problema importante que del sistema de back-office y de la rapidez servicio. Como se comentó anteriormente, pueda surgir. A menudo, serán los primeros con la que pueda responder al resolver el uso de promedios puede ser engañoso, en enterarse de un fallo del sistema o comportamiento fraudulento de un el problema. Como los costos del call y el comportamiento puede tener que corresponsal, por lo que se requiere un center son generalmente altos, los datos dividirse en sectores, y luego juntarse en proceso para alertar al equipo apropiado que proporcionan deben ser utilizados una ‘vista promedio’ de actividad contra la de cualquier problema potencial basado en para acelerar el proceso de resolución de cual se puedan elaborar planes. Por ejemplo, el equipo técnico necesita saber tanto el la información (comprobada la precisión) conflictos e incrementar el número de número esperado de transacciones por recibida de los clientes. Es probable llamadas que cada representante puede día como también los períodos de máximo que estos equipos también se enteren tomar. Estos datos también se pueden uso probable para poder garantizar que el de problemas menores que afectan utilizar para mejorar la experiencia sistema pueda hacer frente a estos puntos al servicio impidiendo que los clientes del usuario y de esta manera lograr que el de máximo uso. realicen transacciones de manera óptima, cliente cometa menos errores. ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 69 1.2_APLICACIONES DE DATOS CASO 8 Safaricom M-Pesa - Uso de KPIs para Mejorar el Servicio al Cliente y los Productos Uso de Analítica de datos para Identificar los Cuellos de Botella Operacionales y Priorizar las Soluciones M-Pesa en Kenia fue el pionero de cliente podría erosionar rápidamente los datos de llamadas de PABX y los los Servicios Financieros Digitales la confianza. Las métricas basadas en registros de resolución de problemas a gran escala, con 20.7 millones datos ayudaron al equipo a planificar y se encontró lo siguiente: de clientes, una base activa de y guiar las operaciones en forma apropiada. • Duración de Llamada: La duración treinta días de 16,6 millones,22 e media de la llamada fue de 4.5 ingresos reportados en 2016 de Como la adopción de servicios minutos, alrededor del doble del $4.5 billones.23 Cuando Safaricom fue inesperadamente alta desde el tiempo presupuestado para cada lanzó el servicio en 2007, no había llamada. principio, el número de llamadas al plantillas ni mejores prácticas; todo call center fue en consecuencia mucho Temas Clave para Resolución • fue diseñado desde cero. La mejora mayor de lo previsto, dando lugar Rápida: Los dos tipos de llamadas continua de la operación fue esencial a un gran volumen de llamadas sin clave a abordar para la optimización a medida que el servicio escalaba. respuesta. Este problema estableció eran los clientes olvidando el PIN La adopción del servicio fue un KPI que el equipo de atención y los clientes enviando dinero al inesperadamente alta desde el inicio, al cliente necesitaba para resolver a número de teléfono equivocado; niveles aceptables. esto cubrió del 85 al 90 por ciento con más de 2 millones de clientes en su primer año, superando las previsiones de las llamadas largas que llegaban El problema se abordó primero al call center. en un 500 por ciento. Esta creciente mediante la contratación de personal demanda obligó a una rápida adicional, pero la contratación por El análisis logró dos cosas. escalada y las operaciones necesarias sí sola no podía seguir el ritmo del En primer lugar, los cuellos de para anticipar proactivamente aumento del número de clientes. botella se identificaron con éxito, los problemas de escalada en la Para identificar cuellos de botella y resultando en información clave tecnología y los procesos de negocios, priorizar las soluciones, el equipo para operaciones. En segundo ya que una mala experiencia del analizó sus datos. Se examinaron lugar, otras cuestiones operacionales 22 Richard Mureithi, ‘Safaricom announces results for the financial year 2016’. Hapa Kenya, 12 de mayo de 2017, consultado el 3 de abril de 2017, http://www.hapakenya.com/2016/05/12/safaricom-announces-results-for-the-financial-year-2016/ 23 Chris Donkin, ‘M-Pesa continues to dominate Kenyan market’. Mobile World Live, Enero 25 de 2017, consultado el 3 de Abril de 2017, https://www.mobileworldlive.com/money/news-money/m-pesa-continues-to-dominate-kenyan-market/ 70 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES fueron descubiertas, principalmente, el grado en el que los clientes erróneamente enviaron dinero y se olvidaron de sus pines. De esta manera, gestionar frente al KPI de Llamadas No Contestadas generó beneficios operativos más amplios. Utilizando los resultados analíticos, operaciones implementó una estrategia de resolución. Primero, al entender los tipos de problemas largos frente a los cortos, los problemas difíciles se podían identificar y pasar rápidamente a un equipo de back- office. Esto redujo los tiempos de espera y los cuellos de botella para los clientes, permitiendo procesar más clientes por día. En segundo lugar, los equipos de operaciones y desarrollo de productos trabajaron para reducir los tiempos en todos los tipos de llamadas. Esto se logró mejorando la infraestructura técnica y el interfaz de usuario, mitigando los problemas que causaron llamadas largas. La combinación de iniciativas redujo el KPI de Duración de Llamada y el KPI de número de Llamadas No Contestadas, cambiando ambos a niveles aceptables a pesar de que los números de clientes siguieron creciendo más allá de los niveles previstos. La gestión por KPIs es un elemento crítico de las operaciones. El análisis detallado de los datos detrás de los KPI puede ayudar a identificar cuellos de botella operacionales e incluso revelar otros factores operacionales que impulsan las métricas más allá de los umbrales. Entender los datos que impulsa un KPI puede hacerlo más útil. ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 71 1.2_APLICACIONES DE DATOS Caso de Uso: Datos de Operaciones cuándo se necesitará capacidad adicional Los Servicios Financieros Digitales exitosos Técnicas del sistema. Tanto si el sistema es externo tienen una buena comunicación entre los Por su propia naturaleza, un SFD tiene o si es un desarrollo interno, es importante equipos comerciales y técnicos. El equipo que el equipo técnico supervise los niveles que estar disponible las 24 horas del día, comercial debe discutir proactivamente de servicio y las tendencias de capacidad, siete días a la semana, y normalmente sus planes de marketing y pronósticos, planificando acciones correctivas. Los está diseñado para procesar grandes así como cualquier actividad competitiva datos clave normalmente requeridos volúmenes de interacciones del sistema, con el fin de preparar al equipo técnico incluye disponibilidad del sistema, tiempo tanto financieras como no financieras. de inactividad esperado y no esperado, para posibles cambios de volumen. Por esta razón, el servicio debe ser volumen de transacciones y capacidad Se necesitan reuniones regulares monitoreado proactivamente tomando máxima y sostenida. (al menos trimestralmente) para revisar los medidas preventivas para asegurar la disponibilidad continua del servicio. últimos pronósticos de volumen basados Transacciones e Interacciones en los resultados del trimestre anterior Los datos de los diagnósticos de servicio se utilizan normalmente para realizar este Una transacción es un y la actividad de marketing planificada. análisis. Los paneles de control técnicos movimiento financiero de Esto permite al equipo técnico planificar deben actualizarse en tiempo real para debidamente. El equipo técnico debe, dinero, generalmente el mostrar la integridad del sistema. Deben a su vez, asesorar a cualquier socio que acto de debitar una cuenta ser supervisados automáticamente y y acreditar a otra. Para que esto suceda, el pueda verse afectado por un cambio en diseñados para alertar a las funciones y usuario tiene que interactuar con el sistema. el pronóstico. Esto es particularmente personas responsables si se detecta un Las interacciones mismas pueden ofrecer relevante para los socios MNO, ya que ha problema potencial. El concepto de usar datos para ‘entender lo normal’ se utiliza información, y se utilizan con frecuencia habido varios casos de requerimientos de para detectar de forma proactiva los fallos en el desarrollo de productos digitales de volumen de SMS inmanejables durante en varias capas del servicio, y se establecen teléfonos inteligentes y servicios web para promociones inusualmente exitosas. soluciones de monitoreo automático para ayudar a comprender mejor al cliente. Del mismo modo, si se planean cambios detectar cuándo se superan los valores técnicos o revisiones, el marketing de umbral. Por ejemplo, si un sistema de Las interacciones de SFD, incluso utilizando debe ser consciente y debe evitar SFD normalmente procesa un número teléfonos de gama baja, se pueden medir actividades que puedan poner una dado de transacciones por segundo (TPS) y pueden proporcionar datos útiles presión adicional sobre el sistema en cada jueves por la noche, pero un jueves sobre la experiencia del cliente para un ese momento. la cifra es mucho menor, esto indica que servicio. Por ejemplo, es posible medir probablemente existe un problema que interacciones como ‘intentos abandonados Lecciones Aprendidas de requiere acción. de realizar una transacción financiera’, y Operaciones y Administración del luego diagnosticar lo que impidió que los Las tendencias se pueden usar para Desempeño clientes completaran estas transacciones. predecir los problemas de desempeño al Registrar el Beneficio Comercial de Otro ejemplo es cuando servicio al cliente mismo tiempo que identifican incidentes interactúan con el sistema en nombre de Ventas de Tiempo aire: Los informes específicos; debido a esto, el equipo un cliente, por ejemplo, restableciendo pueden ser engañosos cuando los también debe considerar el desempeño en el tiempo. El análisis de tendencias es un PIN olvidado. Estas interacciones clientes usan SFD para comprar tiempo vital en la planificación de la capacidad, rara vez se miden, pero también pueden aire. Dependiendo del negocio principal y los patrones de uso y crecimiento del proporcionar información útil para mejorar del proveedor de SFD, vender tiempo sistema dan pistas importantes sobre las operaciones del servicio. aire prepagos puede ser una fuente 72 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES de ingresos o un ahorro de costos. atraer a personas de recursos limitados que Observar Tendencias a Largo Plazo y Para los no-MNO, cada venta de tiempo carecen de acceso a los bancos y las personas Resultados a Corto Plazo: Las tendencias aire traerá una pequeña comisión, ya que de mayores ingresos (y las empresas) proporcionan información mucho más están actuando como un distribuidor que interactúan con ellos. Esto lleva a densas que un punto de datos aislado. de tiempo aire. Estos ingresos se deben volúmenes muy altos de transacciones Los cambios deben ser entendidos en el considerar parte de los ingresos de los de bajo valor junto con un pequeño contexto del tiempo, ya que puede haber un SFD. Para los MNOs, en lugar de ingresos, número de transacciones de alto valor. efecto estacional, como un día festivo, que esta transacción representa un ahorro de La visualización de datos puede ser muy es responsable de un salto en la actividad. costos con un impacto significativo, ya que eficaz para identificar dónde es inapropiado elimina las comisiones (típicamente) del Este punto de máximo uso puede ser el uso de promedios. Por ejemplo, la 2% al 3% y los costos de distribución. Sin seguido por un descenso, luego un retorno Figura 16 muestra una curva de frecuencia embargo, muchos MNO no atribuyen este al status quo, que es común alrededor de la de distribución típica de los valores de ahorro de costos al negocio de SFD porque Navidad. También puede haber un impacto transacción para un proveedor de SFD, se ha contabilizado dentro de la línea de estacional; por ejemplo, durante el período siendo la mayoría de las transacciones pre-pagados de tiempo aire. Aunque esto de cosecha, los agricultores con cultivos (moda) de $20. Sin embargo, el valor puede ser correcto en términos contables, comerciales obtienen la mayor parte de medio de transacción es de $86, debido a para medir con precisión el valor de los SFD sus ingresos anuales y son mucho más que un número relativamente pequeño para el negocio, este ahorro de costos debe de transacciones de alto valor sesga activos económicamente en comparación incluirse en las cuentas de administración el promedio. Estos promedios pueden con otras épocas del año. Otras causas de interna de los SFD. conducir a una visión equivocada e inflada cambios a corto plazo en el desempeño Cuidado con los Promedios: Por su de la riqueza y la actividad financiera del pueden ser la actividad competitiva, naturaleza, las ofertas de SFD tienden a cliente ‘promedio’. el clima extremo y la incertidumbre política. 0.35 0.3 Moda valor transacción = $20 0.25 Frecuencia 0.2 0.15 0.1 Valor promedio transacción =$86 0.05 0 0 50 100 150 200 250 300 350 Valor Transacción ($) Figura 16: Gráfico de frecuencia del valor de transacción que demuestra que los promedios pueden conducir a conclusiones equivocadas ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 73 1.2_APLICACIONES DE DATOS Cuidado con Métricas de Vanidad: Las y mantener la confianza del cliente, Suplementario de Datos no Estructurados métricas de vanidad pueden verse bien en estableciendo la aceptación de los SFD y (USSD) con un tiempo de espera demasiado el papel, pero pueden dar una visión falsa manteniendo la reputación del negocio. corto o un fallo de abandono de USSD de del desempeño del negocio. Son fácilmente La Figura 17 ilustra el problema de un cliente manera que algunos clientes físicamente manipulables y no necesariamente que utiliza su teléfono para pagar una no puedan completar una transacción se correlacionan con los datos que factura. En este caso, hay tres ‘propietarios en el tiempo asignado. Debe ser sencillo realmente importan, como la vinculación, del sistema’ involucrados: un MNO que en una relación proveedor-vendedor el costo de adquisición y, finalmente, suministra conectividad, el provedor de SFD pedir datos que muestren información los ingresos y beneficios. Un ejemplo que suministra la transacción y el facturador relevante, por ejemplo, deserciones típico de las métricas de vanidad de SFD al que se paga. de USSD o colas de transacciones. es informar de los clientes registrados, Cada sistema devuelve sus propios datos Sin embargo, a menudo es un en lugar de los activos. También, reportar de eficiencia, pero la experiencia del problema crítico en la provisión corresponsales totales en lugar de cliente puede ser muy diferente si hay de SFD que no hay Acuerdos de corresponsales activos. Sólo al centrarse demoras de entrega entre sistemas. Otro Nivel de Servicio (SLA) directos o integrales, en los KPI reales y métricas críticas es posible comprender adecuadamente la ejemplo común es cuando los MNOs lo que a veces puede hacer imposible salud de la compañía. Si una empresa proporcionan sesiones de Servicio entender la información en este detalle. se centra en las métricas de vanidad, puede obtener una falsa sensación de éxito. t1 t2 t3 t4 t5 Cronograma Los Datos de Nivel de Servicio deben técnico ser Relevantes para los Objetivos de MNO entrega Proveedor de Sistema de Proveedor de MNO entrega Negocio: Cada equipo de operaciones solicitud de SFD confirma facturación SFD completa confirmación recopila una gran cantidad de datos transacción detalles de servicios la transaccion de transaccion sobre cómo está funcionando su sistema. y reenvía confirma que Sin embargo, en SFD complejos y información de la transaccion transaccion puede seguir multi-socios, pueden no considerar el desempeño del servicio de extremo Tiempo = t1 + t2 + t3 + t4 + t5 a extremo y su efecto sobre la Cronograma experiencia del usuario. Para un cliente, cliente el indicador de desempeño que es relevante es el desempeño de la transacción de extremo a extremo; Figura 17: Tiempo de Transacción: Medidas del Sistema versus la Experiencia del Cliente ¿se completó la transacción y cuánto tiempo tomó? Es sorprendente cómo pocos SFD miden este desempeño de transacción de extremo a extremo dado su papel fundamental en establecer 74 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES Filtrado del “Diluvio de Datos”: Cada interacción con un sistema de SFD puede generar un gran número de puntos de datos. Algunos de éstos serán financieros, y algunos registrarán qué interfaz se está utilizando, o incluso cuánto tiempo le toma al usuario navegar por la experiencia de usuario. La intensidad de la información recogida aumenta enormemente a medida que los sistemas hacen un uso creciente de interfaces de usuario más avanzadas, tales como los teléfonos inteligentes. Esto puede conducir a la sobrecarga de información y al ‘fallo de filtro’ - esencialmente, una inhabilidad de ver árboles por culpa del bosque. Esto, junto con las restricciones en torno a asegurar los recursos necesarios para administrar estos mecanismos de envío de datos, es la razón por la que tan poca de esta información está siendo utilizada por el negocio para la toma de decisiones. Clasificar y correlacionar la información externa con datos internos puede conducir a una pérdida de información clave. ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 75 1.2_APLICACIONES DE DATOS CASO 9 M-Kopa Kenia - Modelos de Negocios Innovadores y Estrategias Basadas en Datos La Cultura de Negocios Impulsada por Datos Incorpora la Analítica entre Operaciones, Productos y Servicios Fundada en Kenia en 2011, M-Kopa pago’, evaluada por la compra inicial energía fiable para los siguientes días. comenzó como un proveedor de del sistema y el pago posterior. M-Kopa Sabiendo cuándo es probable que sistemas de energía solar para el hogar, también está disponible en Uganda, los clientes paguen (y con cuánto principalmente para la iluminación, a Tanzania y Ghana. tiempo de antelación), M-Kopa la vez que para recarga de pequeños puede pronosticar las expectativas dispositivos como teléfonos móviles M-Kopa utiliza datos proactivamente y planificar en consecuencia, y radios. El negocio combina la en toda la dimensión del negocio asegurando que sus clientes no se tecnología de máquina a máquina, para mejorar la eficiencia operativa. verán afectados por interrupciones utilizando tarjetas SIM integradas con Sus bases de datos acumulan anunciadas de M-Pesa que podrían información sobre la demografía de impedir que estos pagos se ejecuten. una solución de micro-pagos lo que significa que la tecnología puede ser los clientes, la dependencia del cliente Servicio al Cliente monitoreada y puesta a disposición sólo en el dispositivo y el comportamiento Los dispositivos M-Kopa comunican cuando se recibe el pago anticipado. de pagos. Cada unidad solar transmite los datos de la batería cuando se Los clientes compran sistemas M-Kopa automáticamente los datos de uso y la registran y el análisis de los datos usando ‘créditos’ a través del servicio información de diagnóstico del sistema permiten al servicio de atención al M-Pesa de dinero electrónico, luego a M-Kopa, informándoles cuando, por cliente comprobar si las unidades pagan los sistemas usando M-Pesa hasta ejemplo, las luces están encendidas. están funcionando según lo previsto y que el saldo se pague por completo Todo esto se puede analizar para permite un mantenimiento proactivo y el producto sea de su propiedad. mejorar la calidad del servicio, la y preventivo que se puede realizar de En los últimos años, el negocio se ha eficiencia operacional y la comprensión forma remota: expandido a otras áreas, incluyendo del comportamiento del cliente. • Si un cliente se queja de que no está la provisión de electrodomésticos y recibiendo la cantidad esperada de préstamos, utilizando unidades solares Gestión de la Capacidad Técnica energía, los paneles de control de la de propiedad del cliente como garantía Un análisis del comportamiento del batería se utilizan para diagnosticar de refinanciamiento. Estos productos se cliente en uso y pagos muestra que los el problema. Por ejemplo, la batería ofrecen a los clientes que han construido usuarios prefieren comprar créditos no se está cargando completamente un score crediticio de ‘capacidad de por adelantado para asegurar una durante las horas diurnas. 76 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES • A pesar de los buenos controles de representantes de ventas utilizan una Enfoque en Clientes Potenciales para calidad de manufactura, siempre aplicación de teléfono inteligente Ventas Adicionales hay variaciones en el desempeño para registrar todas sus actividades El comportamiento de pagos del de la batería cuando las unidades digitalmente, en tiempo real. Esto cliente puede proporcionar una están en el campo, determinado permite una comprensión detallada gran cantidad de información sobre por factores tales como patrones de su desempeño y una resolución la salud financiera y la solvencia. de uso o condiciones ambientales. rápida cuando hay problemas. Las Los datos de la batería muestran M-Kopa ha creado algoritmos de medidas dinámicas de desempeño la dependencia del cliente con el mantenimiento predictivo para en línea y las tablas de clasificación dispositivo para iluminación, lo que detectar el desempeño sub-óptimo pueden ser desglosadas por persona añade un nivel más profundo de de la batería, lo que le permite y están a disposición del equipo comprensión. Esta información se intervenir y organizar un reemplazo de gestión de ventas y los líderes utiliza para identificar y activamente gratuito antes que se produzca un de equipo para fomentar las enfocarse en los clientes existentes ‘fallo’ de la batería. mejoras de desempeño a través de para actualizaciones y servicios la gamificación.24 La aplicación adicionales. M-Kopa también Gestión de Equipos de Ventas también permite a los miembros comparte esta información con El equipo de ventas de campo vende del equipo realizar un seguimiento burós de crédito para ayudar a productos y servicios de M-Kopa de su comisión y cualquier bono e proporcionar a los clientes una directamente a los clientes. Los incentivo adicional. calificación crediticia. Una cultura corporativa impulsada por los datos es necesaria para integrar la analítica y elaboración de informes en toda la empresa. Esto ayuda a aprovechar las fuentes de datos y analíticas en múltiples áreas para atraer a nuevos clientes, administrar equipos de ventas, ofrecer un mejor servicio al cliente y desarrollar nuevos productos. 24 Gamificación es la aplicación de elementos de diseño de juegos y principios de juego en contextos distintos al juego. Se pueden encontrar más ejemplos de Servicios Financieros Digitales en el sitio web de CGAP: https://www.cgap.org/blog/series/gamification-and-financial-services-poor/ ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 77 1.2_APLICACIONES DE DATOS Interacciones del Sistema de Combinación de Datos para Agregar financiera de SFD no es sencillo. Almacenamiento: Incluso hace unos Contexto: La combinación de datos Esto suele ser porque no hay ninguna pieza años, cuando se lanzaban muchas ofertas de proveedores de SFD con datos de común de los datos que vincule a los dos de Servicios Financieros Digitales, la aliados puede tener muchos beneficios registros, e incluso los relojes que marcan captura y el almacenamiento de datos operacionales. Por ejemplo, cuando hay la hora del evento en los dos sistemas es colaboración con un MNO, también hay poco probable que estén perfectamente eran relativamente costosos y engorrosos, información sobre dónde se encontraban sincronizados. Debido a esto, muchos por lo que no se conservaban los datos físicamente el remitente y el destinatario, sistemas sólo realizan la actividad de que no eran inmediatamente necesarios la tarjeta SIM utilizada, el tipo de teléfono combinación de datos por excepción, para administrar un negocio. La nueva utilizado, los registros potenciales de generalmente para investigaciones de tecnología permite un almacenamiento llamadas y los patrones de recarga del fraude caso por caso. Sin embargo, el de datos barato y abundante. Aunque cliente. Como muchos mercados tienen un contexto adicional proporcionado por los normalmente se ignoran, también hay mandato de registro de tarjeta SIM estricto, datos combinados puede agregar capas nuevas herramientas para analizar los la información de KYC del cliente también de valor, particularmente en el caso del datos que están en archivos de registro se puede utilizar para completar y cruzar monitoreo proactivo del fraude. Hacer en los servidores que hacen posible, los registros de referencia. Aunque algunos más fácil combinar los datos para que con las herramientas adecuadas, de estos parámetros no son de importancia puedan ser utilizados en las actividades correlacionar múltiples fuentes de datos primordial para las transacciones, estos operacionales ‘normales’, especialmente datos son útiles para determinar las para proporcionar información más densa para las operaciones de SFD más maduras. anomalías del sistema; por ejemplo, si un sobre los servicios. Se recomienda muy cliente normalmente realiza transacciones especialmente que los proveedores de SFD Intentos Fallidos: Es común que los desde un teléfono determinado y ese recopilen y almacenen todos los bits de proveedores de Servicios Financieros teléfono ha cambiado, puede ser que la datos que puedan sobre cada interacción Digitales retengan los datos asociados transacción sea fraudulenta. Se pueden del sistema, incluso aquellas que se con las transacciones exitosas, cuando obtener más pruebas cruzando la ubicación se completó la actividad solicitada. rechazaron. Si bien puede no parecer útil donde la transacción tuvo lugar con el Sin embargo, las transacciones fallidas o relevante para las operaciones actuales, registro de ubicación normal del cliente. también pueden proporcionar información. puede ser de valor a futuro para análisis de Puede haber desafíos al intentar Las razones por las que se rechazaron datos o investigación de fraude. correlacionar datos de diferentes fuentes, determinadas transacciones pueden Los principios de no repudio requieren que requieren consideración durante el apuntar a necesidades muy específicas, que estos cambios se registren como proceso de diseño de la base de datos. Por como la necesidad de proporcionar eventos adicionales, en lugar de intentar ejemplo, incluso cuando el MNO es parte información y educación un fallo técnico o de la misma organización que el proveedor una deficiencia en el diseño del servicio que editar registros previamente finalizados. de SFD, el intercambio de datos puede debe modificarse para proporcionar una Por ejemplo, si una comisión debe ser ser un problema porque los dos sistemas experiencia de usuario más intuitiva. recuperada de un corresponsal, esto no han sido diseñados para proporcionar debe ser registrado explícitamente como Con el fin de realizar estas analíticas servicios de información entre sí. una actividad separada (pero vinculada), Intentar vincular retrospectivamente avanzadas, cada bit de información sobre en lugar de pagar silenciosamente una los datos de telecomunicaciones de una cada interacción del sistema debe ser cantidad menor, o simplemente ajustar el interacción del cliente con un sistema recogido y almacenado, incluso si su archivo de la comisión por pagar. con la información transaccional relevancia no es inmediatamente obvia. 78 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES Única Fuente de Verdad: Cuando hay parte de cualquier proyecto que combina y del prestatario para predecir el múltiples sistemas, es común tener la compara fuentes de información; también comportamiento futuro de los prestatarios misma data duplicada en múltiples lugares. es importante entender claramente si nuevos y existentes.25 La aparición de Big Esto es a menudo porque la infraestructura un registro es definitivo o aún puede Data y las fuentes y formatos de estos actual hace que sea difícil combinar fuentes actualizarse. Tratar incorrectamente un datos han presentado enfoques adicionales de datos de otra manera. Esta duplicación registro no final como final puede llevar a para el proceso de scoring crediticio. de datos puede conducir a problemas estragos en la analítica de datos, creando La incorporación de estas fuentes con respecto a la ‘fuente de la verdad’, en desconfianza en la integridad de la alternativas de datos impulsa modelos otras palabras, en cuál fuente de datos se plataforma. de calificación de crédito alternativos. puede confiar cuando hay información Esta sección examina la forma cómo los datos impulsan el scoring crediticio contradictoria. Todos los sistemas 1.2.3 Analítica y y qué tipos de datos funcionan mejor están ocasionalmente sujetos a errores, y cuando hay una disputa sobre los detalles Aplicaciones: Scoring para diversas necesidades. Las relaciones de la transacción o un debate sobre si los crediticio fundamentales de scoring crediticio se fondos fueron transferidos, tiene que haber El scoring crediticio puede describirse representan como una línea de tiempo en un acuerdo claro sobre los datos de los ampliamente como el estudio del la siguiente figura. que fiarse. El manejo de estos detalles es comportamiento pasado y características Pasado Presente Futuro Características Características Comportamiento del Prestatario del Prestatario en el Pago de Créditos Comportamiento en el Pago de Créditos Figura 18: Cronograma de Definición de Scoring Crediticio 25 Schreiner, ‘Credit scoring for microfinance: Can it work?’, Journal of Microfinance/ESR Review, Vol. 2.2 (2009): 105-118 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 79 1.2_APLICACIONES DE DATOS A continuación, se presentan los puntos Se podría escribir todo un manual sobre el los prestatarios anteriores con la misma clave ilustrados en la Figura 18: scoring crediticio, y de hecho varios textos combinación de características del completos y accesibles se han publicado prestatario fueron ‘malos’. 1. Pasado: Se estudian los datos (o, en su sobre el tema durante la última década.26 ausencia, la experiencia) para entender Es importante llevar a cabo análisis Además, CGAP publicó recientemente cuáles son características del prestatario sobre los préstamos buenos y malos. una introducción al scoring crediticio en que están más significativamente Estudiar las relaciones de riesgo en los el contexto de los Servicios Financieros relacionadas con el riesgo de impago. datos de crédito es tan simple como Digitales.27 Para efectos de este manual, el Este estudio del pasado informa la mirar el número de préstamos buenos resto de esta sección de crédito se centra en: elección de factores y ponderaciones en y malos para diferentes características el panel de control. Cómo 1. se convierten los datos en del prestatario. Cuantos más préstamos 2. Presente: El Scorecard (construido puntuaciones de crédito malos haya como proporción del total de sobre los datos pasados característicos 2. Cómo se utilizan los datos para hacer préstamos para una característica dada de del prestatario) se utiliza para evaluar frente a los desafíos de la evaluación de prestatario, más riesgo habrá. las mismas características en los nuevos crédito en los mercados en desarrollo solicitantes de préstamos. El resultado La tabulación cruzada, o tabla de es un scoring numérico que se utiliza Desarrollo del Scorecard contingencia, es una herramienta analítica para situar al solicitante en un ‘grupo Los scorecards de crédito se desarrollan simple que se puede utilizar para construir de riesgo’, o rango de puntuaciones con mirando una muestra de datos sobre y administrar scorecards de crédito. tasas de pago similares observadas. préstamos pasados que han sido La Tabla 4 muestra el número de préstamos 3. Futuro: El modelo supone que los clasificados como ‘buenos’ o ‘malos’. buenos y malos entre rangos de valores, en nuevos solicitantes con las mismas Una definición común de préstamos un ejemplo desde un campo de datos de características que los prestatarios ‘malos’ (o ‘deficientes’) es 90 o más días un MNO, en este caso, el tiempo desde la anteriores presentarán el mismo consecutivos en mora,28 pero para el vinculación a la red móvil. Supongamos comportamiento de pagos que los desarrollo de un scorecard, un préstamo que la expectativa es que los solicitantes prestatarios anteriores. Así, la tasa de malo debe ser descrito como uno (visto con un historial más largo en la red móvil morosidad observada en el pasado en retrospectiva) que las Instituciones tendrán menos riesgo (por lo general, los para un grupo de riesgo dado es la tasa Financieras elegirían no hacer otra vez historiales más largos, ya sea en el empleo, de morosidad pronosticada para los en el futuro. Para cada nuevo solicitante en los negocios, en la residencia o como nuevos prestatarios en ese mismo grupo de crédito, el modelo de calificación cliente de un banco, están vinculados a un de riesgo. calculará e informará qué porcentaje de menor riesgo). 26 Vea por ejemplo: Siddiqi, ‘Credit risk scorecards: developing and implementing intelligent credit scoring’, John Wiley and Sons, Vol. 3 (2012). Anderson, ‘The credit scoring toolkit: Theory and practice for retail credit risk management and decision automation’, Oxford University Press, 2007 27 ‘An Introduction to Digital Credit: Resources to Plan a Deployment’, Consultative Group Against Poverty via Slide Share, Junio 3 de 2016, consultado April 3 de 2017, http://www.slideshare.net/CGAP/an-introduction-to-digital-credit-resources-to-plan-a-deployment 28 Para los Servicios Financieros Digitales y los operadores de microcrédito, la definición de préstamo ‘malo’ a menudo puede ser un período de morosidad mucho más corto, como 30 o 60 días de moras consecutivas. El diseño del producto (incluidas las sanciones y los cargos por mora) y la mano de obra involucrada en los procesos de recaudación influirán en el punto en el que un cliente es ‘malo’ o es mejor evitarlo. 80 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES Fila <= 2 meses > 2 meses y > 1 año y > 2 años y > 3 años Total <= 1 año <= 2 años >= 3 años A Buenos 115 161 205 116 203 800 B Malos 48 48 50 24 30 200 C Tasa Negativa 29.4% 23.0% 19.8% 17.3% 12.7% 20.0% D Total 163 210 255 140 233 1,000 E % Créditos Totales 16.3% 21.0% 25.5% 14.0% 23.3% Tabla 4: Tabulación Cruzada de Créditos La Tabla 4 se puede leer de la siguiente manera: cada grupo es considerar su tasa negativa administración. Un enfoque alternativo al relativa al 20 por ciento (promedio) de tasa desarrollo de un scorecard es la minería Fila A: Número de contratos malos en el de impago por tiempo desde el registro: de datos, o el uso de algoritmos de grupo (columna) aprendizaje automatizado más complejos Fila B: Número de contratos malos en el • Menos de 2 meses, la tasa negativa es para cualquier relación en un conjunto grupo (columna) de 29 por ciento, una vez y media el de datos, ya sea entendido o no por un Fila C: Número de contratos malos (fila B) promedio. analista humano. Aunque un enfoque / Número de contratos totales (fila D) • Entre 1 año y 2 años, la tasa negativa de puramente de aprendizaje automático Fila D: Número de contratos totales (fila A 19,8 por ciento, o riesgo promedio. puede resultar en una predicción mejorada + fila B) • Más de 3 años, la tasa negativa es del 12,7 en algunas situaciones, también hay Fila E: Total de contratos en el grupo por ciento, un poco más de la mitad del ventajas prácticas pero difíciles de medir (columna) dividido por todos los contratos riesgo promedio. cuando los negocios y la gestión de riesgo (1.000) entienden completamente cómo se En el desarrollo tradicional de scorecards calculan las puntuaciones. Para llevar a cabo el análisis, el siguiente de crédito, los analistas buscan patrones paso es buscar patrones sensibles e sencillos -incluyendo tasas malas en La tabulación cruzada o el análisis similar intuitivos. Por ejemplo, la tasa negativa ascenso o descenso constante - que encajan de predictores únicos es el componente en la fila C de la Tabla 4 disminuye con el sentido de negocios (y el común). Los básico de los modelos de score crediticio.29 claramente a medida que aumenta el scorecards de crédito desarrollados de esta Crear tabulaciones cruzadas como las del tiempo transcurrido desde el registro en la manera se traducen bien al uso operativo ejemplo anterior es fácil con cualquier red. Esto coincide con la expectativa inicial. como herramientas de negocio que son software estadístico comercial o con el Una forma fácil de pensar en el riesgo de transparentes y bien comprendidas por la software libre ‘R’ de código abierto. 29 De hecho, se pueden calcular coeficientes de regresión logística directamente a partir de una tabulación cruzada para una única variable. ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 81 1.2_APLICACIONES DE DATOS Caso de Uso: Desarrollo de Scorecard no sólo favorece modelos simples, sino la tasa más alta para todos los grupos Los puntos del scorecard son que también significa que un proveedor de (aquí es 30.9 por ciento para ‘23 o menor), transformaciones de los patrones Servicios Financieros Digitales impulsado que se multiplica por 100 (para obtener de tasa negativa observados en las por datos debe centrarse inicialmente números enteros en lugar de decimales). tabulaciones cruzadas. Aunque existen en capturar, limpiar y almacenar más y Los resultados (mostrados en la fila F) muchos métodos matemáticos que se mejores datos. podrían utilizarse como puntos en el pueden utilizar para construir scorecards scorecard. En un esquema de puntos de La Tabla 5 abajo es otra tabulación este tipo, el grupo más arriesgado siempre (véase el capítulo 1.2.3), los diferentes métodos dan resultados similares. Esto se cruzada, esta vez para el factor ‘edad’. recibirá 0 puntos y el grupo de menor riesgo debe a que el poder predictivo del modelo Al igual que en la tabla anterior, las tasas (es decir, el grupo con la tasa negativa más de scoring estadístico no proviene de la negativas en la fila C muestran el riesgo baja) recibirá el mayor número de puntos. matemática, sino de la fuerza de los datos (la ‘tasa negativa’), que disminuye a medida mismos. Dados los datos adecuados sobre que aumenta la edad. Para los scorecards desarrollados las características relevantes del prestatario, mediante regresión (véase el capítulo 1.1), Diferencias de Tasa Negativa la transformación de los coeficientes de los métodos simples producirán un buen modelo y los métodos complejos pueden Una manera muy simple de convertir las regresión en puntos positivos implica unos producir un modelo ligeramente mejor. tasas negativas en el scorecard es calcular pocos pasos adicionales. Los cálculos no Si no hay datos buenos (o muy pocos datos), las diferencias en las tasas negativas. se muestran aquí, pero los resultados de ningún método dará buenos resultados. Como se muestra en la fila G, la tasa clasificación son muy similares, como se La verdad es que el desarrollo del scorecard negativa para cada grupo es restada de muestra en la fila H. Fila 23 años o menos 24 a 30 años 31 a 47 años 48 años o más Total A Buenos 46 238 374 142 800 B Malos 20 74 82 23 200 C Tasa Negativa 30.9% 23.8% 18.0% 14.0% 20.0% D Total Columna 66 312 456 166 1,000 Porcentaje de E 6.6% 31.2% 45.6% 16.6% Préstamos Totales F PUNTOS 0 7 13 17 Cálculo G (.309 - .309) = 0 (.309 - .238) = 7 (.309 - .18) = 13 (.309 - .14) = 17 [multiplicado por 100] H PUNTOS LOGIT 0 10 21 29 Tabla 5: Tabulación Cruzada por Edad 82 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES Factores que obtienen el mayor número de puntos en los scorecards de crédito Cuanto más grandes sean las diferencias en tasas negativas entre los grupos, más puntos recibe un factor de riesgo en un scorecard. Utilizando el método simple de ‘diferencias de tasas negativas’ (descrito anteriormente), podemos ver en la Tabla 6 a continuación, que ‘score crediticio de buró’ toma un máximo de 39 puntos, mientras que el ‘estado civil’ toma un máximo de sólo ocho puntos. Esto se debe a que hay diferencias mucho mayores en las tasas negativas más altas y más bajas para el historial de crédito que las que hay para el estado civil. Puntajes de Buró de Crédito Tasa Negativa de Grupo < 590 puntos 590 - 670 puntos 671 - 720 puntos > 720 puntos Muestra Tasa Negativa 39% 23% 13% 0% 20% PUNTOS 0 16 26 39 Estado Civil Tasa Negativa de Grupo Divorciado Soltero Casado Viudo Muestra Tasa Negativa 25% 24% 19% 17% 20% PUNTOS 0 1 6 8 Tabla 6: Ejemplos de Importancia del Factor del Scorecard Dado que la clasificación del riesgo entre algoritmos es a menudo muy similar, muchos expertos prefieren utilizar métodos más sencillos en la práctica. El importante autor de scoring crediticio, David Hand, ha señalado que “los métodos sencillos típicamente producen un desempeño casi tan bueno como los métodos más sofisticados, en la medida en que la diferencia en el desempeño puede verse inundada por otras fuentes de incertidumbre que generalmente no se consideran”.30 La práctica generalizada y establecida de utilizar la regresión logística para el scoring crediticio habla de la facilidad con la que tales modelos se presentan como scorecards. Estos scorecards son bien comprendidos por la gerencia y pueden ser usados para manejar proactivamente los riesgos y las recompensas de la actividad crediticia. 30 David Hand, ‘Classifier technology and the illusion of progress’, Statistical Science, Vol. 21.1 (2006): 1-14 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 83 1.2_APLICACIONES DE DATOS Scorecards de Expertos Cuando no hay datos históricos, pero el proveedor tiene una buena comprensión de las características del prestatario que afectan al riesgo en el segmento, un cuadro de scorecard puede funcionar razonablemente bien haciendo clasificación en función del riesgo a los prestatarios. Un scorecard de expertos utiliza puntos para clasificar a los prestatarios por riesgo, tal como lo hace un scorecard estadístico. La principal diferencia (y una importante) es que, sin datos pasados, incluyendo datos sobre morosidad, una IF no tiene manera de saber con certeza si su comprensión (o expectativa) de las relaciones de riesgo es correcta. Por ejemplo, si sabemos que la edad es un factor de riesgo relevante para los préstamos de consumo y hemos visto (en la práctica) que el riesgo generalmente disminuye con la edad, podríamos crear grupos de edad similares a los de la Tabla 5. En este escenario, asignamos puntos usando un esquema sencillo donde el grupo percibido como más riesgoso siempre obtiene cero puntos y el grupo de menor riesgo siempre obtiene 20 puntos. En este caso, una ponderación de scorecard de expertos de la variable ‘edad’ podría parecerse a la Tabla 7. Estos puntos no son tan diferentes de los puntos estadísticos de edad mostrados en las filas F y H de la Tabla 5. 23 años o menos 24 a 30 años 31 a 47 años 48 años o más PUNTOS 0 7 15 20 Tabla 7: Puntos ‘Expertos’ para ‘Edad’ Siempre y cuando la clasificación del riesgo sea correcta para cada factor de riesgo individual en un scorecard de expertos, la puntuación de un scorecard de expertos hará una clasificación del riesgo de los prestatarios de manera similar a cómo los clasifica un scorecard estadístico.31 Esto significa que los scorecards de expertos pueden ser una herramienta útil para lanzar un nuevo producto para el cuál no hay datos históricos. También son una buena manera para los proveedores de Servicios Financieros Digitales que tienen la intención de ser impulsados por datos, para obtener algunos beneficios de scoring - incluyendo mayor eficiencia y consistencia - al tiempo que construye una mejor base de datos. 31 Por lo general, utilizando sólo el juicio de expertos, los proveedores especifican incorrectamente la relación de clasificación de riesgo de uno o más factores. Una vez que se recopila la data de desempeño (pago del préstamo), se puede utilizar para corregir cualquier relación mal especificada, lo que conducirá a una mejor clasificación de riesgo del modelo estadístico resultante. 84 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES Elección de un Conjunto de El ‘mejor’ conjunto de predictores de A medida que cada predictor Factores de Riesgo variable única se combinan en un modelo individualmente fuerte se añade a un modelo Si bien los campos de datos específicos de variables múltiples. Si bien esto puede de múltiples factores, su clasificación de disponibles para el scoring crediticio varían hacerse algorítmicamente para maximizar riesgo mejora. Sin embargo, después de un mucho según el producto, el segmento y la predicción, un enfoque atractivo para número relativamente pequeño de buenos el proveedor, generalmente los datos del los proveedores de Servicios Financieros predictores individuales (normalmente modelo de puntuación deben ser: Digitales es elegir un conjunto de factores de 10 a 20), la mejora incremental para que juntos crean un perfil de riesgo integral cada factor adicional disminuye bastante • Muy relevantes para el prestatario, 32 siguiendo las líneas bruscamente. Incluso si selectivamente • Fácil de recopilar de manera consistente de las conocidas cinco Cs del crédito: seleccionamos los factores que no parecen • Objetivos, no auto informados capacidad, capital, colateral, condiciones, estar altamente correlacionados entre sí, Algunos tipos de datos tienden a ser buenos y carácter. Este modelo es fácil de entender en realidad, muchos de los factores estarán predictores del pago de créditos entre para los banqueros y la administración de correlacionados hasta cierto punto, segmentos y mercados. La Tabla 8 presenta los bancos, y es consistente con los marcos llevando a los retornos decrecientes de algunos de ellos junto con sus patrones de de gestión de riesgo como los Acuerdos de factores adicionales. riesgo comúnmente observados. Capital de Basilea. Tipo de Datos Factor Relación de Riesgo Compras El riesgo disminuye a medida que aumenta el ingreso disponible Depósitos y movimiento de la cuenta El riesgo disminuye a medida que aumentan depósitos y movimientos Comportamiento Historial de Crédito El riesgo disminuye a medida que aumenta el historial crediticio positivo Pago de Cuentas El riesgo disminuye en línea con la puntualidad de los pagos de facturas Tiempo en residencia, trabajo, negocios La estabilidad reduce el riesgo Historial Tiempo como cliente Los clientes con un historial más largo son de menor riesgo El riesgo disminuye con la edad y aumenta de nuevo alrededor de la edad de Años jubilación (principalmente debido a los riesgos de salud) Las personas casadas frecuentemente están asentadas y estables, lo que reduce Estado Civil el riesgo Demográfico El aumento del número de dependientes puede aumentar el riesgo (especialmente Número de dependientes para las personas solteras), pero en algunas culturas en lugar de ello reduce el riesgo (mayor red de apoyo) Propietario de vivienda Los propietarios son menos riesgosos que los inquilinos Tabla 8: Datos Frecuentemente Eficaces para Scoring Crediticio 32 Siddiqi, ‘Credit risk scorecards: developing and implementing intelligent credit scoring’, John Wiley y Sons, Vol. 3 (2012) ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 85 1.2_APLICACIONES DE DATOS Cuando una IF tiene suficientes datos, debe En esta sección se examina cómo se El crecimiento de la telefonía móvil y el uso dar preferencia a los datos que: utilizan los datos para superar algunos de del dinero electrónico - particularmente los desafíos que han sido durante mucho en África y Asia - ha creado registros • Son objetivos y se pueden observar digitales de terceros verificables sobre tiempo barreras a la inclusión financiera. directamente, en lugar de ser obtenidos los patrones de pago reales, tales como En particular, son los datos digitales del solicitante recargas y pagos de dinero electrónico. generados por los teléfonos móviles, el • Evidencian relaciones con el riesgo de dinero electrónico e Internet, los que están Estos datos, en poder de los operadores crédito que confirman el juicio experto ayudando a poner a millones de personas telefónicos, proporcionan un cuadro de o intuitivo los flujos de efectivo de un usuario de SIM. que nunca han tenido cuentas bancarias • Cuesta menos recolectarlos Los terminales POS y las cajas de dinero o préstamos bancarios en el radar de las electrónico también pueden pintar un • Pueden recopilarse de la mayoría, si no Instituciones Financieras formales. cuadro algo más completo de los flujos de todos, los solicitantes Los estudios de caso que siguen investigan efectivo para los comerciantes. • No discrimina con base en factores cómo se han utilizado los operadores que el prestatario no puede controlar telefónicos, las redes sociales y la datos (es decir, edad, sexo, raza) o que son bancarios tradicionales para lanzar potencialmente divisivos (es decir, nuevos productos, para ayudar a que religión, etnia, idioma) más prestatarios se hagan elegibles para Caso de Uso: Nano-Créditos créditos formales y para evaluar pequeñas Debido a que los bancos deben reportar empresas, que son menos homogéneas Cuando se sabe cuánto dinero los pagos de nano-créditos a burós de que los consumidores individuales. maneja una persona o compañía crédito y bancos centrales, el nano-crédito Desafío de Crédito 1: Verificación de forma diaria, semanal y ha traído a millones de personas que antes de Ingresos y Gastos mensual, se puede calcular carecían de acceso a los bancos, al sector Un importante desafío de actividad crediticia mejor qué tamaño de créditos financiero formal en todo el mundo, estableciendo un historial de crédito que a nivel de consumidor en los mercados serían capaces de pagar. es un paso para desbloquear el acceso a en desarrollo, es la obtención de datos otro tipo de productos crediticios. Sin fiables sobre el flujo de efectivo de nuevos embargo, a algunas personas les preocupa clientes, tanto para las personas como Los siguientes dos casos analizan cómo que los nano-créditos creen un ciclo de para las empresas. El flujo de caja, o los los datos digitales han ayudado a abrir ingresos que quedan después de gastos, es grandes mercados para nano-créditos deuda para individuos de bajos ingresos. la principal fuente de pago del crédito y por de consumo. Varios millones de personas con malas experiencias con nano-créditos podrían lo tanto un foco de los modelos de créditos terminar en listas negras en los burós de minoristas. Los niveles de ingresos también crédito locales, lo cual avala aún más la se utilizan para determinar la capacidad de necesidad de protección del consumidor. endeudamiento de un individuo. 86 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES CASO 10 M-Shwari Lanza un Mercado Para Nano Créditos Soluciones de Datos para Evaluar la Solvencia de los Prestatarios sin Historial de Crédito Formal El Banco Comercial de África (CBA) de pagos para predecir los pagos Otra forma de utilizar el scoring y el operador móvil Safaricom futuros de créditos. ¿Qué pasa crediticio con un producto nuevo comenzaron a reconocer el poder de en el caso de que no haya un es estudiar un conjunto relevante de los datos de telefonía móvil y dinero comportamiento de pagos pasado? datos de clientes, como los datos de electrónico. Los operadores móviles tienen datos los operadores móviles, en relación amplios sobre los teléfonos móviles con la información de pagos de M-Shwari, el primer producto de préstamos, tales como: de sus clientes y, en muchos casos, ahorro y crédito digital de gran éxito, sobre el uso del dinero electrónico, • Historial Crediticio General es bien conocido por los seguidores de ‘fintech’ y la inclusión financiera. pero es menos claro cómo se pueden o Informe de Buró: Esto sólo Ha otorgado pequeños créditos usar esos datos para predecir la funciona para los clientes con un llamados nano-créditos por medio capacidad y la voluntad de pago de expediente en el buró. de teléfonos móviles a millones de un crédito, sin datos sobre el pago de • Productos de Crédito Similares: prestatarios, trayéndolos al sector las obligaciones anteriores. Otro producto de crédito lo financiero formal. Productos similares suficientemente similar como Por definición, no hay datos específicos han sido lanzados desde entonces para ser relevante para el nuevo pasados del producto, para un en otras partes de África, y la nueva producto se puede utilizar como producto nuevo. Una forma para indicador. Si bien el pago pasado competencia ha atestado el mercado seguir utilizando el score crediticio de dicho producto puede ser o en Kenia. La historia de M-Shwari es con un producto nuevo es utilizando no representativo del pago futuro también un excelente estudio en el uso creativo de datos para traer un nuevo el juicio de expertos y el conocimiento del nuevo producto, puede ser producto al mercado. del dominio para crear un ‘scorecard una aproximación aceptable, o de expertos’, una herramienta que ‘variable sustitutiva’, a efectos del Modelando lo Desconocido orienta las decisiones crediticias modelado inicial. La tecnología de scoring crediticio basadas en las clasificaciones de analiza las características pasadas de riesgo del prestatario. Ver cuadro en los prestatarios y el comportamiento la página 84. ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 87 1.2_APLICACIONES DE DATOS El primer scorecard de M-Shwari muy pequeños de Okao Jahzi serían se volvieran a desarrollar lo antes fue desarrollado usando datos de mejores riesgos para el producto posible utilizando el comportamiento Safaricom y el historial de pagos crediticio más grande. de pagos del producto mismo de de clientes que habían utilizado su M-Shwari. Algunos comportamientos producto Okoa Jahzi de crédito El primer modelo de scoring predictivos del uso del crédito para comprar tiempo aire.33 Los dos crediticio de M-Shwari desarrollado para tiempo aire no se tradujeron productos eran claramente diferentes, con los datos de Okoa Jahazi,34 directamente en el uso de M-Shwari como se muestra en la Tabla 9 a junto con políticas conservadoras de y los cambios apropiados al modelo continuación. cupos y procesos empresariales bien basados en los datos reales de uso de diseñados, permitieron el lanzamiento El producto M-Shwari ofrece a los M-Shwari redujeron los préstamos del producto, que rápidamente se prestatarios más dinero, flexibilidad en mora en un 2 por ciento. convirtió en un éxito masivo. de uso y tiempo de pago. La M-Shwari sigue actualizando su presunción era que los que habían El CBA esperaba que el scorecard scorecard periódicamente con base en utilizado exitosamente los créditos basado en los datos de Okoa Jahazi información nueva. Producto Okao Jahzi M-Shwari Monto El menor gasto de tiempo aire entre los últimos 7 100 a 10.000 chelines kenianos días o 100 chelines kenianos Propósito Utilizado sólo para tiempo aire Utilizado para cualquier propósito Términos de pago 72 horas 30 días Tabla 9: Comparación de productos Okao Jahzi y M-Shwari El lanzamiento y desarrollo exitoso de M-Shwari demuestran que hay formas de utilizar soluciones de scoring basadas en datos para segmentos completamente nuevos. También refuerza la verdad general acerca del scoring crediticio en el sentido de que un scorecard siempre es un trabajo en proceso. No importa lo bien que se desempeñe un scorecard con datos de desarrollo, siempre se debe monitorear y administrar usando informes estándar y se le debe afinar siempre que haya cambios significativos en los riesgos de mercado o en los tipos de clientes que solicitan el producto. 33 Cook y McKay, ‘How M-Shwari works: The story so far’, Consultative Group to Assist the Poor y Financial Sector Deepening 34 Mathias, ‘What You Might Not Know’, Abacus, 18 de Septiembre de 2012, consultado Abril 3 de 2017, https://abacus.co.ke/okoa-jahazi-what-you-might-not-know/ 88 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES El producto de nano-créditos M-Shwari tuvo éxito gracias a la oportuna confluencia de: • Acceso a Datos del MNO: CBA tuvo una ventaja de pionero debido a su fuerte alianza con Safaricom. Hoy, Safaricom vende sus datos telefónicos a todos los bancos en Kenia. • Un Producto Bien Diseñado: Los productos pequeños, a corto plazo, se ajustan mejor al scoring crediticio, especialmente para los productos nuevos. La rápida retroalimentación sobre el desempeño de pagos de la población objetivo permite un desarrollo oportuno del modelo y controla el riesgo. • Buenos Sistemas y Personas: El equipo directivo de M-Shwari es pequeño y flexible, reuniendo una combinación única de habilidades administrativas y técnicas, así como los sistemas para garantizar una implementación sin problemas. Aprovechamiento • de Recursos Externos: FSD Kenia apoyó a CBA con conocimiento experto en modelado de riesgo, que era crucial para desarrollar el primer modelo de scoring y transferir destrezas al equipo de M-Shwari. Aunque la historia de éxito de M-Shwari es inspiradora, hay muchos proveedores de Servicios Financieros Digitales que quieren entrar en el espacio de los nano-créditos, pero pueden encontrarlo difícil. Estos proveedores de SFD pueden no tener relaciones con MNO o pueden carecer de la capacidad interna para diseñar productos de ahorro y crédito digitales y modelos de scoring. El siguiente caso describe cómo los proveedores están facilitando la entrada de proveedores de SFD en el mercado masivo de nano-créditos. ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 89 1.2_APLICACIONES DE DATOS CASO 11 Tiaxa, un Enfoque Completo de Nano-Crédito Desarrollo de Productos y Servicios de Datos a Través de Servicios de Suscripción Externalizados Reconociendo que muchas Tiaxa reúne Instituciones Financieras gestiona mediante el débito directo Instituciones Financieras en los y MNOs y forma alianzas tripartitas de las cuentas MNO del prestatario mercados en desarrollo carecen de los en las que: para evitar la morosidad, que se recursos para abordar el mercado de acuerda con los prestatarios en los • MNOs suministran los datos que Servicios Financieros Digitales solo términos y condiciones del producto. nutren sus modelos de decisión de utilizando recursos internos, Tiaxa Su modelo de negocio de alianzas a crédito ofrece sus NanoCredits™ patentados largo plazo funciona en términos dentro de una solución completa • IF proporcionan las licencias que varían de la participación en los que incluye: de crédito necesarias (y la beneficios a los modelos de pago por reglamentación formal del sector • Diseño de producto transacción. financiero) y la financiación • Adquisición de clientes (basada en • Tiaxa proporciona la solución Datos que Impulsan los Modelos de modelos de scoring patentados) de producto de nano-crédito de scoring de Tiaxa • Gestión del riesgo Crediticio de la extremo a extremo Aunque los conjuntos de datos Cartera Además de proporcionar los modelos MNO varían según los países y los • Despliegue de hardware y software mercados, los conjuntos de datos que de diseño y scoring de nano-créditos • Gestión de servicios las veinticuatro basados en datos de MNO, en la informan a los modelos patentados horas del día mayoría de los casos, Tiaxa asume de Tiaxa típicamente incluyen una • Línea de financiación para cartera y gestiona el riesgo de crédito de combinación de los siguientes tipos (en algunos mercados africanos) la cartera. El riesgo de pérdida se de datos: 90 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES Uso GSM Nómina, pagos Transferencias de Información de Pagos de servicios Depósitos regulares dinero KYC públicos • Frecuencia de • Nómina, subsidios • Frecuencia y valor • Nombre completo • Indicador de flujo • Información de flujo recarga, montos • Flujo de caja, • ¿Recepción o envío? • Tipo de cuenta de caja de caja • Información de necesidades de • Registrar fecha • Sofisticación consumo de GSM crédito financiera • Estado de KYC • Fecha de nacimiento región Tabla 10: Tipos de Datos que Informan a los Modelos Patentados de Tiaxa Tiaxa utiliza una gama de métodos de Tiaxa cuenta ahora con más de 60 procesa más de 12 millones de nano- aprendizaje automático para reducir instalaciones, con 28 clientes, en 20 créditos por día en todo el mundo, cientos de posibles predictores a un países, en 11 grupos MNO, con más principalmente en forma de créditos de modelo óptimo. Se diseñan modelos de 1.5 billones de usuarios finales entre tiempo aire. a medida para cada consultoría. ellos. En la actualidad, la compañía A medida que evoluciona el panorama de la analítica de datos, se espera que los proveedores externos desarrollen soluciones completas que se conecten a fuentes de datos internas y entreguen valor a los productos existentes. Las empresas que no pueden invertir en analítica de datos a la medida o que prefieren un enfoque de ‘esperar y ver’ pueden aprovechar los servicios de suscripción en el futuro enviando datos a proveedores externos. ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 91 1.2_APLICACIONES DE DATOS Para las Instituciones Financieras, la datos de los nuevos solicitantes es Estas fuentes de datos en línea no elección entre trabajar con proveedores pidiéndoles directamente que proporcionen tradicionales pueden y están siendo o trabajar directamente con operadores información. Estas solicitudes pueden utilizadas para ofrecer servicios de telefónicos para llegar al segmento verificación de identidad y score crediticio. tomar la forma de: de nano-créditos sólo puede hacerse La historia de la empresa de análisis de considerando las condiciones del mercado • Formularios de Solicitud redes sociales Lenddo proporciona más y los recursos disponibles. A continuación, información y algunos conocimientos sobre se presentan algunos de los pros y contras • Encuestas cómo los datos de redes sociales pueden de cada enfoque. • ‘Permisos’ para Acceder a Datos del agregar valor en el proceso de crédito. Dispositivo: Esto puede incluir permisos Caso de Uso: Datos Alternativos para acceder a contenido multimedia, Las fuentes alternativas de datos se registros de llamadas, contactos, muestran prometedoras a la hora de verificar la identidad y hacer una comunicaciones personales, información evaluación básica del riesgo. Otra forma de ubicación o perfiles de redes sociales en que los proveedores de SFD recogen en línea Enfoque Oportunidades Desafíos Trabajar con Datos de MNOs • Control total de los productos Necesidad de habilidades internas en: • Potencialmente más rentable • Desarrollo de productos • Modelado de riesgo Necesita sistemas y software para administrar productos de SFD Trabajar con el Proveedor • Proporciona conocimientos sobre productos, modelado • Dependencia en proveedor externo Externo y sistemas • Los detalles del modelo no se pueden compartir • Toma decisiones crediticias • Habilidades técnicas no transferidas • Soluciones de software listas Tabla 11: Trabajar con MNOs o Proveedores Externos: Oportunidades y Desafíos 92 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES CASO 12 Lenddo hace Minería de Datos de Redes Sociales para la Verificación de Identidad y Perfil de Riesgo Uso de Técnicas Analíticas Avanzadas y Fuentes Alternativas de Datos para Productos Nuevos Los cofundadores de Lenddo, servicios bancarios - y menos del extraen y califican, pero luego son Jeffrey Stewart y Richard Eldridge, 10 por ciento lo hacían - ellos eran destruidos (en lugar de almacenados) concibieron inicialmente la idea ‘invisibles’ para las IF formales y no por Lenddo. Para un solicitante mientras trabajaban en la industria podían obtener crédito. Al desarrollar típico, su teléfono contiene miles de tercerización de procesos de su idea, los fundadores de Lenddo de puntos de datos que hablan del negocios en Filipinas en 2010. muy pronto reconocieron que sus comportamiento personal: Ellos se sorprendieron por el número empleados eran usuarios activos de • Tres Grados de Conexiones Sociales de sus empleados que habitualmente la tecnología y estaban presentes en les pedían adelantos salariales y las redes sociales. Estas plataformas • Actividad (fotos y vídeos publicados) se preguntaban por qué estas generan grandes cantidades de datos • Membresías en Grupos personas jóvenes y brillantes y esperaban que el análisis estadístico • Intereses y Comunicaciones (mensajes, con empleos estables no podían de estos pudiera ayudar a predecir la correos electrónicos y tweets) obtener créditos de las instituciones capacidad crediticia de un individuo. financieras formales. Más de 50 elementos en todos Los solicitantes de créditos de los perfiles de redes sociales El desafío particular en Filipinas era Lenddo dan permiso para acceder proporcionan 12.000 puntos de que el país no tenía burós de crédito ni a los datos almacenados en sus datos por usuario promedio: números de identificación nacionales. teléfonos móviles. Los datos en Si la gente no usaba cuentas o bruto del solicitante se visualizan, Entre Todas las Cinco Redes Sociales: 7900+ Comunicaciones de Mensajes Totales: • 250+ conexiones de primer grado • 250+ conexiones de primer grado • 800+ conexiones de segundo grado • 5,200+ mensajes de Facebook, 1,100+ Facebook me gusta • 2.700+ conexiones de tercer grado • 400+ actualizaciones de estado de Facebook, 600+ comentarios • 372 fotos, 18 videos, 13 grupos, 27 intereses, 88 enlaces, 18 tweets de Facebook • 250+ correos electrónicos Tabla 12: Promedios de Puntos de Datos de Redes Sociales por Usuario Promedio ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 93 1.2_APLICACIONES DE DATOS Uso de Datos los productos crediticios digitales, La plataforma SNA de Lenddo se donde no hay contacto personal utilizó para proporcionar verificación La confirmación de la identidad de durante el proceso de suscripción. de identidad en tiempo real en un prestatario es un componente A continuación, se presenta un segundos basándose en el nombre, importante para conceder el crédito ejemplo del trabajo de Lenddo con el a fecha de nacimiento, y el empleador. a los solicitantes sin antecedentes MNO más grande de Filipinas. Esto mejoró la experiencia del crediticios anteriores. La aplicación cliente, redujo los posibles fraudes y en formato de tableta de Lenddo Lenddo trabajó con un gran MNO errores causados por la intervención pide a los solicitantes de crédito para aumentar la cuota de planes humana y redujo el costo total del que completen un formulario postpago que podría ofrecer a sus proceso de verificación. digital corto pidiendo su nombre, 40 millones de suscriptores de fecha de nacimiento, número prepago (90 por ciento del total de Además de sus modelos de verificación de contacto principal, dirección suscriptores). La elegibilidad para de identificación, Lenddo utiliza de correo electrónico principal, planes postpago dependía de una una serie de técnicas de aprendizaje colegio y empleador. Luego, se verificación de identidad exitosa, y automático para mapear las redes pide a los solicitantes ingresar a el proceso de verificación existente sociales y agrupar a los solicitantes Lenddo entrando y concediendo de la Telco requería que los clientes en términos de patrones de permisos a Facebook. Los modelos visitaran las tiendas y presentaran comportamiento (uso). El resultado de Lenddo usan esta información sus tarjetas de identificación, final es un LenddoScore™ que puede para verificar la identidad del las cuales luego eran escaneadas y ser utilizado inmediatamente por las cliente en menos de 15 segundos. enviadas a una oficina central para Instituciones Financieras para filtrar La verificación de identidad puede su verificación. El tiempo promedio a los solicitantes o para alimentar y reducir significativamente el riesgo para completar el proceso de complementar los scorecards propios de fraude, que es mucho mayor para verificación fue de 11 días. de una IF. Estos algoritmos convierten un número inicialmente grande de puntos de datos sin procesar por cliente, en un número manejable de características y comportamientos del prestatario con relaciones conocidas respecto del pago de créditos. 94 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES Caso de Uso: Scoring Crediticio de datos, pero no necesariamente han y mantienen modelos, incluidos modelos para Pequeñas Empresas digitalizado o sistematizado su captura, separados para el apoyo a las decisiones análisis y almacenamiento. En los mejores de aplicación, la gestión permanente de Los ejemplos mencionados hasta ahora casos, el software LOS facilita la captura cartera (comportamiento) y provisiones. se han centrado en los productos digital de datos tradicionales de una Como primer paso al desarrollo de modelos digitales dirigidos a consumidores manera conducente a la analítica de datos, internos, las IF pueden optar por utilizar de mercado masivo y comerciantes. incluyendo el desarrollo de scorecards consultores externos para hacer los El flujo de datos de comportamiento de crédito. A medida que la cadena de desarrollos iniciales y para crear capacidad creado en los canales digitales ha valor y los pagos en cadena de suministro con el personal interno para llevarlo generado comprensiblemente la mayor se digitalizan, existe la oportunidad de adelante. expectativa sobre las oportunidades aprovechar estos datos para proyectar de la analítica de datos. Sin embargo, flujos de efectivo y generar puntuaciones Muchos proveedores de Servicios la mayoría de las Instituciones Financieras de crédito. Financieros Digitales tienen datos, analistas también tienen muchas oportunidades de datos y especialistas en TI internos para hacer un mejor uso de los datos en el Metodologías de Score Crediticio capaces de administrar sus propios sistemas análisis de crédito y la gestión de riesgo de Las IF tienen varias opciones para usar los de scoring. Lo que estos equipos tienden los productos tradicionales y fuera de línea datos que ya recogen para el modelado del a carecer es experiencia en el desarrollo que incluyen, pero no se limitan a: riesgo de crédito. Tres de las soluciones más de scorecards de crédito. Los buenos comunes son el desarrollo de scorecards proyectos de analítica de datos requieren • Créditos de Consumo de crédito propios, ya sea a través del conocimientos expertos para tener éxito. • Tarjetas de Crédito conocimiento experto interno, mediante La asistencia externa puede ayudar a la el trabajo con consultores externos, o • Préstamos y Arrendamientos de Micro, transferencia de conocimientos a construir mediante la tercerización del scoring Pequeña y Mediana Empresa (MiPyMe) la experiencia interna como parte del crediticio a un proveedor externo. • Pequeños Préstamos y Arrendamientos apoyo al proyecto. Cuando se trabaja con Agrícolas Desarrollar Scorecards de consultores externos, los proveedores de Crédito Propios SFD deben asegurarse que las herramientas • Cadena de Valor y Financiación de Los bancos de los principales mercados y habilidades necesarias se transfieran a los Cadena de Suministros. financieros (por ejemplo, Sudáfrica, América equipos internos para que los scorecards Para estos productos, las IF han recogido del Norte, Europa continental y Singapur) puedan ser administrados y monitoreados tradicionalmente una gran cantidad emplean grandes equipos que desarrollan en el futuro. ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 95 1.2_APLICACIONES DE DATOS Una Mirada más Cercana a los Scorecards Propios Subcontratar el Scoring Un reciente proyecto de IFC con un banco en Asia ejemplifica cómo el proceso Crediticio a un Proveedor puede funcionar: Externo La mayoría de los proveedores externos 1. El banco compartió sus datos de cartera anteriores con el consultor. ofrecen el desarrollo de modelos 2. El consultor preparó los datos para el análisis utilizando el software personalizados utilizando los datos de estadístico de código abierto ‘R’. buró (cuando están disponibles), los 3. El banco convocó a un grupo de trabajo de scoring crediticio para trabajar datos propios del banco, así como datos con el consultor. En un ambiente de taller, el consultor y el grupo de trabajo analizaron y seleccionaron los factores de riesgo para scorecards de terceros como los datos de CDR. de créditos de consumo y de micro-empresas. Los proveedores normalmente también 4. El banco vinculó a un nuevo analista para que asumiera la responsabilidad proporcionan software de despliegue principal de los scorecards (y el analista también participó en los del scorecard y mantienen los modelos talleres ‘R’). para el FI. Trabajar con proveedores 5. El grupo de trabajo de scoring crediticio y el consultor revisaron las de score crediticio externaliza el fortalezas y debilidades de los modelos resultantes para alinear las conocimiento experto de scoring y estrategias de uso con los objetivos comerciales del banco y el apetito por las plataformas de software, a menudo el riesgo. aportando nuevos datos que de otro Con la orientación inicial del consultor, el banco y su proveedor de 6. modo serían inalcanzables. También software local desarrollaron una plataforma de software para desplegar aporta experiencia internacional y el scorecard. credibilidad inmediata a la solución 7. El consultor proporcionó soporte remoto en el monitoreo y administración de scoring. del scorecard. Los pros y los contras de tales arreglos incluyen: A continuación, se muestra un ejemplo del trabajo de First Access Pros: Contras: con un banco en África Oriental en el segmento de créditos para pequeñas El Banco aprende las habilidades necesarias • • Requiere la vinculación activa de los gerentes para apropiarse de los modelos senior y junior empresas, un segmento para el cuál • El Banco tiene control completo sobre sus • Requiere capacitación del personal o la los datos de MNO solos no bastan para scorecards integración de analítica de datos y especialistas evaluar de forma exhaustiva el riesgo • Los scorecards son totalmente transparentes en modelado de riesgo. crediticio del solicitante. Requiere software de despliegue adicional, tal • como un LOS con funcionalidad de scoring • El desarrollo interno trae consigo requisitos de mantenimiento a largo plazo Tabla 13: Pros y Contras de los Scorecards Propios 96 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES CASO 13 First Access: Scoring crediticio con Proveedor Externo de Servicio Integral Tercerización de Conocimiento en Datos y Trabajo con Aliados Externos Muchas Instituciones Financieras compañía inicialmente trabajó utilizó un sólo proceso para todos los están interesadas en utilizar el extensamente con Vodacom Tanzania, solicitantes que entraran por la puerta. scoring crediticio para aumentar aprovechando sus datos MNO para la consistencia y eficiencia de la desarrollar una herramienta de auto- First Access estudió los datos evaluación de crédito para pequeños decisión para proveedores de Servicios históricos de la cartera del banco créditos. Sin embargo, un número Financieros Digitales que atiende a para el segmento y construyó un menor de IF en los mercados en clientes de bajos ingresos sin historial algoritmo de scoring utilizando desarrollo tiene la capacidad interna de crédito formal. Desde entonces, sólo la información disponible en de desarrollar e implementar ha ampliado su presencia a la RDC, el momento de cada solicitud de scorecards de manera eficiente sin Malawi, Nigeria, Uganda y Zambia, crédito, sin incluir datos adicionales ayuda alguna externa. trabajando más ampliamente en las normalmente recopilados en visitas soluciones de scoring para el segmento dispendiosas a la sede de la empresa Como se mencionó anteriormente, de micro y pequeñas empresas. del solicitante, una característica el trabajo con proveedores externos First Access trabajó con un banco en típica de un proceso de suscripción de scoring crediticio subcontrata el este de África para desarrollar un de microcrédito. A pedido del banco, la experiencia de scoring y las plataformas de software, y a menudo scorecard para sus (micro) créditos el modelo clasificó a los solicitantes en aporta experiencia internacional y a pequeñas empresas, centrado en cinco segmentos de riesgo. credibilidad inmediata a la solución préstamos de hasta $3,000. El banco tomó un promedio de seis días para Una ‘prueba ciega’ de todos de scoring. evaluar las solicitudes de préstamos, los microcréditos vencidos, First Access es uno de los muchos y además de los largos tiempos desembolsados durante los seis proveedores de scoring de crédito, pero de espera, sus NPL habían estado meses anteriores, indicó que las uno de los relativamente pocos que se aumentando. Al igual que muchos puntuaciones clasificaron a los centra en los desafíos particulares que bancos en los mercados emergentes, prestatarios por riesgo, como lo enfrentan los mercados emergentes. no tenía herramientas para seleccionar indican las tasas negativas en la Tabla Fundada en julio de 2012, la o puntuar a los clientes, y por lo tanto 14 a continuación. Segmento de Riesgo A B C D E CeR (Cartera en Riesgo) 1.00% 3.53% 9.97% 22.42% 26.78% Tabla 14: Clasificaciones de Prestatarios de Microcréditos por Riesgo ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 97 1.2_APLICACIONES DE DATOS Utilizando el algoritmo de scoring, la prueba ciega original, el banco sus propios algoritmos de scoring cada solicitante podría ser puntuado está ampliando el uso del algoritmo personalizados y utilizar sus propios inmediatamente y asignado a uno para llevar a cabo más aprobaciones datos sobre su base de clientes y de los segmentos de riesgo. El banco y rechazos de créditos en el mismo producto crediticios. Actualmente, ajustó su proceso de evaluación de día para clientes repetidos y nuevos. First Access está desarrollando crédito para ofrecer aprobación el La aceleración de los grupos A y nuevas herramientas en su mismo día a sus clientes recurrentes plataforma para dar a las IF más B han aumentado la eficiencia de en los segmentos A y B, que control y transparencia en la gestión la institución en la suscripción de representaban el 22 por ciento de los de sus reglas de decisión, cálculos microcréditos en un 18 por ciento, solicitantes de préstamos. El tiempo de scoring y umbrales de riesgo, con y ambos grupos han superado los de aprobación para este grupo de resultados de las pruebas ciegas, con monitoreo continuo del desempeño clientes se redujo de un promedio de CeR combinado1 del 1,26 por ciento del algoritmo. Dichos paneles de seis días a un día, lo que mejoró la en lugar del 3 por ciento esperado. control de analíticas de desempeño experiencia del cliente y la eficiencia pueden ayudar a las IF a gestionar y satisfacción del personal del banco. La plataforma de software First mejor el riesgo en respuesta a los Dado que los resultados del Access permite a las Instituciones cambios en el mercado. algoritmo en la práctica han validado Financieras configurar y gestionar Pros: Contras: Acceso a habilidades de modelamiento de primer nivel y experiencia • • El banco no es dueño del modelo y por lo general no sabe el cálculo internacional de scoring • Proporcionar software de despliegue • Los costos fijos del uso del modelo y desarrollo de modelos intermitentes • Potencialmente acortar el tiempo necesario para desarrollar e implementar el scorecard • Gestionar y supervisar el scorecard y el software Tabla 15: Pros y Contras de la Tercerización del Scoring Crediticio a un Proveedor Externo Un enfoque de Tercerización para el desarrollo de productos de datos proporciona soluciones rápidas y conocimientos especializados, pero también puede traer consigo un riesgo de mantenimiento a más largo plazo, problemas de propiedad intelectual (PI) y un requisito de que los diseños de proyectos se delimiten en detalle para asegurar resultados útiles. 98 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES Accesibilidad y Privacidad los dispositivos, y convierten estos en perfiles de clientes utilizables y vendibles. Existen dos retos fundamentales para el Las consideraciones de privacidad han uso de nuevas formas de datos digitales: limitado la disponibilidad de algunos datos, la accesibilidad y la privacidad. Para y no hay garantía de que, por ejemplo, beneficiarse de nuevas fuentes de datos los datos de redes sociales sigan siendo digitales, los Proveedores de Servicios una fuente de datos consultable para los Financieros deben tener acceso a estos modelos de crédito en el futuro. Facebook datos en un formato que pueda ser ya ha tomado medidas para limitar la analizado. Dos de las principales formas cantidad de datos que los servicios de de acceder a dichos datos es comprando terceros pueden extraer de los perfiles de la data o colaborar con el proveedor usuario,35 y los datos que hace accesibles externo. Algunos MNO, como Safaricom de a través de su API sólo se pueden utilizar Kenia, venden campos de datos agregados legalmente para la verificación de pre-procesados - tales como el gasto identidad. En los Estados Unidos, la FTC, promedio mensual o el uso de llamadas que monitorea las reglas sobre los datos - directamente a los Proveedores de de crédito y de consumo, ha indicado que Servicios Financieros. Algunos proveedores las redes sociales corren el riesgo de ser externos también procesan grandes reguladas como agencias de información conjuntos de datos sin procesar extraídos al consumidor si sus datos son utilizados de los MNO, redes sociales y datos de como criterios de crédito.36 35 Seetharaman y Dwoskin, ‘Facebook’s Restrictions on User Data Cast a Long Shadow’, Wall Street Journal, Septiembre 21 de 2015 36 ‘Facebook Settles FTC Charges That It Deceived Consumers By Failing To Keep Privacy Promises’, Sitio de Noticias de la Comisión Federal DEL Comercio, Noviembre 29 de 2011, consultado Abril 3 de 2017, https://www.ftc.gov/news-events/press-releases/2011/11/facebook-settles-ftc-charges-it-deceived-consumers-failing-keep/ ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 99 Da tos Ap li PARTE 2 e d dos to de ca D Marco del Proyecto de Datos ci tos y M ica on a é ít es Capítulo 2.1: Gestión de un Anal Proyecto de Datos Proy Ges cto os ti ó n e d rs de e un cu Da Re t o s  El Data Ring Administrar cualquier proyecto es complejo y requiere los ingredientes adecuados; la intuición empresarial, la experiencia, las habilidades técnicas, el trabajo en equipo y la capacidad para manejar eventos imprevistos, determinarán el éxito. No hay receta para el éxito. Dicho esto, hay maneras de mitigar los riesgos y maximizar los resultados, aprovechando los marcos organizacionales para la planificación y aplicando buenas prácticas establecidas. Esto también es válido para un proyecto de datos. Esta sección presenta los componentes básicos necesarios para planificar un proyecto de datos bien gestionado utilizando un marco visual denominado el Data Ring. Los componentes organizativos del marco se basan en las mejores prácticas de la industria, reconociendo los requisitos generales de recursos y los pasos del proceso que son comunes en la mayoría de los proyectos de datos. Tiene puntos en común con el Cross Industry Standard Process para la Minería de Datos (CRISP-DM), un enfoque de proceso de análisis de datos que cobró importancia después de su lanzamiento en 1996 y fue ampliamente utilizado a principios de los años 2000.37 Su énfasis en la minería de datos y las herramientas computacionales que prevalecen hace dos décadas ha hecho que el uso del método disminuya considerablemente con el surgimiento del Big Data y técnicas contemporáneas de la ciencia de los datos. El sitio web original de CRISP-DM se desconectó hacia 2014, quedando sin un estándar específico de la industria para los proyectos de datos actuales. El marco Data Ring aprovecha los conceptos de los métodos establecidos de la industria, con un enfoque modernizado para las tecnologías actuales y las necesidades de los equipos de ciencias de la información. Fue desarrollado por Christian Racca y Leonardo 37 Cross Industry Standard Process for Data Mining. En Wikipedia, La Enciclopedia Libre, consultado el 3 de abril de 2017, https://en.wikipedia.org/wiki/Cross_Industry_Standard_Process_for_Data_Mining/ 100 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES Camiciotti38 como una herramienta de El enfoque de Data Ring se diseña planificación para ayudar a reconocer alrededor de la mitigación del riesgo y de los elementos centrales del proyecto y la mejora continua; está diseñado para reflexionar sobre los requisitos de recursos evitar inicios defectuosos, para asegurar del proyecto de datos y sus relaciones de un enfoque orientado a objetivos y evitar forma estructurada. En colaboración con los peores escenarios. Puede usarse como los autores originales y Soren Heitmann, una guía continua para definir y refinar el Data Ring y la herramienta asociada, metas. Esto ayuda a mantener la fase de el Data Ring Canvas, fueron adaptados para ejecución bajo control y ofrece resultados este manual. La idea clave es proporcionar de la mejor manera posible. El proceso una herramienta que apoye a los directores de razonamiento es circular, pidiendo a de proyectos durante todo el proceso. los gerentes que vuelvan a examinar las A continuación, se muestra una lista de preguntas centrales de planificación con distintas maneras en que debe usarse la cada iteración, refinando, ajustando y herramienta: ejecutando. Cuando surgen problemas, la idea es instar a los gerentes a dar una • Lista de control: Una lista de verificación vuelta completa, considerando cada o “lista de la compra”, mediante la cual cuadrante del anillo como una fuente de se analiza la presencia (y los vacíos solución potencial. relacionados) de los ingredientes necesarios para emprender un proceso El diagrama del Data Ring es bastante basado en datos. complejo, ya que describe el conjunto • Herramienta Descriptiva: El Data principal de consideraciones necesarias Ring es un potente marco para explicar para planificar un proyecto completo. el proceso basado en datos (puede ser Los gerentes de proyecto pueden un informe interno, una presentación considerar la impresión del diagrama como pública o una publicación científica). una referencia visual singular para diseñar un proyecto de datos. En las siguientes • Espejo de Retroalimentación secciones, cada una de estas estructuras Continua: A partir de la definición de los detalladas se desglosará paso a paso y se objetivos y terminando en los resultados, discutirán. La sección concluye con un cada ciclo de iteración proporciona caso de uso paso a paso para ejemplificar retroalimentación para refinar el proceso cómo el Data Ring puede ser utilizado y reevaluar el diseño. adicionalmente como una herramienta de • Herramienta Focal: Para mantener el foco planificación. del proyecto sobre los objetivos, mientras se hace monitoreo de metas claras. 38 Camiciotti y Christian ‘Creare valore con i BIG DATA’. Data Ring adaptado para Servicios Financieros Digitales Handbook, Edizioni LSWR (2015): http://dataring.eu/ ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 101 2.1_GESTIÓN DE UN PROYECTO DE DATOS  Estructuras y Diseño Herramientas y Habilidades de score crediticio, por ejemplo. Los datos Los bloques superiores del Data Ring se numéricos se introducen: edad, ingresos Cinco Bloques Estructurales centran en evaluar los recursos ‘duros’ y e historial de morosidad, por ejemplo. ‘blandos’ requeridos para implementar un Los resultados son score crediticio, o más El Data Ring ilustra el objetivo en el proyecto de datos: datos numéricos. El proceso consiste en la centro, rodeado por cuatro cuadrantes. entrada y salida de datos. Cinco Bloques Estructurales: Objetivo, • Recursos Duros: Incluyendo los datos Herramientas, Habilidades, Proceso, y Valor. mismos, herramientas de software, De hecho, este principio de “entran Los cuatro cuadrantes se subdividen en procesamiento y hardware de datos– salen datos” es continuamente almacenamiento. aplicable en todo el proyecto de datos. 10 componentes: Datos, Infraestructura, • Recursos Blandos: Incluye habilidades, Puede aplicarse a todas las exploraciones Informática, Ciencia de Datos, Negocios, conocimiento del sector y recursos analíticas intermedias y pruebas de Planificación, Ejecución, Interpretación, Ajuste, humanos para la ejecución. hipótesis, más allá de simples descripciones e Implementación. Un plan de proyecto de las condiciones de inicio y terminación. debe encaminarse a encapsular estos Proceso y Valor El proceso circular del Data Ring ilustra componentes y a entender en forma Los bloques inferiores del Data Ring de manera similar un enfoque iterativo profunda sus relaciones interconectadas. se centran en la implementación y que pretende refinar, a través de ciclos, El enfoque organizacional del Data Ring lanzamiento, aunque éstos consisten en la comprensión de los fenómenos desde ayuda a los gerentes de proyecto a definir tres actividades concretas: el punto de vista del análisis de datos. recursos y articular estas relaciones; cada 1. Planificación de la ejecución del proyecto Esto permite una descripción de las causas componente está provisto de un conjunto (entran datos) y efectos (salen datos), y la 2. Generación y manejo de los datos - la identificación de los comportamientos y de preguntas guía, que están alineadas fase de ejecución patrones emergentes no obvios. Los cinco visualmente en forma perpendicular al 3. Interpretación y ajuste de los resultados bloques organizacionales principales del componente. Estas preguntas guía sirven para implementar la meta del proyecto y Data Ring están diseñados para planificar como una lista gráfica de planificación extraer valor y lograr el equilibrio entre especificidad y de recursos. flexibilidad a lo largo del ciclo de vida del Diseño Circular proyecto de datos. Objetivo: Bloque Central Un elemento central del Data Ring es su Establecer objetivos claros es la base de diseño circular. Esto enfatiza la idea de En términos prácticos, la planeación de mejora continua y optimización iterativa. proyectos debe considerar el bloque cada proyecto. Para una solución basada Estos conceptos son especialmente críticos de cada anillo en secuencia, iterando en datos a un problema, sin objetivos para los proyectos de datos, formando hacia el plan general. El enfoque circular cuantitativos y medibles, todo el proceso elementos establecidos de diseño y busca establecer las medidas necesarias de análisis de datos está en alto riesgo planificación de proyectos de buenas para lograr un proceso mínimo viable. de fracaso. Esto se traduce en un bajo prácticas. Esto se debe a que el resultado Es decir, cuando se pueden introducir datos conocimiento del valor agregado y puede de cualquier proyecto de datos es, en el sistema, se analizan y se obtienen dar lugar a interpretaciones engañosas. simplemente, más datos. Tómese un modelo resultados satisfactorios - y luego se repiten 102 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES El Data Ring sin romper el sistema; por ejemplo, con un conjunto de datos actualizado unos meses más tarde que incluye nuevos clientes. Una del vez establecido, el proyecto puede iterar al to al ien eg siguiente nivel para entregar un producto yL Sec ocim Marc mínimo viable (PMV). Este es el producto De d tor Fl a n p uj cid os al Co ós de datos más básico. o ci iva de So ito de Pr D ia Infor n at má nc a ió tu r ti c Un producto de datos es un modelo, algoritmo os c ie c a tru iza C Ac al ce es ENCAJE Ne su s si bil ra go Vi tos ne o procedimiento que toma datos y alimenta ida nf HA a cio ica d AS BI D n de forma fiable los resultados en el entorno I mu ci NT LI os Form Co atos IE s a través de un proceso automatizado. to Ci DA AM Da 2 en En otras palabras, sus resultados de salida DE 1 RR cia S se integran en un contexto operativo más HE de D amplio sin cálculo manual. Esto es lo que atos OBJETIVO (S) establece un producto de datos aparte de OPS US O un análisis singular. Un producto de datos Imple puede ser sencillo - como una visualización Punto d interactiva del panel de control - pero e me 4 Referen cia también hay productos de datos altamente nta 3 O n VA ció Mét ES O ció C rica R complejos, donde el score crediticio L sy ea O Defi n PR an Pr nici us es one alimenta procesos semiautomáticos de Pl A s te up s j to ón u Da In RESULTADOS ci A lia es to toma de decisiones de crédito, influyendo da ter cu yT tra os pre E j e nz iem En es taci ón a y po en la generación de nuevos clientes con Go ato oc Te s D Pr rc os bi s y er datos que retroalimentan el modelo de er at a iz no ur aD ac t ió score crediticio para guiar las nuevas uc de n lid tr Es Sa decisiones crediticias. El hecho que los productos de datos sean consumidores de sus propios resultados afirma su principio circular. El inventario de datos crece con cada iteración. Esto también enfatiza el enfoque organizacional del Data Ring Figura 19: Data Ring, una Herramienta Visual de Planeación para Proyectos de Datos con la meta situada en el centro, guiando los datos a analizar y si ha llegado o no el momento de detener la iteración y evaluar el objetivo alcanzado. ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 103 2.1_GESTIÓN DE UN PROYECTO DE DATOS  pruebas de hipótesis exploratorias, mediante problemas más grandes en asuntos más la emulación del método científico (véase el específicos, con el fin de tener un objetivo capítulo 1.1, El Método Científico). claro para un problema claro. Cumplir el objetivo marca la finalización Planteamiento del Problema del proyecto. Con un enfoque iterativo, Estratégico Empieza Pequeño. Para los nuevos es especialmente importante saber cuál La idea de “vender el problema antes que la es el aspecto del proyecto terminado proyectos de datos, un PMV es solución” ayuda a impulsar este enfoque y para evitar quedarse atascado en el ciclo la meta recomendada. Este es de refinamiento. Establecer métricas y ayuda a comunicar a las partes interesadas un objetivo básico y modesto, definiciones satisfactorias ayuda a guiar cuál es el problema y quién lo tiene. el camino del proyecto y advertirá de los Una vez que se discute el problema, creado para probar si un concepto riesgos si el proyecto empieza a desviarse. explicar la solución se vuelve simple. A de producto basado en datos Al igual que con la gestión operativa, continuación, se presentan dos ejemplos tiene valor. Una vez logrado, los el proyecto debe monitorear y evaluar de problemas estratégicos de Servicios gerentes de proyecto pueden sus KPIs a lo largo del proceso iterativo, Financieros Digitales: considerar los mismos conceptos asegurando que estos puntos de referencia continúen sirviendo al proyecto de la mejor • Problema: Los clientes existentes de Data Ring para escalar el PMV tienen bajas tasas de actividad de dinero manera posible. a un prototipo. electrónico. Establecimiento de Objetivos • Problema: Los clientes potenciales El objetivo es proponer una solución están excluidos del acceso a productos OBJETIVO (S) orientada a datos para un problema de microcrédito. El establecimiento de objetivos es el estratégico, con el fin de producir valor. primer paso de la planeación del proyecto. Las necesidades operativas del proyecto Definición del Objetivo El proyecto necesita saber hacia donde va se reflejan en los bloques estructurales En el contexto de un proyecto de datos, con el fin de saber cuando ha llegado. y en las preguntas guía del Data Ring. el objetivo es entregar un proceso basado En cierta medida, un enfoque basado Esto se traduce en claras necesidades de en datos y un producto con alguna en el destino para el análisis de datos, recursos, habilidades humanas y procesos especificación. Esto establece la senda del especialmente cuando se trata de concretos, todos ellos orientados por proyecto. También es importante saber estructuras, procesos y organizaciones los planteamientos del problema que el si la senda es buena; en otras palabras, complejas, podría conducir a proyecto busca resolver. Es probable que la descubrimientos inesperados y trayectorias definición de objetivos y el planteamiento si el producto se basa en una hipótesis no planeadas. El descubrimiento es de hecho del problema se definan en relación el razonable sobre por qué funciona y por qué un factor importante para los proyectos uno con el otro; considerar si el objetivo los resultados son fiables. La definición de de datos, permitiendo la exploración y previsto proporcionará la solución objetivos tiene dos partes: la especificación permitiendo al equipo de ciencia de los buscada; reflexionar sobre los matices del del producto y su hipótesis estratégica. datos ‘jugar’ con los datos. Dicho esto, debe problema estratégico; refinar uno o ambos Aquí hay dos soluciones propuestas a los hacerse de forma estructurada, a través de en consecuencia. Ayuda a descomponer problemas planteados anteriormente: 104 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES • Solución Propuesta: Un modelo mínimo Enmarcar el objetivo en términos de correlación es fuerte y fiable, esta hipótesis viable de predicción de segmentación de escala ayuda a definir los requerimientos impulsada por objetivos da credibilidad clientes para identificar usuarios activos de recursos y cómo los componentes del y fiabilidad al producto de datos. Una de alta propensión a aumentar las tasas proyecto deben encajar. Una prueba de hipótesis similar podría ser construida para de actividad. concepto de PMV podría ser entregada en un modelo de scoring crediticio con el fin de • Solución Propuesta: Un algoritmo un solo computador portátil en unas pocas probar la hipótesis, por ejemplo: los clientes de scoring crediticio del cliente a semanas. En comparación, la escala a nivel con pequeñas redes sociales tienen tasas nivel de producción para la emisión de producción puede requerir servidores de de incumplimiento de créditos más altas. automatizada de microcréditos. datos especiales, expertos para mantenerlos El ajuste de la hipótesis no se limita en modo y supervisión legal para garantizar la alguno a los proyectos de datos basados Especificación del Proceso y del seguridad de los datos. Sin embargo, la en algoritmos. Un tablero de visualización Producto producción de un PMV requiere recursos también tiene una hipótesis, con respecto a Como se ha detallado anteriormente, los duros y blandos (es decir, infraestructura y las relaciones entre los datos que pretenden dos productos de datos ejemplificados son personas), organizados de acuerdo con un ser consultados. Tal hipótesis puede no ser un modelo de predicción de segmentación proceso mínimo viable. Esto significa definir estadísticamente probada por algoritmos, de cliente y un algoritmo de scoring roles organizacionales claros, relaciones de pero la fiabilidad de la visualización se basa crediticio del cliente. Estos se especifican gestión y de presentación de informes. Así en estas relaciones que son consistentes por su escala, lo que ayuda a describir cuán es como una solución impulsada por datos y válidas en el tiempo. Debido a esto, la “grande” es el proyecto, o cómo se integra a un problema estratégico se pone en visualización continuará contando una en sistemas más amplios. marcha, cómo se identifican y resuelven los historia significativa o guiando la toma de La escala puede ser considerada a lo largo desafíos técnicos, y cómo se asegura que el decisiones útiles. de la siguiente progresión: producto concreto aporta valor estratégico. El principio de la “investigación reproducible” • Proceso: datos introducidos que Hipótesis ha cobrado importancia entre los científicos proporcionan resultados de forma fiable Lo que estos productos de datos hacen es de datos. La investigación reproducible describe a través de un proceso automatizado impulsado por una hipótesis subyacente, enfoques transparentes y repetibles para el • PMV: un concepto de producto y análisis y cómo se obtienen los resultados que sólo está implícita en estos dos proceso cuyos resultados evidencian un ejemplos. La identificación de usuarios en el primer pasó de escala del ‘proceso’. valor esencial activos de alta propensión tiene una En principio, se trata de permitir una • Prototipo: un concepto de producto hipótesis operativa; existe una correlación validación independiente de los resultados, con implementación básica, usabilidad y entre las variables que definen estos que puede ser pertinente a efectos fiabilidad normativos o de auditoría. Esta es la razón segmentos de clientes y las tasas de • Producto: un concepto probado con actividad. Por ejemplo, los clientes con por la cual el primer paso en la iteración implementación fiable y una propuesta alto nivel de tiempo aire tienen mayores cuando se utiliza el Data Ring es articular de valor demostrada tasas de actividad. Esta es una hipótesis un proceso mínimo viable; esto establece el • Producción: un producto sistemáticamente estadísticamente comprobable y, en última proyecto para lograr resultados fiables sobre implementado y a disposición de instancia, es la responsabilidad del equipo los que se basa el valor esencial del producto. usuarios o clientes de ciencia de los datos demostrarlo. Si la Este proceso apoya igualmente los ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 105 2.1_GESTIÓN DE UN PROYECTO DE DATOS  productos de datos para ver inmediatamente Mitigación: Saber lo que el proyecto inconsistencia lógica, como un negocio si y cuándo las hipótesis se vuelven poco pretende lograr. Si el equipo quiere hacer débil o una relación estratégica con el fiables, lo que puede provocar el reajuste algo, pero no está seguro de por dónde problema que se pretende resolver. de modelos para garantizar la fiabilidad de empezar, debe contratar a especialistas manera permanente. Mitigación: Establezca metas claras en operaciones de datos para que revisen y precisas con relevancia comercial Objetivos de Riesgos y Mitigación los datos y ayuden a arrojar luz sobre qué incorporadas en cada uno de los tipo de información relevante podrían Establecer las metas del proyecto en componentes de la hipótesis problema- proporcionar al negocio. El objetivo del términos de hipótesis formuladas, producto-hipótesis. Asegúrese que probadas y refinadas ayuda a mitigar los proyecto se demuestra generalmente pueden ser refinados a través de un riesgos comunes en los proyectos de datos. por la posibilidad de medir los resultados, enfoque iterativo y revisar estos a Los riesgos de una fijación inadecuada de pero es importante señalar que las medida que el proyecto avanza. Además, objetivos son: pruebas de hipótesis a menudo resultan asegúrese que existe una relevancia falsas. Esto es algo bueno. O iterar y Riesgo: No establecer Objetivos continua de los objetivos a medida que tener éxito, o aceptar que la idea no la estrategia empresarial evoluciona El principal riesgo es la ausencia de una funciona y volver a arrancar de cero. motivación estratégica de proyectos y de manera independiente. Planee la Esto es superior a un resultado bueno o objetivos o no objetivos. En otras palabras, exploración y flexibilidad dentro de interesante basado en datos incorrectos. este riesgo encapsula las motivaciones la ejecución del proyecto. Establecer para hacer algo significativo con los límites exploratorios es clave, ya que Riesgo: Falta de Foco datos debido al atractivo, para poder usar aseguran que los proyectos no se salgan Igualmente, relacionado con los riesgos palabras de moda, porque los competidores de su curso, al mismo tiempo que dan de proyectos que no establecen objetivos, lo están haciendo, o simplemente porque oportunidad al descubrimiento. Esto es científicamente o tecnológicamente están los proyectos cuyas metas son también es apoyado por las unidades idóneo - sin embargo, las motivaciones demasiado generales, están mal definidas de medida específicas y los objetivos carecen de una contrapartida basada en o son demasiado flexibles y cambiantes. asociados, o KPIs, tanto para los objetivos el valor. Este enfoque podría conducir a La meta establece la dirección y esboza lo intermedios como para el logro general resultados inutilizables o presupuestos que se logrará. La falta de claridad puede de metas. dilapidados, mientras que presenta una llevar a que los equipos se distraigan o oportunidad perdida de aprovechar el analicen las preguntas complementarias, Riesgo: No Basado en Datos análisis para obtener resultados orientados proporcionando así resultados auxiliares. El renombrado economista Roland Coase a objetivos que son relevantes para la Teniendo esto en cuenta, debe existir cierta declaró: “si torturas los datos lo suficiente, organización. Para aquellos especialmente flexibilidad para el refinamiento iterativo de confesarán”. El riesgo está obligando a motivados en hacer algo, no es raro traer las metas y permitir explorar y capitalizar los datos a revelar lo que uno espera en recursos externos que simplemente tienen el descubrimiento fortuito. La falta de un intento de validar el conocimiento, la tarea de descubrir algo interesante. Esto puede correr el riesgo de tener foco también puede ser el resultado de un el comportamiento o la organización resultados que no sólo son inutilizables, desajuste problema-solución. Esto sucede deseados. Pasar a un enfoque basado en sino erróneos, ya que la exploración cuando el problema estratégico subyacente datos significa estar dispuesto a observar abierta puede permitir análisis sesgados o no se puede definir con precisión, o cuando las pruebas que resultan del análisis de resultados forzados en la transmisión. la solución objetivo propuesta tiene una datos. En otras palabras, analizar proyectos, 106 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES procesos o procedimientos a través de Cuadrante 1: los datos deben ser almacenados, descritos datos podría conducir a resultados que de manera apropiada y accesibles. no estén alineados con las creencias, HERRAMIENTAS Esto requiere que se establezca una pensamientos o estrategias actuales, infraestructura técnica adecuada para forzando a una organización a realizar un gestionar los datos, su accesibilidad y cambio profundo. cálculo. Esto también permite el acceso a análisis de todo el sistema y a los patrones Mitigación: Emular el método científico atractivos que pueden generar valor. El para fijar los objetivos del proyecto primer cuadrante del Data Ring pide a los en función del tiempo, apoyados por directores de proyecto que consideren hipótesis rigurosamente contrastadas. sus datos y la infraestructura técnica Asegurar que la estrategia de ejecución necesaria para analizarla a través de dos utilice el concepto de investigación componentes: datos e infraestructura. reproducible para permitir la repetición Herramientas: Datos y la validación independiente de los resultados. Además, asegurarse que los Los datos son el insumo fundamental promotores del proyecto entiendan que (y el resultado) de un proyecto de datos. no se garantiza la búsqueda de patrones Figura 20: Data Ring Cuadrante 1: Las preguntas guía del Data Ring están valiosos. agrupadas en dos principios: accesibilidad HERRAMIENTAS y formato. Estos son elementos Riesgo: No Pragmático El mundo y sus fenómenos dinámicos críticos que afectan profundamente las Las metas deben ser realistas con pueden ser observados y fragmentados en necesidades de recursos y decisiones respecto a los recursos del proyecto y las datos. En otras palabras, los datos son muestras de procesos. expectativas del promotor, por ejemplo, de la realidad, registradas como mediciones En primer lugar, es necesario saber cómo competencia apropiada, infraestructura y almacenados como valores. Además, se describen los datos, sus propiedades y o presupuesto. los sistemas complejos desmienten el si representan números, texto, imágenes conocimiento adicional, que está integrado o sonido. Además, si están estructurados o Mitigación: Asegúrese que la escala en el comportamiento colectivo de los no estructurados. Los datos también deben del producto se considera como parte diferentes componentes del sistema. Los ser comprensible para los seres humanos y de la definición de objetivos. Esto componentes individuales no revelan deben existir en un formato digitalizado y ayuda a limitar el proyecto y empujar nada, pero los patrones emergen de la que pueda ser utilizado por una máquina. a los directores de proyecto para observación del sistema entero. Estos parámetros básicos son relevantes que coincidan con los recursos y los para los datos de todos los tamaños y requisitos. Además, asegúrese que La revolución de los datos ha proporcionado formas. Estos son factores críticos para un especialista en tecnología de la un aumento exponencial en el volumen, determinar la mejor infraestructura técnica información y la comunicación (TIC) la velocidad y la variedad de datos digitales. a utilizar para el proyecto. Consulte el realice una evaluación técnica de TI Esta mayor disponibilidad de datos digitales Capítulo 1 para más información sobre los del diseño del proyecto para asegurar permite mayor granularidad y precisión en formatos de datos. el pragmatismo entre el objetivo del la comprensión de procesos, actividades proyecto y las herramientas técnicas que y sus vínculos interrelacionadas. Para Recientemente, el concepto de Big Data ha se obtienen para entregarla. obtener conocimiento y valor de su análisis, cobrado importancia. Este es un concepto ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 107 2.1_GESTIÓN DE UN PROYECTO DE DATOS  útil, pero su importancia también ha creado Las siguientes preguntas marco ayudan a los costos las revisiones podrían significar conceptos erróneos. Particularmente, identificar las fuentes de datos y su alcance la necesidad de seleccionar diferentes la simple disponibilidad de una cantidad en términos de requerimientos de recursos infraestructuras computacionales o apreciable o “grande” de datos puede del proyecto. Si los sistemas internos diferentes capacidades de equipo. aumentar el conocimiento o proporcionar de datos no capturan lo que se supone, esto obliga a la planificación de recursos del Accesibilidad de Datos mejores soluciones a un problema. A veces esto es cierto. Sin embargo, a veces no lo proyecto a cambiar, identificando nuevos Se debe poder acceder a los datos para es. Aunque el big data puede proporcionar recursos de datos necesarios: poder usarlos. Puede parecer trivial, resultados, también es cierto que el small pero este problema es complejo y debe • ¿Qué datos se producen o recogen a considerarse al principio de cada proceso data puede lograr con éxito los objetivos través de las actividades centrales? basado en datos para asegurar que los del proyecto. Es importante que el director • ¿Cómo se producen esos datos (por resultados estén a tiempo y dentro del del proyecto asegure que hay datos ejemplo, qué productos, servicios, puntos presupuesto, o si los resultados son correctos (y suficientes) disponibles para el de contacto)? incluso posibles. La privacidad del cliente, trabajo y que las herramientas adecuadas • ¿Están los datos almacenados y la solicitud y la concesión de permisos de estén en su lugar. organizados o pasan por el proceso? uso de datos y el establecimiento de quién La definición de ‘big’ está cambiando tiene propiedad e interés legal una vez que • ¿Están listos los datos para su análisis en constantemente, por lo que habitarse en se otorguen los permisos de acceso a datos forma legible por una máquina? el término en sí rara vez beneficia a un son factores que dificultan la accesibilidad • ¿Los datos están limpios, o hay proyecto. Lo que es más útil en el concepto de los datos. La accesibilidad de los datos se irregularidades, valores faltantes o de Big Data es entender que cuanto puede juzgar según tres factores: dañados, o errores? más grande sea un conjunto de datos, • ¿Los datos disponibles son Legal más tiempo tomará analizarlos. Con esto estadísticamente representativos, para Las regulaciones podrían impedir que en mente, un conjunto de datos más grande permitir la prueba de hipótesis? un excelente y bien diseñado análisis también requiere capacidades de equipo • ¿Cuál es la relación entre el tamaño de los basado en datos se realice en su totalidad. técnico más específicas y la infraestructura datos y las necesidades de desempeño? Esto interrumpiría el proceso en una técnica más compleja, sofisticada o cara fase intermedia, por lo que es vital ser para manejarlo. La ‘escala’ de los datos Estas preguntas ejemplifican el esfuerzo consciente de las limitaciones legales desde también pueden relacionarse con la necesario en la fase inicial con el fin de el principio. escala de un objetivo; un PMV puede ser adquirir con éxito, limpiar y preparar alcanzable con sólo una muestra de datos, el conjunto de datos para su posterior La propiedad de los datos debe ser mientras que la producción puede requerir análisis. Dependiendo de cuánto control establecida, identificando quién tiene datos transaccionales de alta velocidad esté disponible en todo el proceso basado permiso para analizarlos para obtener continuos. Este es un elemento importante en datos, esta fase de preparación será conclusiones. Si hay acuerdos de propiedad del proceso de diseño del proyecto; el más larga o más corta, lo que significa intelectual, deben cubrir tanto los trabajos hecho de tener terabytes de datos de costos de proyecto más altos o más bajos. existentes como las derivadas. Si el análisis transmisión puede no ser suficiente para La planificación inadecuada de los datos es una colaboración de investigación, deben cumplir los objetivos de un proyecto. iniciales puede resultar en un aumento de establecerse acuerdos de publicación, 108 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES incluida la claridad sobre lo que constituye La información digital es necesaria para posible de acuerdo con la especificación del información de propiedad exclusiva y lo analizarla a escala y velocidad de máquina. propietario de los datos, o tal vez se niegue que puede hacerse público. Puede haber algunas excepciones acceso por completo. matizadas respecto de la regla y la IA está El uso ético de la información también Formatos de Datos empujando estos límites. puede tener restricciones legales. Los datos digitales se puede representar de Los datos sobre personas, grupos u Se necesita compatibilidad entre el organizaciones deben ser tratados con muchas formas y un formato de datos describe formato de datos y la tecnología utilizada cuidado, anteponiendo la seguridad como parámetros entendidos por humanos (es para gestionarlos. Incluso si se digitalizan primera consideración. Las regulaciones decir, texto, imagen, video, biométricos). los conjuntos de datos, pueden ser de protección de datos también pueden aislados e inaccesibles debido a elecciones A menudo, el formato es referido por el sufijo influir en cómo los datos pueden o no ser tecnológicas incompatibles hechas por de tres o cuatro letras al final de un archivo transferidos del propietario al analista, de computador. Formato también puede diferentes departamentos de la misma por ejemplo, si pueden ser enviados referirse a estructuras de almacenamiento empresa, gobierno u organización. A veces electrónicamente o por almacenamiento pueden existir sistemas obsoletos, que de datos y bases de datos de manera más físico. Además, las regulaciones pueden también pueden prevenir interacciones general, por ejemplo: Oracle, MongoDB y esbozar procedimientos para los datos con soluciones, lenguajes y protocolos JSON. (Consulte el Capítulo 1.1, Definición que salen de las fronteras nacionales, modernos. La cantidad de esfuerzos para de Datos). que se enrutan a través de terceros o se armonizar la infraestructura tecnológica almacenan en servidores ubicados en podría ser una barrera no trivial desde una Existen numerosos formatos de datos, países específicos. perspectiva de costo-tiempo. especialmente los de almacenamiento y Tecnológico procesamiento. El formato de datos está Estratégico Pueden existir barreras si los formatos de firmemente determinado por el contexto Los actores podrían tratar de preservar empresarial u organizacional y, en datos están desalineados con la tecnología seleccionada para el procesamiento y una ventaja competitiva mediante la particular, por las personas responsables de análisis de datos. Como un ejemplo simple, intermediación del acceso a sus activos la gestión de la creación, almacenamiento y un algoritmo PLN no se puede aplicar de datos. Esto generalmente puede procesamiento de datos. Para los gerentes significativamente a datos de imagen. tomar tres fromas: al requerir hardware de proyectos, reconocer la fragmentación del De manera más práctica, las bases de datos o software especial para leer formatos de formato y los problemas de incompatibilidad generalmente se optimizan para tipos datos de propiedad exclusiva; controlando son claves para establecer la alineación específicos de datos; y algunas tecnologías cómo se pueden utilizar los datos; de datos requerida para proyectos bien no están diseñadas para trabajar juntas, o mediante la exigencia de tarifas especiales de licencia. Considerando que los factores diseñados. La comprensión de los valores de forma similar a la construcción de un flujo de trabajo destinado a mezclar tecnológicos podrían ofrecer una solución registrados en un conjunto de datos, productos de Apple y Microsoft. Esto puede alternativa, aunque sea a veces compleja así como los metadatos más generales resultar en costos e ineficiencias, y puede o ineficiente, a menudo se establecen del conjunto de datos, ayuda a los crear problemas adicionales a resolver, factores estratégicos para garantizar directores de proyectos a planificar intentando alineaciones forzadas. deliberadamente que el acceso sólo es adecuadamente. ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 109 2.1_GESTIÓN DE UN PROYECTO DE DATOS  El valor de un punto de datos se refiere al números relacionados con los valores de las La comprensión de cómo los conjuntos contenido intrínseco de un registro de transacciones, tal vez los tiempos en que se de datos están conectados a través de datos. Este contenido se puede expresar realizaron las transacciones? Si el proyecto metadatos es un elemento clave del en forma numérica, temporal o textual, busca visualizar volúmenes en un mapa, diseño del proyecto y clave para identificar denominada tipo de dato. Para el análisis la ubicación del corresponsal también brechas y oportunidades de análisis. de datos, el factor crucial es que estos se convierte en un requisito de datos; Los metadatos ayudan a identificar dónde valores subyacentes no se vean afectados el proceso computacional debe ser capaz de pueden ser necesarios datos adicionales por errores o sesgos sistemáticos pedir al conjunto de datos que proporcione para cumplir con los objetivos del proyecto debidos a fallos en la infraestructura todos los valores de ubicación. Si la y cómo vincularse en nuevos conjuntos de o relacionados con el ser humano. categoría de ubicación no está compuesta datos cuando sea necesario. Los metadatos En general, los gerentes de proyectos no por metadatos definidos, entonces el ayudan a identificar eficiencias donde ya consideran cómo se recogen los datos o proceso no podrá encontrar coordenadas existen conjuntos de datos suplementarios; si la instrumentación está bien ajustada. GPS que representar graficamente. licenciar datos de terceros puede cerrar Es importante comprender cómo se La solución podría ser sencilla, quizás, agregar algunas brechas y también se podrían crear realizan estas mediciones subyacentes un título de ‘ubicación’ a esta columna metadatos derivados o sintéticos para y asegurar que exista una adecuada sin nombre. De esta manera, los equipos ayudar a contextualizar los conjuntos de transferencia de conocimientos entre los de proyecto pueden agregar información datos del proyecto. Para los gerentes de propietarios de datos y los analistas de contextualizada a conjuntos de datos y proyectos, es importante saber cuándo y datos sobre cuestiones clave de medición. proporcionar descripciones más detalladas dónde es probable que existan metadatos. Como ejemplo práctico, si un sistema de los datos (es decir, los metadatos) Si no forman parte de conjuntos de datos falló durante una actualización de TI, sobre los cuales el proceso analítico puede iniciales, puede ser mejor pedir esta esta actualización se verá reflejada en hacer preguntas y utilizar. En este sentido, información a los propietarios de los datos, una caída dramática en las transacciones. los metadatos son sólo otro conjunto en lugar de contextualizarlos como parte Los analistas deben ser conscientes de de datos. Los metadatos son especiales del trabajo del proyecto. esta información para interpretar la porque están inherentemente conectados anomalía correctamente. Las anomalías al conjunto de datos subyacente, lo que Herramientas: Infraestructura en los valores de los datos influyen en gran permite que este proceso de preguntas Como se explicó anteriormente, los datos medida en el proceso de limpieza de datos y respuestas tenga lugar. Esto es sólo un son el insumo (y el resultado) fundamental y la planificación de proyectos relacionada. ejemplo; los metadatos son algo más que de un proyecto de datos. La infraestructura Metadatos son ‘datos sobre datos’, lo cual encabezados de columna. Incluso en Excel, es el lugar a donde los datos físicamente incluye toda la información de antecedentes existen metadatos acerca de la hoja de entran y de donde salen. Los datos son adicional que enriquece un conjunto cálculo sobre la cuál se trabaja, por ejemplo, información digital que debe ser adquirida, de datos y lo hace más comprensible. tamaño del archivo, la fecha de creación y almacenada, procesada y calculada Las columnas de títulos de encabezados de el autor son todos ejemplos de metadatos. utilizando herramientas informáticas que se una hoja de Excel son metadatos (los títulos Estos metadatos subyacentes permiten ejecutan en computadores virtuales o físicos. son datos de texto que describen los valores la búsqueda y clasificación de archivos, de las siguientes filas). Por ejemplo, imagine por ejemplo, el sistema operativo puede La infraestructura tecnológica debe un conjunto de datos con las etiquetas, solicitar todos los archivos modificados adecuarse a los objetivos que se planteen ‘nombre del corresponsal’ y ‘volumen de en la última semana. Las respuestas en cuanto al volumen, la variedad y la transacción’, procedido por una columna se obtienen a través de los metadatos velocidad de los datos. Los recursos de la de números sin encabezado. ¿Están esos del archivo. infraestructura permiten la usabilidad de 110 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES los datos y afectan fuertemente el ‘poder’ se guardan y recuperan los datos y un marco establecido, porque esto evita y la eficacia de los algoritmos científicos estos procesos de entrada y salida son la necesidad de programar herramientas y modelos matemáticos aplicados. La fundamentales para diseñar un sistema comunes desde cero, lo cual puede suponer infraestructura genérica basada en datos que tenga buen desempeño. Se necesita un enorme ahorro de tiempo y de costos. está constituida por estos bloques centrales: tiempo para escribir datos en un disco y Lo que se sacrifica es que el enfoque del cuando llega una consulta, toma tiempo proyecto, se debe adaptar a la manera Flujo Funcional de Datos en que el marco resuelve el conjunto de buscar la respuesta y enviarla al siguiente El flujo funcional de datos es una cadena paso en el flujo funcional de datos. problemas que fue diseñado para abordar, funcional de hardware o software en la que lo cual puede o no ajustarse perfectamente Las herramientas correctas de base de cada elemento recibe datos de entrada, se a las necesidades precisas del proyecto. datos se guían a menudo por la naturaleza procesan y luego se reenvían al siguiente Seleccionar el marco equivocado corre el misma de los datos, su formato y su elemento. Es la forma cómo se cargan riesgo de incompatibilizar su enfoque de estructura. Además, la forma en que se los datos en el proceso analítico; el flujo soluciones con los problemas del proyecto, utilizan los datos desempeña un papel en funcional de datos incluye el proceso de introduciendo ineficiencias. el depósito un sistema de archivo busca carga, las herramientas para procesar las comprimir los datos en un volumen tan Los marcos se diseñan típicamente cifras, cómo se descargan las cifras y cómo se barato como sea posible, mientras que alrededor de especificaciones del introducen luego en un proceso operativo. una base de datos transaccional asegura hardware, y funcionan finalmente en las Este flujo funcional, por ejemplo, ofrece la velocidad y fiabilidad para que los clientes computadoras que procesan las cifras para integración técnica de un producto de datos no se queden esperando. Los marcos el proyecto de datos. Aunque la potencia en sistemas corporativos más amplios. también guían la elección de la base de computacional bruta es igualmente un El flujo funcional debe ser planificado para datos proporcionando herramientas elemento crítico de la infraestructura del asegurar un proceso fiable que tome datos integradas optimizadas para soluciones y proyecto, lo mejor es primero planear el sin procesar y proporcione resultados flujo funcional de datos, los requisitos del diseños de depósitos específicos. utilizables. El proyecto debe asegurar que depósito y los marcos necesarios para se escriba un diagrama esquemático o Marcos satisfacer las necesidades del proyecto. de flujo para describir la implementación Las especificaciones de computación Un marco es un conjunto de soluciones funcional del flujo de datos. La carga adecuadas tienden a llegar después. diseñado para un grupo de problemas. inicial en el flujo funcional generalmente El diseño y la gestión de la infraestructura Técnicamente, es un conjunto de bibliotecas marca el inicio operativo de un proyecto no suele ser el papel de los gerentes de datos, comenzando con el proceso de predefinidas y herramientas comunes de proyectos, pero ellos sí tienen que Extracción-Transformación-Carga (ETL) de que permiten escribir código y programas garantizar que las capacidades y los datos. El ETL es un plan de procedimiento, de forma más rápida y sencilla. En el área recursos estén disponibles para satisfacer establecido como parte de la gestión de de Big Data, estas incluyen plataformas las necesidades del proyecto. Esta es la datos del proyecto, que se analiza con que recogen herramientas, bibliotecas y razón por la cual una evaluación de TI se mayor profundidad más adelante. características para simplificar los procesos indica específicamente como parte de de gestión y manipulación de datos (por la gestión de riesgo y el establecimiento Depósito ejemplo, Apache Spark, Apache Hadoop, de objetivos pragmáticos. Depender Una base de datos o sistema de archivos Hortonworks, Cloudera. Véase el capítulo de equipos de TI internos o asegurar se llama depósito, o el elemento de 2.2.3, Base de Datos Tecnológica). Cabe la capacidad relevante en el equipo infraestructura para almacenar datos. señalar que un proyecto puede integrar del proyecto de datos es fundamental El depósito afecta la forma en que múltiples marcos. Se recomienda utilizar para ayudar a evaluar los requisitos de ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 111 2.1_GESTIÓN DE UN PROYECTO DE DATOS  infraestructura y las necesidades técnicas, definido. Mientras tanto, la industria interdisciplinario de expertos técnicos incluyendo escalabilidad, tolerancia a fallos, y los medios de comunicación han que interactúan de cerca con todas las distribución o aislamiento del entorno. generado exageraciones acerca de Big unidades - una sola persona o grupo - que Estos términos técnicos son relevantes Data, el aprendizaje automático y una gestionan los datos desde la adquisición para la infraestructura computacional de gran cantidad de tecnologías, al tiempo hasta la visualización. la empresa a gran escala; los objetivos que crean una conciencia más amplia del para un PMV se pueden lograr con mucho enorme valor potencial de los datos. Esto Los equipos son dinámicos y menos. Incluso los proyectos de datos ha generado presión para invertir en estos colaborativos, y es difícil seguir el ritmo pequeños probablemente involucrarán de la innovación y el desarrollo de nuevas recursos con el fin de mantenerse al día a la arquitectura empresarial en torno habilidades, conocimientos emergentes con la competencia. Es fundamental que al flujo funcional de datos. Los datos que y creciente hiper-especialización. Las el gerente de proyecto de datos tenga necesitan un proyecto se alimentarán casi en cuenta que se necesitan conjuntos posibilidades de tercerización pueden con seguridad de los sistemas corporativos, muy específicos de habilidades y lograr el dinamismo y las habilidades y esto debe estar bien definido, planificado experiencia técnica para cumplir con adecuadas para el objetivo perseguido. y coordinado con los equipos de TI. los requisitos de un proyecto de datos. Alternativamente, la retención o la Como cosa igualmente crítica, deben formación interna de científicos de datos Cuadrante 2: ser conscientes que muchos de estos generalistas pueden ayudar a asegurar HABILIDADES campos de experiencia se están formando la colaboración exitosa en un equipo dinámicamente al tiempo con el rápido multidisciplinario de especialistas en datos cambio de la tecnología. El segundo y operaciones de negocio. cuadrante del Data Ring pide a los gerentes de proyecto que consideren los Se requiere una cultura abierta, recursos humanos necesarios para lanzar científica y basada en datos. Un el proyecto a través de tres componentes: enfoque científico adecuado y una la informática, negocios y la ciencia cultura de datos deben existir dentro del de datos. equipo e, idealmente, dentro de toda la empresa. Debido a que el establecimiento El Equipo de objetivos adecuados se basa en la Armar la combinación correcta de emulación del método científico y las habilidades es un reto para los gerentes de pruebas de hipótesis exploratorias, proyectos de datos debido a la evolución el equipo de científicos de datos debe estar dinámica de la tecnología, los tamaños impulsado por el sentido de la curiosidad cada vez mayores de los conjuntos de y la exploración. El director del proyecto Figura 21: Data Ring Cuadrante 2: datos y las habilidades necesarias para debe asegurarse que esa curiosidad sea HABILIDADES extraer valor de estos recursos. dirigida y se mantenga apuntando a los objetivos. Los proyectos basados en datos necesitan Un científico de datos suele ser un científicos de datos. Dicho esto, “científico equipo de personas gestionando datos. Las siguientes preguntas marco ayudarán de datos” es un título relativamente Más allá de una sola competencia, a los gerentes de proyectos a identificar vago y amplio, que todavía está siendo esto generalmente requiere un equipo recursos y necesidades: 112 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES • ¿Quién es responsable de administrar los Habilidades: Informática más allá de la elaboración de un prototipo datos en la empresa? ¿Cómo? Los datos son piezas digitales de información y la implementación en la producción, se que se tienen que adquirir, almacenar, requerirán invariablemente soluciones de • ¿Existen colaboraciones en curso con instituciones de investigación u procesar y administrar por medio de programación de nivel empresarial, así organizaciones calificadas para realizar herramientas informáticas, lenguajes de como las habilidades para implementar. programación y de secuencias de comandos Esto también significa que puede ser las actividades de ciencia de datos? y bases de datos. Por tanto, las habilidades necesaria la refactorización del código o la • ¿Qué canales de reclutamiento existen deben incluir conocimientos sobre: traducción entre lenguajes informáticos, en lo que respecta a los expertos en así como interacciones cercanas entre datos? Computación en la Nube el equipo de datos y los miembros del Cuándo las fuentes de datos son • ¿Cómo se fomenta la cultura de datos personal de TI y de ingeniería. grandes o enormes, las herramientas de dentro de la empresa, y quién está programación normales y los recursos Bases de datos y Almacenamiento involucrado? computacionales locales, tales como las de Datos • ¿Cómo se facilita la colaboración computadoras personales, se vuelven rápidamente insuficientes. Las soluciones El Capítulo 1 habla de los datos estructurados multidisciplinaria en la planificación y ‘en la nube’ son una respuesta práctica y versus los no estructurados. Un proyecto ejecución de proyectos? efectiva a este problema, pero significan de datos puede basarse en ambos, que • ¿Cómo se garantiza la validez científica dominar los conocimientos esenciales sobre son manejados respectivamente por bases en la elección de algoritmos y los sistemas de virtualización, paradigmas de datos relacionales y bases de datos no representaciones matemáticas de datos de escalamiento y la programación del relacionales. El uso de estas herramientas (modelado)? ¿Hay una persona calificada marco. (Véase el capítulo 2.2.3, Base de requiere diferentes habilidades. Es probable encargada de asegurar que los resultados Datos Tecnológica) que los datos procedente de bases de datos sean verdaderos? transaccionales empresariales procedan de Lenguajes de Scripting • ¿Quién asegura que están establecidas bases de datos relacionales. Con mayor Trabajar con infraestructura informática buenas prácticas y que los algoritmos frecuencia, incluso los datos internos, significa programar. Python o R son a están programados eficientemente? tal como KYC o información biométrica, menudo las mejores opciones para hacer prototipos rápidos y explorar los patrones pueden ser almacenados por cualquiera • ¿Existe una colaboración abierta entre el equipo de datos y otras unidades de de datos. Estas son opciones probables de las soluciones, dependiendo del método negocios? para una meta de PMV y para el desarrollo de recolección. Sin embargo, es probable de proyectos en etapas tempranas. que un algoritmo de scoring crediticio que Un equipo completo y altamente Ambos lenguajes de scripting están busque utilizar datos de redes sociales se interdisciplinario es difícil de lograr, y es bien establecidos como herramientas base en datos no estructurados de fuentes muy poco probable que la mayoría de las indispensables de la ciencia de los datos, y de datos no relacionales. empresas tengan una amplia gama de el equipo idealmente debe ‘hablar’ ambos. habilidades relevantes a las que puedan (Véase el capítulo 2.2.3, Base de Datos Control de Versiones y recurrir cuando sea necesario. Entender Tecnológica) Colaboración estas brechas suele ser el primer paso para ser Ciertas infraestructuras corporativas y Las herramientas de control de versiones consciente de todo el potencial y planificar requisitos de certificación pueden requerir son esenciales para la evolución organizada las inversiones de tercerización, lo que diferentes opciones de programación, tales del código, el mantenimiento y el trabajo se considera una parte de la planificación como Scala, Java o C++. Esto puede ser un en equipo y, por tanto, son esenciales para del proceso. problema para escalada de un objetivo; una buena planificación del proyecto. ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 113 2.1_GESTIÓN DE UN PROYECTO DE DATOS  Habilidades: Ciencia de los Datos un valor agregado para el equipo de Habilidades: Negocios ciencia de datos; simplemente, el equipo El establecimiento de objetivos está Herramientas Científicas debe poseer un enfoque mental para esencialmente relacionado con la Los contextos diferentes requerirán resolver problemas y un impulso interno obtención de resultados relevantes para una mezcla específica de acuerdo con para encontrar patrones a través de un el negocio, y la comparación con las las necesidades del proyecto, pero análisis metódico. métricas apropiadas y los KPI. Saber cómo las siguientes son áreas académicas conectar estas métricas a la ejecución del amplias de las que los proyectos de Además, la validación científica es esencial proyecto es el objetivo mismo de hacer el datos probablemente necesitarán sacar para un proyecto de datos, y los científicos proyecto. Esto requiere que el equipo del provecho: de datos deben tener una mente científica. proyecto tenga conocimientos sólidos de Es decir, un enfoque metódico para hacer negocio. Una perspectiva comercial clara • Bases Sólidas en Estadística: utilizadas y responder preguntas, y un impulso para también es esencial para la interpretación para pruebas de hipótesis y validación de probar y validar resultados. Es importante de los resultados y, en última instancia, modelos. destacar que los miembros del equipo para utilizar e implementar el proyecto • Ciencia de Redes: una disciplina que deben encontrar motivación en los para aportar valor. Con respecto a las utiliza nodos y aristas para representar resultados y estar abiertos a cualquier habilidades, el mensaje clave es que un redes complejas matemáticamente; interpretación que surja del análisis de los ‘facilitador’ necesita intermediar datos, crítica para datos de redes sociales o datos, incluso si los resultados pudieran especialistas técnicos, la administración mapeo de transacciones tipo P2P. contradecir las expectativas iniciales. y estrategia del negocio, para poder • Aprendizaje Automático: una disciplina traducir los resultados obtenidos de los De acuerdo con el método científico, que utiliza algoritmos para aprender datos para personas no técnicas; el papel este enfoque debe incorporarse en las de los comportamientos de datos sin de este intermediario también articula competencias conductuales, por ejemplo: una cosmología predefinida explícita; la las necesidades del negocio en términos hacer observaciones; pensar en preguntas mayoría de los proyectos que ofrecen un de algoritmos y soluciones técnicas de modelo o algoritmo. interesantes; formular hipótesis; y el vuelta al equipo. Hay especialidad en desarrollo de predicciones comprobables. • Las ciencias sociales, la PLN, la ciencia de crecimiento llamada operaciones de datos la complejidad y el aprendizaje profundo Diseño y Visualización que encapsula esta función. son también habilidades deseables que Esto requiere habilidades multidisciplinares Privacidad y Legal podrían desempeñar un papel clave en en términos de necesidades técnicas y áreas específicas de interés. Excepto en los casos en los que se liberan comerciales. Desde el punto de vista técnico, conjuntos de datos con una licencia abierta Curiosidad y Mente Científica ‘DataViz’ o la visualización de datos no debe - explícitamente permitiendo su uso, La actitud y las competencias conductuales considerarse exclusivamente como la parte remezcla y modificación - como en las son factores críticos para un equipo de final del proyecto destinado a embellecer iniciativas de datos abiertos, las cuestiones ciencia de los datos exitoso. Personas que los resultados. Es relevante a lo largo de la relacionadas con la privacidad, la propiedad buscan explorar, hacer minería, agregar, exploración y elaboración de prototipos, de los datos y los derechos de uso para integrar - y así identificar patrones y y está bien incorporado en etapas un fin específico no son insignificantes conexiones - conducirá a resultados periódicas del proyecto, lo que lo convierte (Ver las barreras legales a los datos - en superiores. En otras palabras, algunas en una habilidad básica para que los Accesibilidad de Datos en la página 108). ‘habilidades de hacking’ generales son científicos de datos identifiquen patrones. Se debe consultar a los especialistas legales 114 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES corporativos para asegurarse que todas legales a cargo. La conciencia respecto las inquietudes de los interesados sean a los asuntos legales es particularmente debidamente atendidas. Dicho esto, los relevante cuando se consiguen consultores problemas de Big Data y de privacidad externos y cuando se busca asegurar que están entrando en nuevos terrenos, y la los Acuerdos de Confidencialidad (NDAs, legislación que busca regular los datos está por sus siglas en inglés) son exhaustivos, todavía en desarrollo. Muchas empresas cumplen con la normativa y pueden ser hoy en día están construyendo sus exigibles. Desde una perspectiva interna y negocios basados en datos, aprovechando externa, los datos también pueden ser una las lagunas legales en las leyes locales. fuente de fraude. Los casos de fraude son Esto puede presentar riesgo si las leyes cada vez más técnicamente sofisticados cambian, al mismo tiempo que presentan y orientados a los datos. A pesar que un oportunidades, trabajando para construir equipo de ciencias de datos quiere tener un ecosistema habilitador. habilidades de hacker como parte de En términos de habilidades, cada uno de un conjunto de habilidades balanceado, los miembros del equipo del proyecto no quiere hackers reales. Es fundamental debe tener algo de conocimiento que todo el equipo esté bien versado en legal básico. Esto permite identificar consideraciones legales y sea responsable problemas potenciales y permite un tanto legal como moralmente de adherirse diálogo constructivo con los expertos a estas. ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 115 2.1_GESTIÓN DE UN PROYECTO DE DATOS  Lecciones de la Industria: Desanonimización de Datos Protección de Datos y Protección del Consumidor: La Anonimización de Datos de Usuarios es Necesaria y Difícil En 2006, America Online (AOL), un afirmó que los buscadores eran Netflix, una compañía de cine y proveedor de servicios de Internet, suyos. Fue una debacle de relaciones medios de comunicación en línea, puso 20 millones de consultas de públicas para AOL. patrocinó una competencia con búsqueda a disposición pública crowdsourcing que desafiaba a los para la investigación. Las personas Otra violación de datos llego a científicos de datos a mejorar en un fueron anonimizadas por medio los titulares en 2014 cuando Vijay 10 por ciento su algoritmo interno de un número aleatorio. En un Pandurangan, un ingeniero de para predecir las puntuaciones de Artículo del New York Times, los software, desanonimizó 173 millones calificación de películas de los clientes. periodistas Michael Barbaro y Tom de registros de taxis publicados Uno de los equipos desanonimizó Zeller describen cómo el número por la ciudad de Nueva York para los hábitos de consumo de películas de cliente 4417749 fue identificado una iniciativa de Datos Abiertos. de los usuarios encriptados para la y posteriormente entrevistado para Los datos se encriptaron usando una competencia. Haciendo referencia su artículo. Aunque que el usuario técnica que hace matemáticamente imposible hacer ingeniería inversa del cruzada con la base de datos pública 4417749 era anónimo, sus búsquedas valor encriptado. El conjunto de datos del Internet Movie Database (IMDB), no lo eran. Ella era una ávida usuaria no tenía información de búsqueda que proporciona una plataforma de de Internet, buscando términos de identificadora como Arnold, pero redes sociales para que los usuarios búsqueda identificadores: “Dedos entumecidos”, “60 hombres solteros”, los números de registro de taxis califiquen películas y escriban sus “perro que orina sobre todo”. encriptados tenían una estructura propias reseñas, los usuarios fueron Las búsquedas incluyeron nombres conocida públicamente: número, identificados por los patrones de de personas y otra información letra, número, número (por ejemplo, conjuntos de películas igualmente específica, incluyendo paisajistas en 5H32). Pandurangan calculó que sólo calificadas de los conjuntos de datos Lilburn, Georgia, Estados Unidos había 23 millones de combinaciones, públicos de IMDB y encriptados de América. Ninguna búsqueda así que simplemente alimentó todas de Netflix. Netflix llegó a acuerdos individual identifica, pero para un las opciones posibles de input en en las demandas presentadas por detective - o un periodista - es fácil el algoritmo de encriptación hasta usuarios identificados y se enfrentó identificar a las mujeres sesentonas que produjo salidas coincidentes. a investigaciones sobre protección de con perros con mal comportamiento y Dado el poder informático de hoy, datos de consumidores presentadas bonitos jardines en Lilburn, Georgia. él fue capaz de desanonimizar a por el gobierno de los Estados Thelma Arnold fue encontrada y millones de taxistas en sólo dos horas. Unidos. Anonimizar datos correctamente es muy difícil, habiendo muchas maneras de reconstruir la información. En estos ejemplos, la referencia cruzada de los recursos públicos (Netflix), la fuerza bruta y las potentes computadores (taxis de Nueva York), y la investigación detectivesca a la antigua (AOL) condujeron a violaciones de la privacidad. Si se liberan datos para proyectos de datos abiertos, investigación u otros propósitos, se necesita tener mucho cuidado para evitar riesgo de desanonimización y graves consecuencias legales y de relaciones públicas. 116 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES Ciencias Sociales y Datos riesgos significativos que un proyecto Cuadrante 3: PROCESO La intersección del conocimiento de datos de datos pueda ofrecer resultados que y ciencias sociales es un nuevo ámbito de parecen excelentes pero que son dirigidos, actividad académica y una competencia sin saberlo, sin verdadera Inteligencia clave para los equipos de proyectos. de Negocios (BI). Entonces, el diálogo La motivación del negocio para un constante con los expertos del sector debe proyecto de datos generalmente se reduce formar parte del diseño del proyecto. a los clientes, ya se trate de una mayor Comunicaciones actividad, nuevos productos o nuevos datos demográficos. Para atraer a los Los datos cuentan una historia. De hecho, clientes, uno necesita saber algo sobre las cifras exactas pueden contar algunas ellos. Las habilidades de datos de ciencias de las historias más poderosas de una sociales ayudan a interpretar los resultados manera concisa. Los vínculos entre las a través de una lente que busca entender lo comunicaciones empresariales y los equipos que los usuarios están o no están haciendo de proyecto son un elemento importante y por qué; así, los equipos son capaces de para utilizar los resultados de los proyectos Figura 22: Data Ring Cuadrante 3: identificar patrones de datos útiles mejor - tales como poder implementarlos PROCESO y ajustar modelos alrededor de variables de manera correcta, alineados con la que representan las normas y actividades estrategia de comunicación. También En las secciones anteriores se analizó la sociales del cliente. existe una fuerte relación de comunicación mitad superior del Data Ring, centrándose con la visualización y diseño de datos, en los requisitos duros (infraestructura, Conocimiento Sectorial datos y herramientas) y requisitos blandos especialmente para proyectos orientados La experiencia en el tema, el conocimiento (habilidades y competencias). Esta sección al público. La visualización de datos es del mercado y el conocimiento sectorial ahora cambia a la mitad inferior del Data importante para comunicar resultados describen la relación crítica entre los Ring, que examina el proceso para diseñar intermedios y finales. Asegurar las resultados del proyecto y el valor del y ejecutar un proyecto de datos. habilidades de diseño visual es tan negocio. A falta de conocimiento sectorial, importante como las habilidades técnicas Reconociendo que las corporaciones o se pueden analizar los datos equivocados, los modelos de alta precisión pueden para trazar gráficos, volver interactivos los instituciones tienen sus propios enfoques probar la hipótesis equivocada o pueden resultados o servirlos al público a través basados en una mezcla de historia seleccionarse variables estadísticamente de sitios web. Para muchos proyectos organizacional, cultura corporativa, significativas que no tienen relación con de datos, la visualización es un producto estándares de KPIs y regulaciones de los KPIs del negocio. Con muchos modelos básico, tal es el caso de los paneles de gobierno de datos, lo que sigue son las que de aprendizaje automático entregando control y de muchas de las metas del se consideran buenas prácticas generales ‘cajas negras’ o marcos de infraestructura proyecto específicamente orientadas a para habilitar proyectos basados en datos que usan enfoques automatizados, existen dirigir las comunicaciones empresariales. y sus entregables. ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 117 2.1_GESTIÓN DE UN PROYECTO DE DATOS  Los proyectos de datos deben definir datos y, posiblemente, para detectar tales como las transacciones a lo largo del sus entregables, los resultados de la errores. Además, estos apoyan proyectos tiempo desglosadas por tipo de producto Planificación y Ejecución del proyecto. subsiguientes o análisis derivados que se para mostrar tendencias, picos, bajas y Estos resultados median entre el Proceso basan en datos limpios y pre-agregados. brechas. Entregado al principio del proceso y el subsiguiente bloque que apunta a de ejecución, el informe de inventario de Cuestionarios y Herramientas de datos es una oportunidad para discutir los convertirlos en Valor para el negocio. Recolección posibles riesgos del proyecto debidos a los La siguiente lista especifica ocho elementos comunes a muchos proyectos de datos. Los proyectos que requieren la recolección datos subyacentes, así como las estrategias Cuando sean aplicables, éstos deben estar primaria de datos, tanto cuantitativos para la corrección de rumbo y la necesidad en el cronograma de los entregables del como cualitativos, pueden requerir el uso o de refinamiento o re-adquisición de datos. desarrollo de herramientas de recolección Es especialmente útil medir el alcance proyecto, o especificarse dentro de los de datos, tales como instrumentos de de los requisitos de limpieza de datos y términos de referencia para la capacidad encuestas, cuestionarios, datos de registro esforzarse por ajustar las anomalías de una tercerizada. de ubicaciones, informes fotográficos o manera estadísticamente imparcial. Conjunto(s) de Datos: discusiones o entrevistas en grupos focales. Estos instrumentos deben ser entregados, Diccionario de Datos Los conjuntos de datos son todos los junto con los datos recogidos, incluyendo El diccionario de datos consolida la datos que se han recogido o analizado. todos los lenguajes, traducciones y información de todas las fuentes de datos. Dependiendo del tamaño, el método de transcripciones. Éstos son necesarios para Es una colección de la descripción de todos recolección y la naturaleza de los datos, permitir encuestas posteriores o preguntas los elementos de datos, por ejemplo, tablas. el formato del conjunto de datos coherentes de serie cronológica, y también Esta descripción normalmente incluye o conjuntos de datos puede variar. proporcionan los documentos necesarios de el nombre del campo de datos, su tipo, Todos estos deben documentarse, con auditoría o verificación si surgen preguntas formato, tamaño, la definición del campo información sobre dónde están ubicados sobre los métodos de recopilación de datos y, si es posible, un ejemplo de los datos. - tales como en una red o una nube - y en una etapa posterior. Los campos de datos que constituyen un cómo acceder a ellos. La entrada de datos conjunto deben enumerar todos los valores brutos se tiene que ‘limpiar’, proceso Informe de Inventario de Datos posibles. Por ejemplo, si un conjunto de discutido en la sección de ejecución, abajo. Se trata de un informe con un resumen de datos de transacción tiene una columna Los conjuntos de datos limpios deben los datos que se utilizaron para el análisis. denominada ‘producto’ que indica si una considerarse como entregables específicos, Este informe incluye el tipo, tamaño y fecha transacción fue una recarga, persona a junto con los métodos con secuencias de los archivos. Debe incluir discusiones persona, un débito, entonces el diccionario de comandos o los pasos metodológicos sobre anomalías importantes o brechas enumeraría todos los valores del producto aplicados para limpiar los datos. Por en los datos, así como una evaluación de y describiría que sus respectivos códigos último, los conjuntos de datos y métodos si las anomalías pueden estar sesgadas observados en los datos, tales como TUP, agregados también pueden considerarse estadísticamente o presentar riesgo a P2P, y COT, respectivamente. Para los datos como entregables específicos. Estos son la interpretación. Puede incluir gráficos que no están en un conjunto discreto, como necesarios para ayudarle a los promotores que representan los puntos de datos el dinero, normalmente se proporciona un del proyecto a ver lo que se hizo con los principales para los segmentos centrales, valor de rango min-max, junto con su unidad 118 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES de medida, tal como el tipo de moneda. normalmente apoyan los entregables Entregables Analíticos: Las relaciones con otros conjuntos de intermedios o las evaluaciones de hitos Resultados, Algoritmos, Listas datos también deben especificarse, cuando de proyectos. Estos resultados también se Blancas y Visualizaciones sea posible. Por ejemplo, el campo de datos pueden resumir para ayudar a articular el Estos son los resultados reales del proyecto. del número de cuenta de un cliente puede estado y el progreso del proyecto poniendo Un proyecto de segmentación de clientes estar presente en conjuntos de datos de de relieve las preguntas en la exploración puede incluir una lista blanca de clientes transacciones de producto y también en objetivo y sus puntuaciones de propensión actual, así como las preguntas que ya se conjuntos de datos KYC. Especificar esta asociadas, así como la información de han abordado. Un libro de registro de conexión ayuda a comprender cómo se geolocalización posible para asesorar a iniciativas exploratorias y conclusiones pueden combinar los datos o identificar una campaña de marketing. Un algoritmo principales es útil a este respecto. dónde pueden ser necesarios requisitos de score crediticio ofrece conjuntos de de metadatos adicionales para facilitar Gráficos de Validación de Modelos resultados para usuarios especificados dicha combinación. El diccionario de datos en conjuntos de datos de control y y Métricas de Rendimiento suele entregarse junto con el informe de tratamiento, y el código para el propio Para los proyectos de datos basados en inventario de datos, apoyando la discusión modelo, o una visualización que incluye de diseño estratégico de un proyecto, modelos, se trata de una lista de gráficos scripts para representar KPIs y animarlos, la evaluación de riesgo o los requisitos de con las métricas de rendimiento más así como webscripts u otros componentes datos adicionales en sus primeras etapas. relevantes del modelo predictivo. Véase el para un interfaz de usuario. Cada proyecto Capítulo 2.2.3: Métricas para la Evaluación tendrá su propio conjunto de entregables Análisis Exploratorios y Libro de Modelos de Datos, que proporciona una matizados. Estos deben definirse como de Registro lista de los indicadores top 10 utilizados parte del diseño del proceso del proyecto. Este es un conjunto de gráficos, cuadros o en proyectos de modelado de datos. Estos datos de tabla que resumen las principales gráficos y métricas se utilizarán para Informe Final de Análisis y características de una investigación evaluar la eficacia y la fiabilidad del modelo. Discusión del Costo-Beneficio de la específica o prueba de hipótesis. Todas Implementación Los gráficos de validación pueden incluir las estadísticas descriptivas de los datos Este es el informe final que presenta los los gráficos de ganancia y elevación, y las también se podrían incluir, por ejemplo, resultados del análisis, responde a las métricas de rendimiento dependerán del promedios, medianas o desviaciones preguntas y se refiere a los objetivos que proyecto en particular. Estos pueden incluir, estándar. La parte del análisis exploratorio se establecieron y acordaron al inicio del por ejemplo, la prueba de Kolmogorov- de identificar tendencias y patrones proyecto. Esto debe ser entregado junto Smirnov (KS), la curva característica de descubiertos dentro de los datos es con los resultados analíticos. Además de funcionamiento del receptor (ROC) o necesaria para refinar hipótesis analíticas, discutir la metodología, el proceso, los contextualizar metadatos o identificar el coeficiente Gini. Esta información es hallazgos y las soluciones a los desafíos características que se utilizan en un modelo. necesaria para evaluar los hitos de la clave, el informe final debe articular la El análisis exploratorio se realiza como finalización de los objetivos. La aprobación propuesta de valor central de los resultados parte de la ejecución inicial del proyecto del modelo para el uso de producción o analíticos. Esto puede incluir: ganancias y, a menudo, continúa hasta completar iteración de siguiente paso debe hacerse de eficiencia y ahorros de costos gracias el proyecto. Los resultados exploratorios en términos de estas métricas. al marketing mejorado basado en datos; ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 119 2.1_GESTIÓN DE UN PROYECTO DE DATOS  previsión de mayores oportunidades de determinan si el proyecto tiene éxito. mejora del conocimiento y la definición otorgamiento de crédito; o los beneficios Por ejemplo: rechazar la hipótesis nula con de problemas. Algunos pueden creer que, de productividad de los paneles de control. un objetivo de confianza del 90 por ciento; si vuelven a ajustarlo de manera diferente, El informe final debe considerarse con logrando una tasa de exactitud del modelo la próxima vez pueden llegar al 85 por respecto a la estrategia de implementación de 85 por ciento; o tiempo de respuesta en ciento. Otros pueden pensar que podrían del proyecto, para reflejar el costo- una decisión de scoring crediticio por debajo agregar nuevos datos de clientes para beneficio de la propuesta de valor en los de dos segundos. El ajuste de métricas mejorar el modelo. Esta situación fluida no resultados analíticos y los requerimientos previo evita los riesgos relacionados con la ayuda en la estimación de presupuestos, de recursos para implementarlos a la escala post-validación cuando, debido a umbrales pero los parámetros de presupuesto deben esperada por el proyecto. ambiguos, los propietarios de proyectos ser utilizados por los gerentes de proyectos ofrecen resultados ‘bastante buenos’. como una herramienta para sintonizar Proceso: Planificación Esto es a menudo en un esfuerzo por esfuerzos, compromiso y un espacio para Las consideraciones siguientes son justificar la inversión, o peor aún, afirmando probar diferentes hipótesis. Las inversiones particularmente relevantes para la los resultados frente a lo que se creía, iniciales deben comprender este proceso planificación de proyectos de datos y insistiendo en que deben funcionar. Véase exploratorio e iterativo y sus riesgos. para ayudar a especificar el alcance de los el Capítulo 2.2.3: Métricas para la Evaluación El concepto de escala de producto también entregables intermedios y finales. ayuda a mitigar este riesgo; comience de Modelos de Datos, que proporciona una pequeño, haga iteración hacia arriba. lista de los indicadores top 10 utilizados Punto de Referencia en proyectos de modelado de datos. Puede correrse el riesgo de ineficiencias Comprender quién más tenía un problema para escalar y refactorizar, pero también Las métricas relacionadas con la experiencia similar y cómo fue abordado y resuelto mitiga los riesgos presupuestarios, tales del usuario también son importantes, pero como la compra de computadores nuevos es crucial en la planificación de la fase deben ser específicas para el contexto del para luego descubrir que la hipótesis no de ejecución. La literatura científica es proyecto. Por ejemplo, al evaluar cuánto se cumple. una fuente inmensa de información y los tiempo es aceptable para que un usuario límites entre la investigación y la aplicación espere una decisión de scoring crediticio La planificación cronológica tiene operativa a menudo se superponen en el automatizada, entre más rápido mejor. consideraciones similares a la planificación campo de los datos. Desde la perspectiva Aun así, debe ser un KPI definido previamente presupuestaria. Una vez más, hay que de la gestión de proyectos, el benchmarking para permitir que el equipo del proyecto buscar un equilibrio entre dar espacio a la significa analizar los competidores de entregue un producto bien ajustado. exploración y la investigación manteniendo negocios y sus actividades en el campo de una alineación con las metas y métricas. datos, asegurando que el proyecto esté Presupuesto y Tiempo Una técnica de gestión de proyectos de la alineado con las prácticas y operaciones El control de la planificación y la gestión industria del software conocida como el internas de la compañía. En lenguaje deben tener en cuenta el estado abierto ‘enfoque ágil’ es útil para los proyectos de sencillo, no reinvente la rueda. casi permanente de los proyectos de datos. Este enfoque analiza la progresión del datos. Los objetivos y metas muestran un proyecto a través de ciclos auto-sostenible Métricas y KPIs punto final, pero hasta que se alcanza, un donde la producción es algo medible y Las métricas son los parámetros que proyecto de datos es a menudo una re- comprobable. Esto ayuda a enmarcar una impulsan la ejecución del proyecto y modulación continua sobre la base de la exploración en un ciclo específico. 120 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES Alianzas, Tercerización y el análisis, e incluso conjuntos de datos • Encriptación: La información sensible Crowdsourcing intermedios, agregados y segmentaciones o identificadora debe ser encriptada, que se alimentan en otros procesos. disimulada o anonimizada y mantenida Este punto es particularmente importante durante todo el flujo funcional de datos. desde la perspectiva de los recursos del Gobierno de Datos • Permisos: El acceso a los conjuntos de proyecto. Hacer preguntas sobre el diseño de proyectos acerca de los requerimientos Este punto se refiere a cómo y cuándo datos debe definirse en forma granular y su suficiencia, ayuda a identificar las se utilizan los datos y quién tiene acceso por funciones de equipo o por punto brechas que los gerentes de proyectos a ellos. La planificación del gobierno de de acceso (es decir, desde firewalls deben llenar. En particular, esto no se limita datos debe consultar políticas corporativas corporativos, versus desde redes a los recursos humanos. La computación externas). más amplias, requisitos legales y políticas en la nube es un hardware computacional de comunicaciones. El propósito del plan • Seguridad: Los conjuntos de datos tercerizado. Incluso los datos pueden ser es permitir el acceso a los datos al equipo situados en el entorno del ‘sandbox’ de origen externo, ya sea mediante la del proyecto deben tener su propio del proyecto y a las partes interesadas en concesión de licencias de los proveedores dispositivo de seguridad o firewall y la entrega, al tiempo que se ajusta a las o mediante el establecimiento de alianzas la capacidad de autenticar el acceso necesidades de protección y seguridad de que permiten el acceso. Crowdsourcing privilegiado. datos. El plan de gobierno de datos suele es una técnica emergente para solicitar • Registro: El acceso y el uso deben ser verse afectado por la escala del proyecto, equipos de datos completos con límites registrados y auditables, habilitados para donde los proyectos más grandes pueden exploratorios muy amplios, generalmente el análisis y la generación de informes. tener mucho más riesgo que los proyectos con el objetivo de ofrecer creatividad • Regulación: El plan debe garantizar que pura y soluciones innovadoras a un más pequeños. Un desafío mayor es que se cumplan los requisitos reglamentarios problema fijo a cambio de un incentivo fijo. el enfoque de la ciencia de los datos se y que las NDA o los contratos legales Como ejemplos, Kaggle es un destacado beneficia del acceso a la mayor cantidad deben estar en vigor para cubrir todas pionero de la ciencia de datos en forma de de datos disponibles para tender puentes las partes interesadas del proyecto. crowdsourcing; o el servicio ‘Mechanical entre conjuntos de datos y explorar Los derechos del cliente y la privacidad Turk’ de Amazon para tareas o encuestas patrones. Mientras tanto, más datos y también deben ser considerados. pequeñas hechas con crowdsourcing. más acceso también representan más Proceso: Ejecución riesgo. El gobierno de datos del proyecto Un elemento importante a considerar es Exactamente como el Data Ring representa también debe especificar el plan ETL. la PI. Los derechos deben especificarse un proceso cíclico, la fase de Ejecución en Esto también abarca el transporte, en acuerdos contractuales. Esto incluye muchos proyectos de datos tiende a reflejar o la planificación para el movimiento físico tanto la PI existente, así como la PI creada una especie de ciclo dentro del circuito. por medio del proyecto. Considere el o digital, que debe considerar el tránsito Lo que generalmente se llama un ‘análisis proceso completo y la fase de ejecución por políticas o entornos regulatorios, de datos’ es en realidad más bien una a lo largo del flujo funcional de datos. como por ejemplo, desde una empresa en colección de pasos progresivos e iterativos. La PI abarca más que los resultados finales África a un proveedor externo de analítica Es un camino de exploración y validación que se pueden obtener; incluye scripts y en Europa. El plan debe considerar los de hipótesis hasta que un resultado logra códigos informáticos escritos para realizar siguientes principios: las métricas objetivo definidas. ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 121 2.1_GESTIÓN DE UN PROYECTO DE DATOS  La fase de ejecución se asemeja más a dado, pueden incorporar fácilmente estos Limpieza, Exploración y los marcos establecidos para el análisis marcos en la especificación de diseño Enriquecimiento de los datos de datos, tales como CRISP-DM u otras del proyecto de Data Ring durante la Este paso es donde el equipo de adaptaciones.39 Los gerentes de proyectos fase de ejecución. Los siguientes pasos ciencia de datos realmente comienza. que prefieren utilizar un marco de proceso se proporcionan de otro modo como un La posibilidad que un conjunto de datos analítico específico, o cuyos proyectos proceso general de buenas prácticas para la responda perfectamente a las necesidades pueden ser mejor atendidos por un enfoque ejecución de analítica de datos. del estudio es rara. Los datos tendrán que ser limpiados, lo que ha llegado a significar: a. Tratamiento: Convertir los datos en un formato común, compatible con las PROCESO herramientas de procesamiento. Ejecución b. Entender: Comprobar los metadatos y la documentación disponible para saber cuáles son los datos. OS AD Definición de hipótesis c. Validar: Identificar errores, campos LT S U RE vacíos y mediciones anormales. VALOR d. Unir: Integrar descripciones numéricas (legibles por máquina) de eventos realizados manualmente por personas Limpieza, exploración, durante el proceso de recolección de enriquecimiento de los datos datos con el fin de proporcionar una ¿Validación de la hipótesis? explicación clara de todos los eventos. e. Combinar: Enriquecer los datos con otros datos, ya sea de la misma empresa, del dominio público, o de otro lugar. Ejecución de herramientas de f. Análisis Exploratorio: Utilizar técnicas Entender resultados ciencia de datos de visualización de datos para explorar parcialmente datos y patrones. g. Iterar: Iterar hasta que los errores son contabilizados y que exista un proceso para ir de manera fiable desde datos sin procesar hasta datos preparados para proyectos Este es el proceso Figura 23: Proceso de ejecución del Data Ring mínimo viable. 39 Los métodos de procesos de analítica de datos relacionados incluyen, por ejemplo: ‘Descubrimiento del Conocimiento en el Proceso de Bases de Datos’ (Proceso KDD) de Usama Fayyad; ‘Muestrear, Explorar, Modificar, Modelar, Evaluar’ (SEMMA) por el Instituto SAS; ‘Método de Soluciones de Analítica unificado para la Minería de Datos / Analítica Predictiva’ (ASUM-DM) de IBM; ‘Proceso del Equipo de Ciencia de Datos’ (DSTP) de Microsoft 122 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES Ejecución de Herramientas de errores de programación). El resultado de a prueba el proceso de diseño del proyecto Ciencia de Datos cualquier cálculo analítico o proceso, ya sea y su enfoque, llevando a que se haga Aquí es donde los científicos de grande o pequeño, dará: una revisión cuando surja lo inesperado. datos aplican sus conocimientos. El marco del Data Ring también puede • Resultados Inutilizables (o incorrectos) Se aplican el aprendizaje automático, ayudar analizar problemas de ejecución • Resultados Triviales o ya Conocidos la minería de datos, aprendizaje profundo, para identificar soluciones; sus conceptos la PLN, la ciencia de redes, estadísticas • Resultados Utilizables que Nutren no se limitan a la planificación inicial. o (usualmente) una mezcla de lo antes Próximos Pasos El Data Ring Canvas asociado (discutido mencionado. Cuando se desarrollan • Resultados Inesperados (a ser investigado en 2.1: Aplicación) está diseñado con esta proyectos de datos que incluyen modelos con un nuevo flujo funcional, nuevos intención, para proporcionar una plantilla predictivos, es necesario tener una datos o un nuevo enfoque) que se puede actualizar continuamente estrategia de validación del modelo antes El diseño del proyecto debe reconocer y reflejar el estado del proyecto durante de ejecutar el modelo. Esto permite probar estos posibles resultados y estar preparado la ejecución. estadísticamente la hipótesis del proyecto. para tratar cada caso. Salvo resultados De manera práctica, el conjunto de datos Evaluación de las Métricas y inutilizables, es probable que todas las que impulsa el modelo debe segmentarse Próximos Pasos demás categorías de resultados ameriten en un conjunto de ‘control’ y un conjunto de una tarea de presentación o de informes La eficacia del proyecto sólo se puede ‘tratamiento’ mediante selección aleatoria. para que sea comprensible para otros, evaluar mediante una definición inicial Un reparto de 20 por ciento a 80 por ciento incluidos los miembros internos del cuantitativa y precisa de los objetivos y es un enfoque común y básico. El modelo equipo, los administradores, los clientes y métricas del proyecto. Si los resultados se entrena en el conjunto de tratamiento. el público en general. Esto generalmente no son satisfactorios, el proceso tiene que Luego, el modelo puede ejecutarse en el significa un resumen escrito, tabla, conjunto de control y los valores previstos empezar de nuevo. Este paso de evaluación gráfico o una animación, que son medios del modelo pueden compararse con los e iteración siempre es crítico, pero tiene para presentar y explicar los resultados. valores conocidos del conjunto de control. consideraciones adicionales cuando se Los expertos en visualización de datos Así se calculan las tasas de precisión y utilizan firmas externas. Los entregables juegan un papel clave en este proceso, ya cómo se puede probar una hipótesis. pueden considerarse inadecuados a pesar que no se trata simplemente de embellecer los resultados. La tarea difícil consiste en de la calidad del trabajo. La rendición de Comprensión, Interpretación y crear capas convincentes, interactivas y cuentas de los resultados entregados Representación de Resultados visuales para agregar brevemente a la debe acordarse de antemano, al igual que La interpretación de resultados se discutirá narrativa más general del proyecto, lo el grado de margen de maniobra para con más detalle en la siguiente sección en que debería constituir una declaración del continuar iterando en busca de resultados términos de aporte de valor al negocio. problema del proyecto en sí mismo. satisfactorios. Exactamente cómo su parte Pero desde la perspectiva del proceso, en la hipótesis que fija el primer paso de la comprensión de resultados se centra en La fase de ejecución también es la asegurar una alineación entre los resultados este ciclo de ejecución, los gerentes de oportunidad para reevaluar los planes del obtenidos y el resultado esperado de la proyecto, observando nuevamente que proyectos de datos de nuevo desempeñan ejecución del proceso; y asegurando que los proyectos de datos se entregan mejor un papel clave en mantener a los científicos sean computacionalmente válidos (es utilizando un enfoque iterativo. La fase de centrados en los objetivos principales y decir, controlando errores aritméticos o ejecución de un proyecto es lo que pondrá potenciar futuras iteraciones. ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 123 2.1_GESTIÓN DE UN PROYECTO DE DATOS  Cuadrante 4: VALOR proyectos de datos suelen caracterizarse Valor: Ajuste por paneles de control, modelos predictivos Comprender los resultados es sólo la o palancas de toma de decisiones basadas tarea inicial. El conocimiento derivado en datos, herramientas de automatización de datos debe convertirse en acciones e, idealmente, conclusiones de negocio concretas que se manifiestan mediante poderosas. En otras palabras, un proyecto de herramientas, modelos y algoritmos. datos rara vez termina con recomendaciones. Debido al enfoque iterativo, exploratorio En su lugar, entrega módulos que serán de un proyecto de datos, la primera vez puestos a operar. que se logra un resultado final exitoso, este Valor: Interpretación invariablemente tendrá imperfecciones que se tienen que ajustar para volverse una El primer paso después de una etapa herramienta de operación fluida. El ajuste de ejecución se centra en comprender se centra en tres áreas: la propuesta de valor inherente a los resultados y lo que puede ser necesario Datos de entrada para refinar estos productos o sus procesos Figura 24: Data Ring Cuadrante 4: La elección y la calidad de los datos de subyacentes para lograr el Objetivo. VALOR entrada pueden determinar de manera Un número podría significar nada o Valor es la última parte del Data Ring o, decisiva la eficacia de los algoritmos todo, dependiendo de la interpretación. por diseño, el punto de partida para futuras Comprender los resultados no es una utilizados para realizar el análisis. iteraciones para agregar o implementar simple explicación de los fenómenos. Considérese el aprendizaje automático, componentes o ampliar el diseño. En su lugar, significa poner los resultados donde los algoritmos desarrollan una Esta etapa articula cómo los resultados de en el contexto empresarial y abarcar la actitud de aprendizaje siguiendo una fase de la ejecución del proceso se transforman complejidad de las operaciones reales. entrenamiento que utiliza un subconjunto en última instancia en ‘información’, Esto también requiere un enfoque de datos. Así, al trabajar con datos, y luego en ‘conocimiento y valor’ que se transparente, colaborativo, discutiendo las operaciones aprenden progresivamente pueden implementar. los resultados con todas las partes a recopilar mejores datos. Mejorar los datos interesadas del proyecto para determinar sin procesar y minimizar las anomalías, Este componente de creación de valor lo que significan desde todos los ángulos. los métodos de recopilación, los insumos de los resultados suele ser una de las Teniendo en cuenta el papel de las manuales y errores de recopilación, diferencias sustanciales entre un análisis operaciones de datos (ver, Habilidades de derivará en resultados más ajustados a lo de datos tradicional o un proyecto de Negocios), no es raro que los científicos largo del tiempo. BI y un proceso de analítica avanzada, de datos puedan tener dificultades para en particular en el área de Big Data. explicar la relevancia operativa de los Infraestructura, Habilidades Esto se debe a que los entregables del resultados a los gerentes. Si se hace un y Proceso proyecto rara vez se definen en términos hallazgo importante, su valor debe ser Después de las primeras iteraciones de de informes escritos, por lo menos no comunicado con éxito a la gerencia, ejecución, habrá una mejor comprensión exclusivamente. Los entregables de los quienes pueden llevarlo a la acción. de la efectividad del equipo asignado 124 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES al proyecto, los procesos de gobierno Valor: Implementación Estos elementos descriptivos pueden de datos, así como las herramientas de guiar la estrategia de implementación, software y hardware disponibles. Además, Estrategia de Implementación formulando cómo es el caso de uso. Éste es Para generar un impacto real, la estrategia también un componente importante para habrá una mayor comprensión de cómo de implementación debe ser diseñada la generación de adhesión de la gerencia. toda la organización del proyecto trabaja Por ejemplo, si el caso de uso prevé la en conjunto. Las ineficiencias se revelarán desde el principio, como parte de la fijación automatización completa, las preguntas y, como se discutió anteriormente, todas de objetivos. Esta cuestión debe tenerse de diseño del proyecto deben pedir que las áreas del proyecto pueden servir como en cuenta a lo largo del proceso. Evite el la infraestructura y los recursos sean posibles fuentes de solución. Generalmente, riesgo de obtener datos brillantes que no suficientes para implementar un algoritmo el ajuste busca que todos los componentes puedan utilizarse en la práctica. Un aspecto totalmente automatizado. Si se necesita clave de la estrategia de implementación la inversión en un nuevo centro de datos funcionen mejor juntos. Esto se hace a través es asegurar la adhesión de la gerencia. para ejecutar el algoritmo y entregar las de: una mejor organización del equipo; Presumiblemente, la asignación de decisiones de crédito justo-a-tiempo, puede comunicación más fuerte; aumento de recursos proporciona un cierto nivel resultar difícil la adhesión para asegurar las competencias del equipo; y tecnología, de compromiso. Dicho esto, debido a que los resultados del proyecto se utilizen, ya sea con métodos mejores, mayor poder que se aseguró a las partes interesadas mientras que una estrategia de caso de computacional, o todo lo anterior. uso basada en un piloto de pequeña escala que no garantizan los resultados en los implementado con los recursos existentes Datos de Salida procesos exploratorios, la estrategia de podría hacer un caso más fácil. implementación tiene que asegurar un Finalmente, los datos de salida deben ser apoyo continuo y una comunicación fuerte Costo-Beneficio revisados. Es importante que los resultados respecto a los hallazgos intermedios. de salida no estén sesgados o afectados La propuesta de valor anticipada debe por errores (humanos o de otro tipo), articularse en el diseño inicial. Al comienzo, Los tipos de analíticas, como se discutió en el esto puede ser en términos generales, mala integración entre diferentes etapas Capítulo 1.1, también pueden ser relevantes por ejemplo: una ganancia de eficiencia, del proceso o incluso errores comunes de para pensar cómo se usan los resultados: una reducción de costos o retención de programación. A menudo, esto significa clientes. A medida que el proyecto se • Descriptivo: Resumir o Agregar revisar y fijar los datos de entrada. Aunque desarrolla y los resultados se obtienen y Información el proceso analítico es muy capaz de afinan, la propuesta de valor puede ser introducir sus propias anomalías. Esto • Diagnóstico: Identificación de subconjuntos cuantificada. Una vez alcanzado el objetivo, es tanto un control de validación como de información basados en criterios esto ayudará a definir lo que realmente una oportunidad de ajuste. En última específicos se ha obtenido y el valor que representa. • Predictivo: Usualmente construida sobre El mismo proceso debe ser considerado instancia, la revisión los datos de salida para el uso de los resultados. Al principio, apoya de manera general la organización subconjuntos predictivos, combinados puede preverse alguna infraestructura y la fiabilidad del proceso, por ejemplo, con palancas de decisión general o requerimientos del sistema. asegurando que una visualización final • Prescriptivo: Totalmente integrado en Una vez que el proyecto esté maduro, el exhiba los resultados correctos el 100 por sistemas automatizados; una pieza de valor se debe comparar con el costo de cien del tiempo y bajo cualquier condición. operaciones implementación de la solución. ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 125 2.1_GESTIÓN DE UN PROYECTO DE DATOS  APLICACIÓN: sin encontrarse con el Business Model adecuadas para la implementación exitosa Uso del Data Ring Canvas, y observe a las personas que del proyecto. Aquí, un resumen general ponen notas Post-It de colores en tableros, paso a paso refina las cinco estructuras del Un Enfoque de Canvas comprometidos con la dura tarea de Data Ring en términos de sus relaciones Como herramienta de planificación, el ofrecer una visión esquemática concisa y interconectadas. El punto es que cada Data Ring adopta un enfoque de Canvas. comprensiva de su modelo de negocios. uno de los bloques centrales del anillo Un ‘Canvas’ es una herramienta utilizada La aplicación generalizada del marco entre representa un componente de un sistema para hacer preguntas estructuradas y los innovadores y emprendimientos de dinámico interconectado. El enfoque diseñar las respuestas de una manera iterativo y la aplicación de Canvas permite tecnología proporciona una base sólida organizada, todo en un solo lugar. Las presentar estos en un diagrama singular para apoyar las necesidades de gestión respuestas son simples y descriptivas; para visualizar las piezas del plan integral, de proyectos para proyectos de datos incluso unas palabras bastarán. Desarrollar identificar las necesidades de recursos y las innovadores y orientados a la tecnología. un Canvas sólido para impulsar la planeación brechas, y construir un sistema armonioso. Hay muchos recursos excelentes que de proyectos puede tomar semanas, ya que proporcionan información adicional sobre Esto se hace mediante una planificación la interacción de las preguntas guías desafía el Business Model Canvas, pero no es un iterativa, donde primero se debe establecer la comprensión profunda de los problemas, las soluciones previstas y las herramientas prerrequisito para entender o aplicar el un objetivo. Una vez se establece la meta, el para entregarlas. A continuación, se presenta Data Ring. enfoque va paso a paso alrededor del anillo una lista de las cuatro razones principales para articular los recursos, las relaciones El Data Ring Canvas se inspira en este y el proceso necesarios para alcanzar la para adoptar un enfoque de Canvas: enfoque, aplicado a los requerimientos meta. Esto se realiza haciendo cuatro 1. Para obligar al dueño del proyecto a específicos de la gestión de proyectos preguntas clave de diseño del proyecto establecer una propuesta de valor de de datos, al tiempo que enfatiza la en forma secuencial para cada uno de los proyecto completamente transparente necesidad de establecer objetivos claros bloques centrales. Las preguntas de diseño 2. Proporcionar autodiagnóstico y definir y aplicar las herramientas y habilidades del proyecto son: y respetar una estrategia interna de gobierno Preguntas de Diseño del Proyecto 3. Comunicar una representación completa del proceso ‘en una página’ Recursos Definición de Recursos Planear de manera flexible con una 4. 1 ¿Qué recursos tengo? herramienta que pueda redefinir los 2 ¿Qué recursos necesito? componentes a medida que el proyecto evoluciona Relaciones El concepto de Canvas fue presentado Definición de Relaciones por Alex Osterwalder, quien desarrolló el 3 ¿El plan es suficiente para cumplir con el proyecto? Canvas de Modelo de Negocios [Business 4 ¿El plan es suficiente para usar los resultados? Model Canvas]. En los últimos años, se ha vuelto raro asistir a una competencia de startups, concursos de pitch, hackathon, Figura 25: Las Cuatro Preguntas de Diseño de Proyecto Requeridas por el o evento de lluvia de ideas de innovación Data Ring Canvas 126 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES Antes de cerrar esta sección, es importante Esto es especialmente crítico para el valor, Relaciones de Data Ring recordar el error más común cometido ya que explorar el valor requerido evidencia al utilizar este tipo de herramientas de la motivación del proyecto. Además, ENCAJE negocios: no enfocarse demasiado en AS HA el valor se relaciona con los recursos que son NT BI completar el Canvas. En pocas palabras, el IE L sacados a través de los propios resultados M ID RA Data Ring Canvas - al igual que el Business AD analíticos del proyecto. La planificación R E Model Canvas - es sólo un medio, no el HE S objetivo mismo. de las necesidades de los proyectos en términos de valor también ayuda a definir O OBJETIVO (S) Definición y Conexión de Recursos los entregables intermedios y finales del proyecto, incluyendo el desarrollo de Definición de Recursos informes o productos de conocimiento. Las dos primeras preguntas identifican O VA S Este enfoque secuencial e iterativo ayuda a CE las necesidades de recursos del proyecto. O R O L identificar las brechas y los requerimientos PR Éstos se identifican haciéndose en forma secuencial la primera pregunta guía: ¿Qué de adquisición a medida que surgen en RESULTADOS datos tengo? ... ¿Qué habilidades están los diferentes pasos, construyendo el plan disponibles para el proyecto? ... ¿Qué global de forma incremental. procesos internos ya están en marcha? ... Figura 26: Destacando Vínculos de Las preguntas guía para cada componente Recursos en el Data Ring Canvas Conexión de Recursos se deben considerar para detallar el proceso de planificación. Esto incluye preguntar, Con los recursos especificados para cada EMPALME: Herramientas ¿Qué valor tengo? Respondiendo, quizás no bloque estructural, un plan de proyecto y Habilidades en términos de resultados ya alcanzados, debe tener como objetivo entender Todos los recursos duros y blandos del pero al principio, esto puede ser una pregunta sus relaciones interconectadas. Las dos proyecto deben ser capaces de trabajar útil y relevante. Puede haber métodos últimas preguntas de diseño del proyecto juntos, una relación descrita como Encaje. de ajuste que se puedan tomar de Puede parecer obvio, pero la experiencia reflejan estas relaciones; es decir, dados proyectos relacionados, o tal vez haya práctica muestra que la fase de evaluación los recursos previstos en una categoría compromisos preexistentes de la gerencia de los recursos suele subestimarse. para impulsar la implementación. de bloque, la necesidad de explorar si los Diferentes piezas de hardware y software Estos deben ser considerados entre los recursos de las otras categorías están tienen que hablar entre sí. La gente también Recursos de Valor inicial que impulsan la suficientemente ligados entre sí. De lo debe hablar, no sólo para comunicarse planificación general. contrario, los requerimientos y vínculos entre sí dentro del equipo, sino también pueden tener que ajustarse entre sí. Estos para utilizar la infraestructura técnica. Una vez que los recursos son delimitados cuatro enlaces se especifican en la Figura El Canvas debe especificar la programación por cada bloque, las preguntas se repiten: primaria [primary scripting] y lenguajes 26: encaje, operaciones del proyecto (ops), de bases de datos, así como los métodos • ¿Qué datos necesito? resultados, y uso. Cada enlace debe ser de marco específicos necesarios para • ¿Qué habilidades necesito? especificado para completar el Data Ring cumplir con el proyecto. En particular, estos • ¿Qué presupuesto, puntos de referencia, Canvas y articular un plan de proyecto lenguajes deben ser comunes entre equipos gobierno de datos o plan ETL necesito? integral. Estos se describen a continuación: y herramientas. ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 127 2.1_GESTIÓN DE UN PROYECTO DE DATOS  Las herramientas y habilidades también operaciones del proyecto con Habilidades, adicionales o modelos suplementarios deben calzar con el objetivo del proyecto. en sentido de identificar soluciones viables para asegurar una relación sólida entre los El riesgo principal relacionado con una a los problemas operativos, requiere bloques de Proceso y de Valor. evaluación incorrecta de los recursos conocimiento relevante sobre el tema. es impulsar componentes avanzados Las operaciones del proyecto (ops) en el USO: Valor y Herramientas de hardware, soluciones de software Canvas deben especificar los problemas La cuarta pregunta de diseño de proyecto totalmente desarrolladas o habilidades operativos centrales del proyecto que mira más allá del cumplimiento, hacia lograr humanas (por ejemplo, científicos de datos) deben ser abordados; vinculados a las conseguir valor a partir del Uso del proyecto. al proyecto sin una adecuada integración habilidades necesarias para abordarlos y el El diseño del proyecto debe ser suficiente con las infraestructuras existentes y proceso para lograrlos. para utilizar los resultados del producto expertos en el tema. La meta inicial RESULTADOS: Proceso y Valor de datos. Una visualización del panel de recomendada para un proceso y producto control se ejecutará en un computador, mínimos viables ayuda a mitigar este riesgo Los Resultados computacionales de la por ejemplo, que está conectado a una mediante el establecimiento de metas en ejecución del proceso se convertirán intranet interna o a la red más general. torno a recursos más pequeños; la idea en valor. El canvas debe enumerar los es explorar ideas y probar conceptos de resultados específicos que se esperan, Un servidor web lo pondrá en línea para producto. Una vez demostrado, se puede ya sea un algoritmo, un modelo, una que las personas puedan usarlo. Los datos aumentar gradualmente el proceso y el visualización de panel de control, o un que visualiza se almacenarán en alguna producto con los recursos duros y blandos informe analítico. El valor se logra a través parte, adonde el panel de control debe necesarios para pasar al siguiente nivel. del proceso de cómo los resultados son conectarse y acceder a los datos. El personal interpretados, afinados e implementados. de TI mantendrá estos servidores. Estos OPS: Habilidades y Proceso Los métodos de validación de modelos se recursos pueden o no ser identificados en Operaciones del proyecto, u Ops, es el relacionan con los resultados de los datos términos de lo que se necesita para cumplir proceso donde se abordan los cálculos reales del modelo seleccionado. La elección del con el proyecto en sí. La cuarta pregunta de y la exploración de datos necesarios para modelo está vinculada por las definiciones diseño del proyecto ayuda a identificar las cumplir con el proyecto. Estas actividades y metas métricas establecidas en el brechas de implementación que podrían son impulsadas por las preguntas analíticas Proceso y la interpretación del negocio, surgir al completar el proyecto, asegurando específicas y los problemas operativos y las implementaciones de uso que crean que estas consideraciones se hagan como que el equipo del proyecto está tratando valor. Los resultados numéricos y su parte de la planificación de proyecto. El Uso de resolver. Por ejemplo, un proyecto de interpretación tienen el riesgo de no poder enlaza el Valor que el proyecto entrega con scoring crediticio probablemente tendría entender correctamente los resultados las Herramientas necesarias para alimentar un problema operativo específico para obtenidos. También existe riesgo al los datos de salida del proyecto en el sistema calcular variables que se correlacionan convertir estos resultados en palancas de implementación. Esto es especialmente con las tasas de morosidad de los créditos. de decisiones o de negocio que aportan Del mismo modo, una visualización podría valor. Para garantizar que los resultados importante para los proyectos que se basan tener el problema técnico de cómo graficar sean interpretables según las necesidades en soluciones tercerizadas, en las que las una red de corresponsales en un mapa. Ops del negocio, el canvas debe considerar necesidades de apoyo a la implementación observa lo que las personas están haciendo. sus principales entregables y puede deben ser delimitadas dentro de la El bloque de Proceso articula cómo las incluir recursos adicionales que faciliten la contratación inicial. El Uso de canvas debe personas toman medidas en términos interpretación del valor, como un informe especificar cómo se conecta la estrategia de tiempo, presupuesto, requisitos de analítico final. Es posible que también sea de implementación con las herramientas de procedimiento o definición. El vínculo de las necesario especificar resultados de datos implementación. 128 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES CASO 14 Gestión del Proyecto de Big Data de Airtel Money Este caso de administración de El Establecimiento de Objetivos: • La Hipótesis: Existe una proyectos se basa en el caso de Airtel Donde comienza el Data Ring correlación entre la actividad Money Uganda presentado en el Un objetivo es una solución para un de GSM y el comportamiento Capítulo 1.2, Caso 3. Este proyecto problema estratégico, y el propósito de la actividad de Airtel Money fue diseñado y administrado por el del proyecto es entregar esa solución. (es decir, se pueden crear y equipo de investigación de Inclusión emparejar perfiles estadísticos). En este ejemplo, el problema era la Financiera de IFC con sede en África. baja tasa de actividad de Airtel Money. Identificación de Recursos El caso, detallado a continuación, IFC propuso una solución: un modelo describe cada una de las preguntas IFC no estaba en posesión de los para definir el perfil estadístico de un datos de Airtel previamente, teniendo de diseño del proyecto de Data usuario activo y emparejar ese perfil sólo un compromiso de la alianza Ring y considera los detalles de este proyecto. Un Data Ring Canvas con los no usuarios dentro de la con Airtel de proporcionar acceso a terminado refleja este proceso, base de suscriptores GSM existente. los datos de transacciones de CDR y articulando los recursos clave del Una vez identificados, estos clientes Airtel Money. Aunque tanto IFC como proyecto y las relaciones de diseño podrían ser elegidos como usuarios Airtel tienen una infraestructura en una sola visualización. Mientras de alta propensión para Airtel sustancial para sus operaciones, que este canvas es para un proyecto Money. Debido a que se desconocía no estaban disponibles para el terminado, el proceso de usar el si era posible que existiera un proyecto. El equipo de IFC encargó enfoque de canvas es dinámico; emparejamiento para el perfil, era a un especialista en operaciones de escribir y borrar componentes importante establecer un ámbito datos que administrara el proyecto, como desalineaciones obliga a modesto dirigido a una prueba de trayendo habilidades relevantes nuevas consideraciones de diseño y concepto: como la informática, ciencia de requerimientos. Además, el uso de datos y el negocio de Servicios notas adhesivas es un buen enfoque, • El Objetivo: Desarrollar un modelo Financieros Digitales. Especialistas ya que permiten adiciones fáciles y mínimo viable de predicción de en Servicios Financieros Digitales de nuevos elementos de diseño, mientras segmentación de clientes para IFC, especialistas en investigación que también permiten el movimiento identificar usuarios activos de alta de inclusión financiera y expertos en el canvas hasta que se logre un propensión que permita aumentar regionales familiarizados con el plan satisfactorio. las tasas de actividad. mercado local y los comportamientos ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 129 2.1_GESTIÓN DE UN PROYECTO DE DATOS  de los clientes apoyaron el proyecto. Cignifi, Inc. Cignifi trajo: recursos planeados. Es importante destacar Durante el proceso de planificación, de infraestructura adicionales, con que ayuda a identificar previamente el problema operacional era conocido sus grandes Hadoop-Hive clusters los puntos que anticipan el previamente: baja actividad de Airtel para Big Data; experiencia en el refinamiento durante el proceso de Money. El equipo también tenía datos sector que trabaja con datos de implementación. También ayuda a de referencia existentes de un proyecto CDR de MNO; habilidades en R y reevaluar las áreas de proceso claves de datos similar entregado para Tigo Python; estadísticas y aprendizaje cuando se descubren problemas Ghana (véase el Capítulo 1.2, Caso automático; y recursos para la durante la ejecución analítica y estos 2: Tigo Cash Ghana, Segmentación), visualización de datos. El equipo de requieren ajustes del plan. que ayudó a establecer la métrica de IFC-Airtel-Cignifi luego definió un la administración de proyecto, como El plan de gobernanza de datos gobierno de datos y el plan ETL que un 85 por ciento de precisión sobre esperaba refinamiento; la fase fue asesorado por los requerimientos el objetivo para el modelo previsto. analítica y de ejecución del proyecto Legales y de privacidad. Este plan fue de 10 semanas, pero se planificó Las definiciones del modelo también especificaron ‘actividad de 30 días’ envió al equipo de Cignifi a Kampala, relativo a la fecha de inicio de la como su variable dependiente. Uganda para trabajar con el equipo adquisición de datos, es decir, los Finalmente, el presupuesto fue asignado de TI de Airtel para: entender sus tiempos del proyecto se verían a través del proyecto asesorado por bases de datos internas; definir los afectados por la fecha real y cualquier IFC, financiado por la Fundación requerimientos de extracción de problema de ETL. El flujo funcional Bill y Melinda Gates; se estableció un datos; encriptado y anonimizar datos de datos también tuvo suficiencia cronograma de seis meses. sensibles; y luego transferir estos incierta; la planificación del flujo datos a un disco duro físico y seguro funcional y la asignación de recursos Exploración de Recursos para ser cargado en los servidores técnicos no fueron posibles hasta A través de la alianza del proyecto de Cignifi. Las expectativas de valor que los datos finales se pudieron IFC-Airtel, el equipo negoció acceso de los proyectos se especificaron examinar y se conoció su estructura. a seis meses de CDR histórico en el RFP para dar una lista con Este es un cuello de botella común. y los datos de Airtel Money, las puntuaciones de propensión Anticipándose a estas incertidumbres, aproximadamente un terabyte, para del usuario, conocidas como ‘lista el valor agregado especificaba ser extraídos de la bases de datos blanca’. También se especificaron un entregable al prinicipio: un relacionales de Airtel y entregados analíticas adicionales, incluyendo un ‘diccionario de datos’ que hablaba de en formato CSV. Esto requirió una mapeo de redes sociales y análisis todas las descripciones y relaciones infraestructura técnica de Big Data geoespacial. de datos adquiridos, y que se y las habilidades de ciencia de usaría para refinar la suficiencia del datos para analizarla. IFC emitió Suficiencia del Plan: Entrega proyecto una vez que se conocieran una Solicitud de Propuesta (RFP) La revisión de suficiencia ayuda a estos detalles. La fase de ejecución para tercerizar estos elementos asegurar la alineación entre todos de cualquier proyecto de datos es técnicos, para los cuales se seleccionó los recursos, procesos y resultados donde las sorpresas ponen a prueba 130 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES los planes del proyecto. Como esto La estrategia de entrega se acordó ETL y diseño general del proyecto. es de esperar, el proyecto también con la gerencia de Airtel: una reunión El plan original del proyecto especificó un informe provisional de final permitiría la presentación y especificó datos de octubre de 2014 datos como una entrega temprana, discusión del informe analítico, y a marzo de 2015. La solución fue que proporcionaría estadísticas el equipo de TI de Airtel tomaría la descartar completamente los datos descriptivas de alto nivel y resultados lista blanca para basar los próximos de octubre y trabajar con Airtel de análisis exploratorios iniciales, pasos en los resultados. para extraer datos de abril con el fin anomalías o brechas en los datos. de mantener la serie de seis meses Ejecución del Proyecto: Ajustes de El informe provisional de datos necesaria para asegurar un modelo Planificación también incluiría cualquier cosa estadísticamente fiable. También se inesperada que pudiera requerir un Las realidades en el terreno requieren descubrió que, según el plan, los datos ajuste estratégico. el ajuste del plan del proyecto. Se mismos eran insuficientes. El análisis descubrieron los siguientes desafíos geoespacial y de red requería datos Suficiencia del Plan: Implementación durante la ejecución del proyecto y se de ubicación de torres. Se descubrió El objetivo del PMV del proyecto requirió revisar el plan para asegurar que los conjuntos de datos de Airtel buscaba probar si el enfoque de que todas las áreas del proyecto Money no registraban la ubicación de modelado era relevante para Airtel y estuvieran trabajando lo suficiente donde se realizaban las transacciones, el mercado de Servicios Financieros para alcanzar el logro de objetivos. sólo la fecha en que se realizaban. Digitales de Uganda. En este sentido, Una vez asegurado el conjunto El equipo de Cignifi contextualizó el plan era suficiente. El proyecto de datos inicial, el proceso de estos metadatos creativamente proporcionó un (a) informe final, flujo funcional de datos encontró emparejando marcas de tiempo en con hallazgos clave y análisis (b) irregularidades. El proceso de los datos de Airtel Money con marcas con una lista blanca: un conjunto extracción insertó líneas vacías de tiempo de llamadas de voz para de datos de los millones de clientes de alguna manera en el conjunto los usuarios coincidentes en la data GSM de Airtel - con un identificador de datos sin procesar. Aunque los GSM. El equipo usó una ventana de encriptado -, cada uno con una datos pudieron cargarse con éxito, 30 minutos, que proporcionó una puntuación de propensión asociada se interpretaron incorrectamente; coordenada de ubicación que era sobre la probabilidad del uso activo existían numerosas brechas de fiable dentro de un tiempo-distancia de Airtel Money. datos, aunque este no fuera el caso. de 30 minutos desde la ubicación El plan establecido no era suficiente Esto requirió cambios en el proceso de la transacción Airtel Money. En en el sentido que los recursos ETL. El arreglo reveló un error la discusión con el equipo de IFC, fueron pre-asignados para usar más significativo. El conjunto de se acordó que esto era aceptable la información de la lista blanca datos presentaba serias brechas en para que siguiera el análisis, aunque en las campañas de marketing, el primer mes, y este asunto requería dependía de suponer que la mayoría si el análisis resultaba exitoso. revisar el plan de gobierno de datos, de las personas, en promedio, ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 131 2.1_GESTIÓN DE UN PROYECTO DE DATOS  no viajaban grandes distancias en del modelo fuera rehecho. Esto fue Por último, la interpretación de los un período de 30 minutos desde en última instancia un beneficio, ya resultados llevó a un entregable el momento en que hacían una que el análisis inicial también reveló adicional del proyecto: reglas de transacción de Airtel Money y hacer que las transacciones de depósitos y negocios. Como se mencionó en una llamada telefónica. retiro no estaban proporcionando el caso relacionado con Airtel, los la robustez estadística deseada para La fase de ajuste requería una serie algoritmos de aprendizaje automático lograr las métricas de precisión del de cambios significativos. El resumen del modelo establecieron una serie proyecto. El equipo de IFC-Cignifi de estadísticas de los resultados de de variables significativas que eran acordó rehacer los modelos utilizando la primera ronda parecía inusual los usuarios activos redefinidos y difíciles de interpretar en un sentido para los especialistas en Servicios reorientar las transacciones P2P, ya comercial. El equipo de IFC consideró Financieros Digitales; no coincidían que se consideró que proporcionaban que el entregable a la dirección de con los patrones de conducta que los la mayor precisión y, lo que es más Airtel se podía mejorar asegurando expertos en ciencias sociales conocían. importante, definir puntuaciones que el modelo y las puntuaciones Se descubrió que las definiciones de propensión para el segmento de asociadas de propensión de la lista originales del proyecto habían clientes generador de los ingresos más blanca articularan el perfil estadístico especificado de manera ambigua altos. Además, se agregó un modelo de los usuarios activos en términos ‘usuario activo’ de manera tal que el adicional para ‘usuarios muy activos’, comerciales que se alinean con los equipo de análisis modeló una salida o aquellos que hicieron transacciones KPIs relevantes para el negocio. en términos de una transacción al menos una vez cada 30 días Cignifi entregó tres métricas rápidas de Servicios Financieros Digitales durante un período consecutivo de dentro de los 30 días siguientes a la de segmentación con ‘puntos de tres meses. A pesar de ser un grupo fecha de apertura de cuenta de Airtel pequeño, estos usuarios generaron corte’ para perfilar a los usuarios Money, en lugar de una transacción casi el 70 por ciento de los ingresos por: número de llamadas de voz dentro de cualquier período de 30 totales de Airtel Money; el modelo por mes; ingresos totales de voz por días sobre la totalidad del conjunto adicional pretendía identificar a estos mes; y duración mensual total de las de datos. Esto requirió que el diseño clientes de alto valor. llamadas de voz. 132 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES Un Canvas Terminado: El diseño del proyecto Big Data de Airtel, utilizando el Data Ring Canvas Nombre del proyecto: Diseñada por: Fecha: Versión: El Data Ring Canvas Airtel Big Data IFC Dic 2015 7 PL-SQL, R, #NEGOCIOS #DATOS 1 TB 6 meses de Python, IFC: OPS de #INFORMÁTICA datos transaccionales de dinero Pig, Ggplot Datos, DFS Airtel: ICT (ETL) anonimizados CDR & Airtel Cignifi: Gestión de Big Data, #CIENCIA DE DATOS encriptación #INFRAESTRUCTURA Cignifi: Estadística, Airtel: Oracle Ciencia de Datos, VIZ ENCAJE #INFRAESTRUCTURA AS HA Cignifi: Hadoop, Spark, NT BI IE L M AWS, Métodos patentados ID A RR OBJETIVO AD HE ES Perfilamiento de clientes Reunión Decisiones Modelo de segmentación activos de Airtel Money O OPS de clientes para identificar Sistema de Campañas de usuarios con alta Mapeo Identificar el proxy de marketing usando lista blanca propensión a aumentar las geoespacial ubicación de la torre tasas de actividad de flujos P2P O #IMPLEMENTACIÓN VA S CE O R O L Campañas de marketing PR #TIEMPO & objetivo RESULTADOS PRESUPUESTO #DEFINICIONES 6 meses | $ de la Usuarios “Activos”, #AJUSTE Fundación Bill & Puntuaciones “Altamente Diferentes modelos: GLM, Melinda Gates propensidad Activos” Random forest, Ensemble Lista Blanca Clientes #ALIANZA/ #EJECUCIÓN #INTERPRETACIÓN TERCERIZACIÓN Modelo de aprendizaje #INTERPRETACIÓN Informe Estrategia de IFC, Airtel, Cignifi automático con Validación fuera del analítico Crecimiento de (comunicación de 3 vías) precisión del 85% tiempo y fuera de la Inclusión Financiera “Reglas de muestra negocios” Figura 27: Un Data Ring Canvas terminado para el proyecto Airtel Big Data Fase I ©2017 International Finance Corporation. Data Analytics and Digital Financial Services Handbook (ISBN: 978-0-620-76146-8). Este trabajo fue publicado bajo la licencia de Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) License. El Data Ring Canvas es un derivado del Data Ring de este Manual, adaptado por Heitmann, Camiciotti y Racca bajo licencia (CC BY-NC-SA 4.0). Ver más en el siguiente enlace: https://creativecommons.org/licenses/by-nc-sa/4.0/ ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 133 2.1_GESTIÓN DE UN PROYECTO DE DATOS  Entrega del Proyecto una campaña de marketing existente, La lista blanca modelo identificó a poniendo los resultados de lista blanca aproximadamente 250.000 usuarios en espera. Los suscriptores de Airtel de mayor propensión para ser Money crecieron significativamente usuarios activos de dinero electrónico. durante los siguientes meses, lo que En la lista blanca completa de varios disminuyó el valor de la lista blanca, millones de usuarios de GSM, ya que muchos nuevos clientes fueron el 30 por ciento de las puntuaciones incorporados a través del marketing de propensión pronosticaron la habitual. Durante este tiempo, adopción de usuarios P2P ‘altamente los suscriptores GSM también activos’ para generar unos 1.45 crecieron, lo que proporcionó billones de chelínes ugandeses con millones de usuarios potenciales las transacciones P2P; y 4.68 billones de chelines ugandeses por retiros nuevos de Airtel Money. IFC y Airtel de efectivo, o aproximadamente acordaron un análisis de Fase II a 1.7 millones de dólares en ingresos finales de 2016. La meta del proyecto anuales adicionales. es similar, con un componente Los resultados del proyecto fueron analítico adicional construido sobre fuertes y convincentes. Sin embargo, la Fase I, diseñado para examinar los la estrategia de implementación sólo patrones de adopción y distribución se definió como punto de decisión. de Airtel Money a través del tiempo La fecha de entrega coincidió con y la geografía. 134 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 135 e Da d dos tos Ap li de ca D PARTE 2 to ci tos Capítulo 2.2 Recursos y M ica on a é ít es Anal Proy Ges cto 2.2.1 Resumen de las Clasificaciones de Casos de os ti ó n e d rs de e un u Uso Analíticos R ec Da t o s  Resumen de las Clasificaciones de Casos de Uso Analíticos Clasificación Pregunta Abordada Técnicas Implementación Descriptivo • ¿Qué pasó? Alertas, consultas, Informes • ¿Qué está pasando ahora? búsquedas, informes, visualización, paneles de control, tablas, gráficos, narrativas, correlaciones, así como análisis estadístico simple. Diagnóstico • ¿Por qué pasó? Análisis de regresión, BI Tradicional pruebas A|B, correlación de patrones, minería de datos, pronóstico, segmentación Predictivo • ¿Qué ocurrirá en el futuro? Aprendizaje Automático, Modelamiento SNA, geoespacial, reconocimiento de patrones, visualizaciones interactivas Preceptivo • ¿Qué debe hacerse para Las técnicas incluyen Soluciones que se produzca un análisis de gráficos, redes Integradas, determinado resultado? neuronales, máquinas y Decisiones aprendizaje profundo, IA Automatizadas 136 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 2.2.2 Directorio de Fuentes de Datos Fuente: Sistema de Core Bancario y MNO Estructura: Típicamente, datos estructurados, usando bases de datos relacionales. Formato: Datos digitales, que pueden ser extraídos en varios formatos para reportes o análisis. Los datos heredados pueden incluir vinculaciones en papel o formularios de vinculación escaneados. Nombre Datos Ejemplos Datos de Facturas de los Duración del contrato; historial de pagos; Marketing insights mejorados; potencial para crear score Clientes tipos de compra crediticio usando datos de facturas Estado de Registro Estado de registro (por ejemplo, activo, inactivo, Marketing insights; monitoreo del desempeño del negocio; del Cliente nunca usado) cumplimiento de reglamentación KYC del Cliente Nombre, dirección, fecha de nacimiento, sexo, ingresos Marketing insights; cumplimiento de reglamentación Estado de la Cuenta Tipo de cuenta, estado de actividad (activo, inactivo, Marketing insights; monitoreo del desempeño del negocio; envejecimiento de la actividad, inactivo con saldo) cumplimiento de reglamentación Actividad de Cuenta Saldo de la cuenta, velocidad mensual, Marketing insights; scoring crediticio; saldo promedio diario cumplimiento regulatorio Datos de Transacciones Volumen y valor de depósitos, retiros, pagos de Monitoreo del desempeño del negocio y financiero; Financieras (directos) facturas, transferencias u otras transacciones cumplimiento regulatorio; marketing insights; financieras scoring crediticio Datos de Transacciones Transacciones fallidas; transacciones declinadas; Asuntos de desempeño del producto y problemas de diseño Financieras (indirectos) canales utilizados; hora del día del producto; necesidades de capacitación y comunicaciones Datos de Dinero Electrónico Fondo de dinero electrónico, conciliaciones, Administración del desempeño del corresponsal; fraude y transferencias de fondos entre corresponsales gestión de riesgo Actividades No Financieras Cambio de PIN; solicitud de saldo; solicitud de estado Marketing insights; mejoras en la eficiencia; desarrollo de de cuenta productos Originación de Créditos Tipo de crédito, monto del crédito, colateral utilizado, Marketing insights; monitoreo de desempeño de la cartera; duración, tasa de interés scoring crediticio; evaluación de créditos nuevos Actividad Crediticia Saldo de crédito, estado del crédito, fuente de la Marketing insights; monitoreo de desempeño de la cartera; transacción de pago de crédito scoring crediticio; evaluación de créditos nuevos ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 137 2.2_RECURSOS Fuente: Sistema de Dinero Electrónico Estructura: Típicamente, datos estructurados, usando bases de datos relacionales. Formato: Datos digitales, que pueden ser extraídos en varios formatos para reportes o análisis. Los datos heredados pueden incluir vinculaciones en papel o formularios de vinculación escaneados. Nombre Datos Ejemplos Del Cliente Nombre, dirección, fecha de nacimiento, sexo, ingresos Marketing insights; cumplimiento regulatorio Estado de Registro Estado de actividad (activo, inactivo, envejecimiento Marketing insights; monitoreo del desempeño del negocio; de la actividad, inactivo con saldo) cumplimiento regulatorio Actividad de Billetera Electrónica Saldo de billetera electrónica, velocidad mensual, Marketing insights; scoring crediticio; cumplimiento saldo promedio diario regulatorio Datos de Transacción Volumen y valor de depósitos, retiros, pagos de Monitoreo del desempeño empresarial y financiero; facturas, P2P, transferencia, recarga de tiempo aire cumplimiento regulatorio; Marketing insights; u otras transacciones financieras scoring crediticio Datos de Dinero Electrónico Fondo de dinero electrónico, conciliaciones, Administración del desempeño del corresponsal; fraude y transferencias de fondos entre corresponsales gestión de riesgo Fuente: Sistema de Gestión de Corresponsales Estructura: Típicamente, datos estructurados, usando bases de datos relacionales. Formato: Datos digitales, que pueden ser extraídos en varios formatos para reportes o análisis. Los datos heredados pueden incluir registros en papel, formularios de registro escaneados, o reportes de monitoreo de corresponsales o informes de desempeño. Nombre Datos Ejemplos Actividades del Corresponsal Volumen y valor de transacciones de corresponsales; Insights de marketing y ventas; scoring crediticio; gestión del (directo) conciliación de transferencias; depósito y retiro de desempeño de corresponsales fondos; saldo del fondo; días sin fondos Actividades de Corresponsales Cambio de PIN; solicitud de saldo; solicitud de estado Insights de marketing y ventas; gestión del desempeño de (indirectas) de cuenta; crear asistente nuevo corresponsales Actividades del Comerciante Volumen y valor de transacciones del comerciante; Insights de marketing y ventas; scoring crediticio; gestión del (directas) número de clientes únicos desempeño de comerciantes Actividades del Comerciante Cambio de PIN; solicitud de saldo; solicitud de estado Insights de marketing y ventas; gestión del desempeño de (indirectas) de cuenta; crear asistente nuevo comerciantes Datos Técnicos del Sistema Número de TPS; listas de transacciones; tiempo de Planeación de capacidad; Supervisión del desempeño versus procesamiento SLA; identificar problemas técnicos de desempeño Informes de Visitas a Presencia de materiales promocionales; Insights del cliente; gestión del desempeño de Corresponsales y Comerciantes conocimientos de asistentes; tamaño del fondo corresponsales por Personal de Ventas de caja; pueden incluir más frecuentemente datos semiestructurados o no estructurados, tales como informes de monitoreo en papel 138 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES Fuente: Sistema de Gestión de Relacionamiento con el Cliente (CRM) Estructura: A menudo incorporan datos tanto estructurados como semiestructurados que utilizan bases de datos relacionales o sistemas de almacenamiento basados en archivos, como grabaciones de voz o resúmenes de problemas etiquetados por categorías estructuradas. Formato: Por lo general, datos digitales, aunque datos semiestructurados y no estructurados pueden no estar disponibles para la generación de informes (por ejemplo, para grabaciones de voz, si están disponibles). Nombre Datos Ejemplos Registros de Call Center Registro de problemas, tipo de problemas, tiempo de Insights de los clientes; gestión de operaciones y del resolución (puede incluir datos semiestructurados desempeño; mejoras al sistema en informes) PBAX Número de llamadas al Call Center; duración de las Gestión de Operaciones y del Desempeño llamadas; tiempos de llamada en espera; llamadas perdidas Datos de Retroalimentación de Número de llamadas; estadísticas de tipo de llamada; Identificar: desempeño técnico y problemas de diseño del Atención al Cliente estadísticas de resolución de problemas producto; necesidades de capacitación y comunicación; problemas de terceros (por ejemplo, corresponsal, facturador) Datos de Retroalimentación del Número de llamadas de corresponsal o comerciante; Identificar: desempeño técnico y problemas de diseño del Corresponsal y del Comerciante estadísticas del tipo de llamada; estadísticas de producto; necesidades de capacitación y comunicaciones de resolución de problemas corresponsales; problemas del cliente Interacciones del Canal de Volumen de visitas a sitios web, volúmenes del call Insights de los clientes; administración de operaciones y del Comunicación center, consultas en redes sociales, solicitudes de chat desempeño; mejoras al sistema en vivo Datos de Comunicación Tipo de consultas, satisfacción del cliente, análisis de Insights de los clientes Cualitativa redes sociales Fuente: Registros de Clientes Estructura: Incorporando a menudo datos estructurados, semi-estructurados y no estructurados, que van desde: Documentos de KYC que pueden incluir variedad de información personal dependiendo del tipo de documento; a encuestas de mercado o de clientes; hasta notas de grupos focales. Formato: Se pueden usar una amplia variedad de formatos para almacenar datos de registro de clientes, incluyendo bases de datos relacionales, sistemas de almacenamiento de archivos o documentos en papel o escaneados. Nombre Datos Ejemplos Documentos de KYC Identificación; certificado de salario; certificado Cumplimiento regulatorio; segmentación demográfica de domicilio y geográfica Formularios de Inscripción y de Abrir cuenta de Servicios Financieros Digitales; Cumplimiento regulatorio; segmentación demográfica Solicitud solicitud de crédito y geográfica Investigación Cualitativa Entrevistas con los clientes; grupos focales Insights de marketing y productos Investigación Cuantitativa Estudios de conocimiento y uso; estudios de Insights de marketing y productos sensibilidad de precios; pruebas piloto ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 139 2.2_RECURSOS Registros de Corresponsales y Comerciantes Estructura: Incorporando a menudo datos estructurados, semi-estructurados y no estructurados, que van desde: Documentos de KYC que pueden incluir variedad de información personal dependiendo del tipo de documento; hasta encuestas de marketing o de comerciantes; hasta notas de grupos focales. Formato: Se puede usar una amplia variedad de formatos para almacenar datos de registros de corresponsales o comerciantes, incluyendo bases de datos relacionales, sistemas de almacenamiento de archivos o documentos en papel o escaneados. Documentos de KYC Certificados de constitución; Cumplimiento regulatorio; segmentación demográfica declaraciones de impuestos; documentos KYC; y geográfica extractos de cuentas bancarias Formularios de Registro Registrarse como corresponsal o comerciante de Cumplimiento regulatorio; segmentación demográfica Servicios Financieros Digitales y geográfica Investigación Cualitativa Entrevistas a los corresponsales; grupos focales Insights de marketing, productos y ventas Investigación Cuantitativa Investigación de comprador secreto Insights de marketing, productos y ventas Fuente: Alianzas con Terceros Estructura: El tercero puede adoptar cualquier forma o estructura, dependiendo del contenido, fuente y proveedor que lo proporciona. Formato: Los formatos pueden variar desde formatos .CSV comunes a APIs de acceso propietario y métodos de entrega. Nombre Datos Ejemplos Datos de Facturas Acerca Duración del contrato; historial de pagos; Marketing insights mejorados; potencial para crear score de de Clientes (empresas de tipos de compra crédito usando datos de facturas servicios públicos) Datos del Pagador Acerca del Historial de nómina; duración de pagos habituales Marketing insights mejorados; scoring crediticio Cliente (empleador, gobierno) Repositorios de Información Datos KYC; calificación crediticia; actividad Scoring; investigaciones de fraude; gestión de riesgo del Cliente (por ejemplo, burós fraudulenta previa de crédito, listas de vigilancia, registros policiales) Datos geoespaciales Demografía regional; densidad de población; Insights del mercado; gestión de corresponsales (datos satelitales) topografía; infraestructuras como carreteras y electricidad; puntos de acceso financiero Medios de Comunicación y Tipo y frecuencia de actividades de red; información Insights del mercado; scoring crediticio Redes Sociales personal; número de conexiones; tipo de conexiones 140 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 2.2.3 Métricas para la Evaluación de Modelos de Datos Lista Top-10 de métricas de desempeño para evaluar modelos de datos Métrica Definición Curva Característica de La curva ROC se define como representación gráfica entre la tasa positiva real y la tasa de falsos positivos. Esta ilustra el Operación del Receptor desempeño del modelo a medida que su umbral de discriminación se varía. Cuanto mayor sea el área entre la curva ROC (ROC) y la línea base, mejor será el modelo. AUC Área Debajo de la Curva (AUC) mide el área bajo la curva ROC. Proporciona una estimación de la probabilidad de que la población esté clasificada correctamente. Representa la capacidad del modelo para producir una buena clasificación de instancia relativa. Valor igual a uno es un modelo perfecto. KS La prueba estadística Kolmogorov-Smirnov (KS) mide la separación vertical máxima entre la distribución acumulada de buenos y malos. Representa la capacidad del modelo para separar la población de interés ‘buena’ de la población ‘mala’. Lift Chart Mide la efectividad de un modelo predictivo calculado como la relación entre los valores predictivos positivos sobre el número de positivos en la muestra para cada umbral. Cuanto mayor sea el área entre la curva Lift y la línea base, mejor será el modelo. Ganancias Acumuladas Mide la efectividad de un modelo predictivo calculado como la relación entre los valores predictivos positivos sobre el número de positivos en la muestra para cada umbral. Cuanto mayor sea el área entre la curva de ganancias acumuladas y la línea base, mejor será el modelo. Coeficiente GINI El coeficiente Gini está relacionado con el AUC; G (i) = 2AUC - 1. También proporciona una estimación de la probabilidad de que la población esté clasificada correctamente. Valor igual a uno es un modelo perfecto. Esta es la definición estadística de lo que impulsa el Índice Gini económico para la distribución del ingreso. Exactitud La exactitud es la capacidad del modelo para hacer una predicción correctamente. Se define como el número de predicciones correctas sobre todas las predicciones hechas. Esta medida sólo funciona cuando los datos están equilibrados (es decir, la misma distribución para lo bueno y lo malo). Precisión La precisión es la probabilidad de que una instancia seleccionada al azar sea positiva o buena. Se define como la proporción entre el total de instancias positivas verdaderas previstos y el total de instancias positivas previstos. Sensibilidad Sensibilidad es la probabilidad de que una instancia seleccionada al azar sea buena o positiva. Se define como la proporción entre el total de instancias positivas previstos verdaderas y el total de instancias positivas. Error Cuadrático Medio de El RMSEP es una medida de la diferencia entre los valores previstos por un modelo y los valores realmente observados. La Predicción (RMSEP) métrica se utiliza en predicciones numéricas. Un buen modelo debe tener un RMSEP pequeño. 2.2.4 Data Ring y Data Ring Canvas Las herramientas de Data Ring y Data Ring Canvas también están disponibles para descargar desde el sitio web de The Partnership for Financial Inclusion aquí: www.ifc.org/financialinclusionafrica La siguiente página desprendible ofrece una copia del Data Ring y el Data Ring Canvas, para ser utilizada. ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 141 2.2_RECURSOS 142 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES El Data Ring del to al ien eg yL Sec ocim Marc De ad tor Fl n pó uj cid os al Co o ci sit iva de So de o Pr D ia Infor ón at má nc ra ti c i ct u os ac ie a ru iz C Ac st Ne al ce ENCAJE si bil rae go i su s ne s ida f V to cio n HA Da a AS d ni c BI I mu ci NT LI os Form Co atos IE s to Ci DA AM Da 2 en DE 1 RR cia S HE de D atos OBJETIVO (S) O PS US O Imple Punto d e me 4 Referen cia nta 3 O n VA ció Mét ES O ció C rica R L sy ea O Defi n PR an Pr nici us es one Pl A os te up s j at RESULTADOS ón u es D In ci A lia to da ter cu yT tra os pre E j e nz iem En es taci ón a y po Go ato oc Te s D Pr rc s bi s to y er er iz Da ra no u ac ct ió da de u n tr li Es Sa ©2017 International Finance Corporation. Data Analytics and Digital Financial Services Handbook (ISBN: 978-0-620-76146-8). Este trabajo fue publicado bajo la licencia de Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) License. El Data Ring fue adaptado de Camiciotti y Racca, ‘Creare Valore con i BIG DATA’. Edizioni LSWR (2015) bajo licencia (CC BY-NC-SA 4.0). Ver más en el siguiente enlace: https://creativecommons.org/licenses/by-nc-sa/4.0/ ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 143 2.2_RECURSOS Nombre del proyecto: Diseñada por: Fecha: Versión: El Data Ring ENCAJE AS HA NT BI IE L M ID A RR AD HE ES O OPS OBJETIVO(S) O VA S CE O R O L PR RESULTADOS ©2017 International Finance Corporation. Data Analytics and Digital Financial Services Handbook (ISBN: 978-0-620-76146-8). Este trabajo fue publicado bajo la licencia de Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) License. El Data Ring Canvas es un derivado del Data Ring de este Manual, adaptado por Heitmann, Camiciotti y Racca bajo licencia (CC BY-NC-SA 4.0). Ver más en el siguiente enlace: https://creativecommons.org/licenses/by-nc-sa/4.0/ 144 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES Conclusiones y Lecciones Aprendidas El universo de datos se está expandiendo como de presupuesto. Además, es esencial al proveedor a desarrollar una hoja de ruta cada hora. La capacidad analítica que haya un departamento claramente que conduzca hacia el objetivo deseado. computacional también se está definido o un individuo con influencia volviendo más y más avanzada, y el dentro de la organización que conduzca Orientarse hacia los datos también costo del almacenamiento de datos está el proceso. Algunas organizaciones que incluye revisar las habilidades del personal disminuyendo. El potencial analítico de están avanzadas en la curva de madurez existente y evaluar los niveles de confort datos descrito en este manual - y en estos de los miembros del equipo en tecnología han optado por crear una posición de alto casos - resalta cómo los proveedores de e informática. El personal existente puede nivel llamada Chief Data Officer o Director Servicios Financieros Digitales pueden ser capacitado para manejar nuevas de Datos (CDO); esta persona trabaja en aprovechar todo tipo de datos para tecnologías. Están en una posición ideal estrecha colaboración con la dirección para construir nuevos servicios y lograr mayores para aplicar las nuevas tecnologías a los eficiencias en sus operaciones actuales administrar todos los datos relacionados viejos problemas porque ya conocen la mediante la incorporación de enfoques con la estrategia y la administración. organización, su mercado y sus desafíos. basados en datos. Los profesionales en Normalmente, el personal necesitará La organización debe considerar sus campo deben esforzarse por adoptar un capacitación y entrenamiento en campo enfoque basado en datos en sus negocios. capacidades y experiencia actuales para articular claramente el futuro. en gestión de datos. El proveedor de SFD Esto traerá mayor precisión a sus Consideraciones importantes incluyen tal vez desee identificar a los miembros actividades y un enfoque basado en la el tamaño de la organización, así como del personal que tienen una aptitud y una evidencia para la toma de decisiones. actitud adecuadas para adoptar nuevas los recursos de TI existentes, tales como Construyendo una Cultura prácticas habilitadas por tecnología, habilidades y experiencia. Además, Orientada a Datos y luego preparar un plan para el desarrollo pasar a un enfoque basado en datos intensivo de habilidades. La cultura organizacional es crucial. Las implicará grandes cambios para la cultura organizaciones deben fomentar un entorno organizacional, específicamente en torno No importa en qué nivel esté una favorable a los datos en el que se fomente a cómo se comparten los datos y cómo organización en su adopción de análisis el poder de los datos, y donde las personas se toman las decisiones. La organización basados en datos, hay margen para estén empoderadas y estimuladas a deberá estar preparada para brindar incorporar sistemáticamente datos explorar para encontrar formas de mejorar apoyo continuo durante el cambio y estar en sus procesos y toma de decisiones. los resultados. Como resultado, existe preparada para gestionar las expectativas Los profesionales en campo pueden la necesidad de invertir en habilidades del personal y de la gerencia. Los niveles tomar pequeños pasos para comenzar a operativas de equipo, herramientas e ideas actuales de madurez de la gestión de datos rigurosamente probar las necesidades y con el fin de hacer justicia a los datos. también son importantes. El proveedor de preferencias de sus clientes, para monitorear El liderazgo organizacional debe articular claramente la visión y los estándares SFD puede querer examinar las fuentes de el desempeño internamente y entender fundamentales que formarán la base de su datos actuales, el marco de informes y el el impacto en sus actividades de negocio. programa de gestión de datos. El liderazgo uso de los datos en la toma de decisiones Más importante aún, las metas que también debe formar un fuerte compromiso para situarse en la curva de madurez. establece una organización para el para desarrollar la capacidad de datos de Entender dónde se encuentra en la escala seguimiento del desempeño del negocio la compañía, tanto en términos de visión de madurez de la gestión de datos ayudará deben ser cuantificables y medibles. ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 145 2.2_RECURSOS Toda los Datos son Buenos Datos conocimiento técnico para diseñar modelos han elevado el campo de visualización de La analítica de datos ofrece a los proveedores de scoring basados en datos del MNO - datos muy por encima de cuadros y gráficos, de SFD la oportunidad de obtener una en este caso, asociarse con un proveedor aunque el campo también abarca estas comprensión mucho más granular de que proporciona este servicio es una herramientas más tradicionales. sus clientes. Esta información se puede buena opción. La visualización de datos está relacionada con, utilizar para diseñar mejores procesos y procedimientos que se alineen con las Uso de la Visualización de Datos pero separada, de los paneles de control. Un Una imagen vale más que mil palabras, panel de control probablemente incluiría una necesidades y preferencias del cliente. o quizá mil números. El uso de visualizaciones o más visualizaciones discretas. Los paneles La analítica de datos trata sobre la comprensión de los clientes, con el objetivo para ilustrar gráficamente los resultados de de control son puntos de referencia de acceso, de que el cliente obtenga mayor valor los informes de gestión de datos estándar que a menudo sirven como puntos de entrada del producto. puede ayudar a la toma de decisiones y el a datos más detallados o herramientas de monitoreo. Las representaciones gráficas reportes. Aquí es donde se visualizan los KPIs En particular, la combinación de permiten a la audiencia identificar las para proporcionar información instantánea, conocimientos de diferentes metodologías tendencias y los valores o las desviaciones típicamente para los administradores que y fuentes de datos puede enriquecer el rápidamente. Esto es cierto con respecto necesitan una instantánea concisa del entendimiento. Como ejemplo, aunque los a los equipos internos de ciencia de datos estado operacional. Los paneles de control datos cuantitativos pueden proporcionar simples se pueden implementar en Excel, que están explorando los datos, y también información sobre lo que está sucediendo, por ejemplo. Por lo general, el concepto de para comunicaciones más amplias, cuando los datos cualitativos y la investigación panel de control se refiere a representaciones las tendencias de los datos y los resultados aclararán por qué está sucediendo. de datos más sofisticadas, incorporando pueden tener más impacto que las tablas De manera similar, varios proveedores las ideas de interactividad y dinamismo visualizando relaciones o conclusiones de SFD han utilizado una combinación que abarca el concepto más amplio de basadas en datos. de modelado predictivo y análisis de visualización de datos. Además, los paneles geolocalización para identificar las áreas Un cuadro o una gráfica es una visualización de control más sofisticados probablemente objetivo en las que deben concentrar sus de datos, en su sentido más básico. Dicho incluirán datos en tiempo real y respuesta esfuerzos de marketing. a las consultas de los usuarios. Mientras esto, la ‘visualización’ como concepto y disciplina emergente es mucho más amplia, que la visualización de datos y los paneles Para el vasto mercado masivo que los tanto con respecto a las herramientas de control de datos están inherentemente proveedores de SFD atienden, en muchos casos no puede haber historial financiero disponibles como con los resultados relacionados y a menudo se superponen, formal o historial de datos de pagos para posibles. Por ejemplo, una infografía puede también es importante reconocer que son usar como base. En estas situaciones, los ser una visualización de datos en muchos conceptualmente diferentes y juzgados datos alternativos puede permitir a los contextos, pero no es necesariamente una por criterios diferentes. Hacer esto ayuda a proveedores de SFD verificar los flujos de representación gráfica [plot]. En algunos certificar que las herramientas adecuadas se efectivo a través de información de variables casos, esta amplitud también puede incluir aplican para el trabajo correcto y garantiza sustitutivas (proxy), tales como los datos del medios mixtos. Un pionero en esta área, que los proveedores y los productos se MNO. Aquí, los proveedores de SFD tienen por ejemplo, es Hans Rosling, cuyo trabajo adquieran para los fines previstos. la opción de trabajar directamente con combinando la visualización de datos con un MNO o con un proveedor. La decisión la narración interactiva de medios mixtos le La Ciencia de los Datos es el Arte depende de los mercados respectivos, así valió un lugar en la lista de las 100 personas de los Datos como de la preparación de la institución. más influyentes de la revista Time.60 Estos El capítulo 1 anotó la historia de la ‘ciencia Muchos proveedores pueden no tener el elementos de dinamismo e interactividad de datos’ como término. Curiosamente, 40 Hans Rosling. En Wikipedia, la Enciclopedia Libre, consultada el 3 de abril de 2017, https://en.wikipedia.org/wiki/Hans_Rosling. 146 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES aquellos que lo acuñaron vacilaron respecto Industria Global Métodos alternativos de scoring crediticio de llamar a los expertos en el área de esta El campo de la ciencia de los datos ha son la búsqueda de nuevas fuentes de disciplina ‘científicos de datos y ‘artistas existido menos de una década, y el término datos que permiten a los productos de datos’. Aunque que la ciencia de los mismo solo llega a prominencia en el 2008 llegar a nuevos segmentos de clientes, a datos ganó el título oficial, es importante (véase la Figura 6 en la Parte 1). Desde menudo a partir de la tecnología de redes reconocer que la creatividad, el diseño entonces, los teléfonos inteligentes se han sociales. Las estrategias de marketing y la sensibilidad artística siguen siendo vuelto ubicuos, el poder computacional ha están afinadas por rigurosas pruebas críticos para el campo. Después de la crecido sustancialmente y los costos de estadísticas, pruebas A|B, que fueron discusión anterior sobre la visualización almacenamiento se han desplomado. Las promulgadas por compañías como de los datos, el proceso de convertir bits empresas de tecnología han introducido Amazon o Yahoo! para refinar sus diseños de datos en una información informativa, nuevos productos que se han asimilado de sitios web. Adicionalmente, el análisis interactiva, estéticamente agradable rápidamente a la vida cotidiana, como de segmentación geográfica de clientes, la Google Maps, el chat de video FaceTime asignación de flujos P2P y la identificación y visualmente atractiva requiere tanto de Apple y la IA de Amazon, Alexa. de la ubicación óptima del corresponsal, habilidades técnicas como ideas creativas. Los productos basados en datos se están son ayudados por el análisis geoespacial y En referencia a Rosling, el proceso de hacer apoderando rápidamente de todos los las herramientas que ofrecen Google Maps de la visualización de datos el personaje sectores, ya que grandes conjuntos de y la tecnología OpenStreetMap. A medida principal en lo que más correctamente se datos y herramientas de ciencias de datos que la tecnología continúa evolucionando, puede describir como una representación ofrecen valor innovador en mercados los proveedores de SFD pueden esperar teatral evidencia aún más la interacción establecidos. A mediados de los años 2000, que surjan nuevas soluciones para ayudar entre la ciencia de los datos y el arte de los se vio cómo la aparición de la analítica a comprender mejor a los clientes, llegar a datos. El papel de los científicos de datos, mercados más grandes y ofrecer productos de los datos creció de manera destacada independientemente del título funcional, y servicios adaptados a las necesidades de más allá de la industria de la tecnología, es recurrir a la habilidad técnica y la los clientes. particularmente haciendo avances intuición creativa para explorar patrones, tempranos en el sector de bienes de extraer valor de esas relaciones y comunicar consumo de rotación rápida (Fast Moving Datos para la Inclusión Financiera su importancia. Consumer Goods abreviado en inglés como En el sector de inclusión financiera, los datos FMCG), como en supermercados y grandes son importante porque la base de clientes Este dualismo de organización estructurada almacenes. La industria a nivel global ha objetivo a menudo carece de acceso a y patrones emergentes describe una de los bancos u otros servicios financieros cambiado en pocos años, resumida por la las complejidades generales de muchos o tiene una exposición limitada y no está observación ampliamente difundida por proyectos de datos. Por otra parte, hay la familiarizada con los servicios financieros. Tom Goodwin: Uber, la compañía de taxis necesidad de objetivos claros, arquitectura más grande del mundo, no tiene vehículos. Sus necesidades y patrones de gasto son definida y experiencia precisa para asegurar Facebook, el propietario de medios más diversos y diferentes. Los datos permiten a que la entrega del proyecto sea puntual popular del mundo, no crea contenido. los proveedores de SFD crear productos y y dentro del presupuesto. Por otro lado, Alibaba, el minorista más valioso, no tiene servicios que reflejen mejor las preferencias existe la necesidad muy importante de una inventario. Y Airbnb, el mayor proveedor de y aspiraciones del cliente. Los Servicios flexibilidad abierta que permita descubrir alojamiento del mundo, no posee bienes Financieros Digitales han cambiado el patrones, explorar nuevas ideas, minería de raíces. Algo interesante está pasando. acceso y la asequibilidad de los servicios datos para descubrir posibles anomalías, Las soluciones basadas en datos han financieros en los mercados emergentes probar hipótesis y diseñar creativamente permitido a los nuevos operadores irrumpir atendiendo a las necesidades de los visualizaciones para contar la historia de en los sectores establecidos, y las empresas de clientes de bajos ingresos, aumentando así los datos. tecnología siguen impulsando el desarrollo. la inclusión financiera. ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 147 2.2_RECURSOS Los datos traen consigo la oportunidad de mejorar la inclusión financiera. Sin embargo, esto debe hacerse garantizando al tiempo que la protección del consumidor y la protección de datos no se vean comprometidos. Los datos se producen y recopilan en forma pasiva a través de dispositivos digitales como teléfonos celulares y computadores, entre otros. Muchas partes interesadas han expresado su preocupación por el hecho que los hogares de bajos ingresos, los productores primarios de estos datos en el contexto de la inclusión financiera, no sean conscientes que estos datos se están recopilando, analizando y monetizando. En ausencia de una política uniforme, existen normas diferentes aplicadas entre los tipos de proveedores y algunos casos en que se han violado los derechos de los consumidores. Con la proliferación de analítica de datos, es crítico que todas las partes interesadas - proveedores de SFD, reguladores, encargados de la formulación de políticas, instituciones financieras de desarrollo e inversionistas - discutan los problemas asociados con la protección de datos y la protección del consumidor para encontrar soluciones. Algunos profesionales en campo pueden sentirse presionados a adoptar nuevas tecnologías o metodologías para mantenerse al día con las tendencias predominantes o debido a las acciones tomadas por sus competidores. Cabe decir que tales esfuerzos podrían anularse si la organización no tiene la habilidad técnica para administrar el proyecto o no tiene la capacidad de actuar sobre la base de los resultados o la nueva información que los datos proveen. Así, los profesionales en campo deben identificar los problemas de negocio que están tratando de resolver, evaluar qué datos y capacidad analítica que poseen actualmente, y luego tomar decisiones sobre cómo implementar el proyecto de datos. El objetivo comercial debe estar en el centro de cualquier proyecto de gestión de datos. 148 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES Glosario Término Explicación Acuerdo de Nivel de Un SLA es el componente del contrato de servicio entre un proveedor de servicios y un cliente. SLAs proporciona aspectos Servicio (SLA) específicos y medibles relacionados con las ofertas de servicios. Por ejemplo, los SLA se incluyen a menudo en los acuerdos firmados entre los proveedores de servicios de Internet y los clientes. SLA también se conoce como un Acuerdo de Nivel Operativo (OLA), cuando se utiliza en una organización sin una relación establecida o formal entre el proveedor y el cliente. Algoritmo En matemáticas y ciencias de la computación, un algoritmo es una secuencia autónoma de acciones a realizar. Los algoritmos realizan cálculos, procesamiento de datos o tareas de razonamiento automatizado. Almacenamiento de Almacenamiento de datos es un término general para archivar datos en formas electromagnéticas o de otro tipo, Datos para su uso por un computador o dispositivo. Los diferentes tipos de almacenamiento de datos juegan diferentes funciones en un entorno informático. Además de las formas de almacenamiento de hard data, ahora hay nuevas opciones para el almacenamiento remoto de datos, como la computación en la nube, que pueden revolucionar las formas en que los usuarios acceden a los datos. Análisis de Minería de Minería de texto, también conocido como minería de datos de texto y aproximadamente equivalente a análisis de texto, Texto es el proceso de derivar información de alta calidad a partir de texto. La información de alta calidad se obtiene típicamente a través de la creación de patrones y tendencias a través de medios tales como el aprendizaje de patrones estadísticos. La minería de textos generalmente involucra: estructurar el texto de entrada, (usualmente analizar, junto con la adición de algunas características lingüísticas derivadas y la eliminación de otras, y posterior inserción en una BD); derivar patrones dentro de los datos estructurados; y la evaluación e interpretación de los resultados. Análisis de Redes El análisis de redes sociales, o SNA, es el proceso de investigación de estructuras sociales a través del uso de teorías de red y Sociales (SNA) gráficas. Caracteriza estructuras en red en términos de nodos (actores individuales, personas o cosas dentro de la red) y los vínculos, aristas o enlaces (relaciones o interacciones) que los conectan. Analítica de Datos El análisis de datos se refiere a técnicas y procesos cualitativos y cuantitativos utilizados para generar información, mejorar la productividad y generar beneficios a nivel de negocio. Los datos se extraen y categorizan para identificar y analizar datos y patrones de comportamiento, y las técnicas de análisis de datos varían según los requisitos de la organización. Metodologías de Los análisis predictivos proporcionan un análisis mucho más complejo de los datos existentes para hacer una proyección Analítica Predictiva a futuro. Las técnicas incluyen análisis de regresión, estadísticas multivariantes, correlación de patrones, minería de datos, modelado predictivo y pronóstico. Metodologías de El análisis prescriptivo va un paso más allá: proporciona información para alimentar decisiones óptimas para un conjunto Analítica Prescriptiva de resultados futuros previstos. Las técnicas incluyen análisis de gráficos, redes neuronales, máquinas y aprendizaje profundo. Metodologías de Las metodologías analíticas menos complejas son de naturaleza descriptiva; proporcionan descripciones históricas Analítica Descriptiva del desempeño institucional, análisis en torno a las razones para este desempeño e información sobre el desempeño institucional actual. Las técnicas incluyen alertas, consultas, búsquedas, informes, visualización, tablas, paneles de control, gráficos, narrativas, correlaciones, así como análisis estadístico simple. Anti Lavado de Activos ALA/CFT son controles legales aplicados al sector financiero para ayudar a prevenir, detectar y reportar actividades de y lucha Contra el lavado de dinero. ALA/Los controles ALA/CFT incluyen montos máximos que pueden mantenerse en una cuenta o ser Terrorismo (ALA/CFT) transferidos entre cuentas en cualquier transacción, o en un día cualquiera. También incluye la información financiera obligatoria de KYC para todas las transacciones de más de $10,000, incluyendo la declaración de la fuente de los fondos, así como la razón de la transferencia. Aprendizaje Automático El aprendizaje automático es un tipo de inteligencia artificial (IA) que proporciona a los computadores la capacidad de aprender sin ser programados explícitamente. El aprendizaje automático se centra en el desarrollo de programas informáticos que pueden cambiar cuando se exponen a nuevos datos. ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 149 Aprendizaje No El aprendizaje no supervisado es un método que permite a las máquinas clasificar objetos tangibles e intangibles sin Supervisado proporcionar ninguna información previa sobre los objetos. Las cosas que las máquinas necesitan clasificar son variadas, como los hábitos de compra de los clientes, patrones de comportamiento de las bacterias o ataques de hackers. La idea principal detrás del aprendizaje no supervisado es exponer a las máquinas a grandes volúmenes de datos variados y permitirles aprender e inferir de los datos. Sin embargo, las máquinas deben programarse primero para aprender de los datos. Aprendizaje Supervisado El aprendizaje supervisado es un método utilizado para permitir que las máquinas clasifiquen objetos, problemas o situaciones basados en datos relacionados introducidos en las máquinas. Las máquinas se alimentan de datos tales como características, patrones, dimensiones, color y altura de objetos, personas o situaciones de forma repetitiva hasta que las máquinas son capaces de realizar clasificaciones precisas. El aprendizaje supervisado es una tecnología o concepto popular que se aplica a escenarios de la vida real. El aprendizaje supervisado se utiliza para proporcionar recomendaciones de productos, segmentar clientes basados en sus datos, diagnosticar enfermedades basadas en síntomas anteriores y realizar muchas otras tareas. Arquitectura de Datos La arquitectura de datos es un conjunto de reglas, políticas, estándares y modelos que rigen y definen el tipo de datos recopilados; y cómo se usa, almacena, administra e integra dentro de una organización y sus sistemas de Base de Datos. Ofrece un enfoque formal para crear y administrar el flujo de datos, y cómo se procesan a través de los sistemas y aplicaciones de TI de una organización. Banca Electrónica El suministro de productos y servicios bancarios a través de canales de distribución electrónicos. Banca móvil El uso de un teléfono móvil para acceder a los servicios bancarios convencionales. Esto abarca tanto los servicios transaccionales como los no transaccionales, como la consulta de información financiera y la ejecución de transacciones financieras. Big Data Big Data son grandes conjuntos de datos, cuyo tamaño se mide por cinco características distintas: volumen, velocidad, veracidad, variedad, y complejidad. Billeteras electrónicas Una cuenta de dinero electrónico que pertenece a un cliente de Servicios Financieros Digitales y se accede a través de un teléfono móvil. Byte Es una unidad de información digital, considerada una unidad de tamaño de memoria. Consta de 8 bits y 1024 bytes es igual a 1 kilobyte. Call Center Una oficina centralizada utilizada para recibir o transmitir un gran volumen de solicitudes telefónicas. Además de manejar las quejas y consultas de los clientes, también se utiliza como un canal de distribución alternativo (ADC) para mejorar la cercanía con el cliente y atraer nuevos clientes a través de varias campañas promocionales. Canal El punto de acceso del cliente a un proveedor de servicios financieros, es decir, con quién o con qué interactúa el cliente para acceder a un servicio financiero o producto. Canales de Distribución Canales que amplían el alcance de los servicios financieros más allá de la sucursal tradicional. Estos incluyen cajeros Alternativos automáticos (ATMs), banca por internet, banca móvil, billeteras electrónicas, algunos servicios de tarjeta/dispositivo POS y servicios de concesión de créditos. Científico de Datos Un científico de datos es un individuo, una organización o un equipo que realiza análisis estadísticos, minería de datos y procesos de recuperación en una gran cantidad de datos para identificar tendencias, cifras y otra información relevante. Comerciante Una persona o negocio que proporciona bienes o servicios a un cliente a cambio de un pago. Complejidad Combinar los cuatro atributos de Big Data (volumen, velocidad, variedad y veracidad) requiere procesos analíticos avanzados. Hay una variedad de procesos analíticos que han surgido para hacer frente a estos grandes conjuntos de datos. Los procesos analíticos apuntan a tipos específicos de datos como texto, audio, web y redes sociales. Otra metodología que ha recibido gran atención tiene que ver con el aprendizaje automático, donde un algoritmo es creado y alimentado a un computador junto con datos históricos. Esto permite que el algoritmo haga predicciones de relaciones entre variables aparentemente sin conexión. Conozca a su Cliente Reglas relacionadas con la ALA/CFT que obligan a los proveedores a llevar a cabo procedimientos para identificar a un (KYC) cliente, y que evalúan el valor de la información para detectar, supervisar y reportar actividades sospechosas. 150 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES Corresponsal Una persona o negocio contratado para procesar las transacciones de los usuarios. Las más importantes son depósitos y retiros (es decir, el cargue de valor en el sistema de dinero electrónico, y luego convertirlo de nuevo en un retiro). En muchos casos, los corresponsales registran nuevos clientes también. Los corresponsales suelen ganar comisiones por realizar estos servicios. También suelen ofrecer un servicio de atención al cliente de primera línea, como enseñar a los nuevos usuarios a realizar transacciones desde su teléfono. Por lo general, los corresponsales llevarán a cabo otros tipos de negocios, además de dinero electrónico. Los corresponsales en algunos casos estarán limitados por regulaciones, pero los comerciantes a pequeña escala, las IMFs, las cadenas de tiendas y las sucursales bancarias sirven como corresponsales en algunos mercados. Algunos participantes de la industria prefieren los términos 'comerciante' o 'minorista' para evitar ciertas connotaciones legales del término 'corresponsal', ya que se utiliza en otras industrias. (GSMA, 2014). Corresponsal Maestro Una persona o negocio que compra dinero electrónico de un proveedor de Servicios Financieros Digitales al por mayor y luego lo revende a corresponsales, quienes a su vez lo venden a los usuarios. (A diferencia de un super-corresponsal, los corresponsales maestros son responsables de gestionar los requisitos de liquidez en efectivo y de valor electrónico de un determinado grupo de corresponsales.) Cuenta Activa Una cuenta activa es aquella que ha sido usada para al menos una transacción en el periodo anterior, normalmente es reportada como “activa 30-días” o “activa 90-días”. No incluye transacciones no financieras, tales como el cambio del código PIN. Data/Datos Data/Datos es un término general que se utiliza para describir cualquier información, hecho o estadística que se ha recopilado para cualquier tipo de análisis o para fines de referencia. Hay muchos tipos diferentes de datos de una variedad de fuentes diferentes. La data/datos generalmente se procesa, agrega, manipula o consolida para producir información que proporcione insights. Datos Cualitativos Datos que se aproximan o caracterizan, pero que no miden los atributos, características o propiedades de una cosa o fenómeno. Los datos cualitativos describen, mientras que los datos cuantitativos definen. Datos Cuantitativos Datos que pueden ser cuantificados y verificados, y son susceptibles a manipulación estadística. Los datos cualitativos describen, mientras que los datos cuantitativos definen. Data Cube En informática, datos multidimensionales, a menudo con el tiempo como una tercera dimensión de columnas y filas. En las operaciones comerciales, se trata de un término genérico que se refiere a sistemas corporativos que permiten a los usuarios especificar y descargar informes de datos sin procesar. Muchos incluyen campos de “arrastrar y soltar” para diseñar una solicitud de informe o agregaciones de datos sencillas. Lago de Datos Un Lago de Datos es un repositorio masivo, fácilmente accesible, centralizado, de grandes volúmenes de datos estructurados y sin estructurar. Datos No Estructurados Normalmente se refiere a información que no reside en una BD tradicional de columna-fila. Los archivos de datos no estructurados suelen incluir texto y contenido multimedia. Los ejemplos incluyen: mensajes de correo electrónico, documentos de procesamiento de textos, videos, fotos, archivos de audio, presentaciones, páginas web y muchos otros tipos de documentos empresariales. Data Scraping (Raspado Es una técnica en la cual un programa de computadora extrae datos de salidas legibles por el ser humano, que provienen de Datos) de otra fuente digital tal como un sitio Web, informes o pantallas de computadora. Datos Tradicionales Los datos tradicionales se refieren a datos internos estructurados de uso común (como transaccionales) y a datos externos (como información de burós de crédito) que se utilizan en el proceso de toma de decisiones. Puede incluir datos que se generan a partir de la interacción con clientes tales como encuestas, formularios de registro, salario e información demográfica. Data Warehouse Una colección de información corporativa y datos derivados de sistemas operativos y fuentes externas de datos. Un data (Almacén de Datos) warehouse está diseñado para soportar decisiones empresariales, al permitir la consolidación, análisis y generación de informes de datos, a diferentes niveles agregados. Datos Alternativos Datos no financieros de MNO, redes sociales y sus bases de datos transaccionales. El acceso a otros datos alternativos, como el historial de pagos y las facturas de servicios públicos, también puede permitir la creación de scores crediticios para los clientes que de otro modo no podrían ser atendidos. Datos Estructurados Datos Estructurados se refiere a cualquier dato que resida en un campo fijo dentro de un registro o archivo. Esto incluye datos contenidos en bases de datos relacionales. ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 151 Datos Geoespaciales Información sobre un objeto físico que puede ser representado por valores numéricos en un sistema de coordenadas geográficas. Datos Periféricos Normalmente, las fuentes de datos periféricos más útiles son los datos de call centers, los datos de CRM (sistemas de tickets), la información de la base de conocimientos de preguntas frecuentes, los correos de aprobación, rastreadores de listas negras y listas blancas, rastreadores de Excel compartidos. Datos Semi- Los datos semi-estructurados son una forma de data estructurada que no se ajusta a la estructura formal de los modelos estructurados de datos asociados con BDs relacionales u otras formas de tablas de datos. Sin embargo, contienen etiquetas u otros marcadores para separar los elementos semánticos y hacer cumplir jerarquías de registros y campos dentro de la data. Desviación Estándar En la estadística, la desviación estándar es una medida que se utiliza para cuantificar la cantidad de variación o dispersión de un conjunto de valores de datos. Una desviación estándar baja indica que los puntos de datos tienden a estar cerca de la media (o promedio) del conjunto, mientras que una desviación estándar alta indica que los puntos de datos se extienden sobre un rango más amplio de valores. Dinero electrónico Es el valor almacenado en billeteras virtuales o tarjetas. Normalmente, el valor total de la moneda electrónica emitida es igualado por los fondos mantenidos en una o más cuentas bancarias. Normalmente se mantienen en un fideicomiso, de modo que incluso si el proveedor de billeteras electrónicas fallara, los usuarios podrían recuperar el valor total almacenado en sus cuentas. Distribución Estadística La distribución de una variable es una descripción del número relativo de veces, que cada posible resultado ocurrirá en una serie de pruebas. Fondo (Fondo de El saldo del dinero electrónico, o efectivo físico, o dinero en una cuenta bancaria a la que un corresponsal puede acceder Corresponsal) inmediatamente para satisfacer las demandas de los clientes de comprar (depositar) o vender (retirar) dinero electrónico. Estadísticas La estadística paramétrica es una rama de la estadística que asume que la data de la muestra viene de una población que Paramétricas sigue una distribución de la probabilidad basada en un sistema fijo de parámetros. La mayoría de los métodos estadísticos elementales bien conocidos son paramétricos. Exabyte (EB) El Exabyte (EB) es un múltiplo de la unidad byte para la información digital. En el Sistema Internacional de Unidades, el prefijo indica la multiplicación por la sexta potencia de 1000 (1018). Así, un EB es uno quintillion de bytes (escala corta). El símbolo para el Exabyte es EB. Gestión de Datos La gestión de datos es el desarrollo, ejecución y supervisión de planes, políticas, programas y prácticas que controlan, protegen, entregan y mejoran el valor de los datos y los activos de información. Hipótesis Una hipótesis es una predicción informada que puede ser probada. Historial de Crédito Un historial de crédito es un registro del pago de deudas de un prestatario; el pago responsable se interpreta como un historial de crédito favorable, mientras que la morosidad o incumplimientos son factores que crean un historial de crédito negativo. Un informe de crédito es un registro del historial de crédito del prestatario de un número de fuentes, que tradicionalmente incluyen bancos, compañías de tarjetas de crédito, agencias de cobranzas y gobiernos. Indicador Clave de Un KPI es un valor medible que demuestra la eficacia con la que una empresa está logrando los objetivos clave del Desempeño (KPI) negocio. Las organizaciones usan KPIs en múltiples niveles para evaluar su éxito en el logro de objetivos. Los KPIs de alto nivel pueden enfocarse en el desempeño general de la empresa, mientras que los KPIs de bajo nivel pueden enfocarse en procesos en departamentos como ventas, marketing o un call center. Indicador de Riesgo Un Indicador de Riesgo Clave es una medida usada para indicar el grado de riesgo de una actividad. Se diferencia de un Clave (KRI) Indicador de Desempeño Clave (KPI) en que este último se entiende como una medida de lo bien que se está haciendo algo, mientras que el primero indica lo perjudicial que puede ser algo si se produce y lo probable es que ocurra. Insight Insight es un término utilizado en Psicología proveniente del inglés que se puede traducir al español como "visión interna" o más genéricamente "percepción" o "entendimiento". Mediante un insight el sujeto "capta", "internaliza" o comprende, una "verdad" revelada. Puede ocurrir inesperadamente, luego de un trabajo profundo, simbólicamente, o mediante el empleo de diversas técnicas afines. Datos Abierta Los Datos Abiertos son los datos a los que cualquiera puede acceder, utilizar o compartir. Institución Financiera Un proveedor de servicios financieros, incluyendo cooperativas de ahorro y crédito, bancos, instituciones financieras no (IF) bancarias, instituciones microfinancieras y proveedores de servicios financieros móviles. Instituciones Una institución financiera especializada en servicios bancarios para grupos de bajos ingresos, pequeñas empresas Microfinancieras (IMF) o individuos. 152 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES Inteligencia Artificial (IA) IA es un área informática que enfatiza la creación de máquinas inteligentes que funcionan y reaccionan como seres humanos. Investigación Primaria y La investigación primaria es la información original recogida a través de su propio enfoque, a menudo un estudio Secundaria o encuesta. La investigación secundaria utiliza los resultados existentes de los estudios realizados previamente y la recopilación de datos. Limpieza de Datos La limpieza de datos es el proceso de alterar los datos en un recurso de almacenamiento dado, para asegurarse que son precisos y correctos. Máquinas de Vector de Una máquina vectorial de soporte, o SVM, es un algoritmo de aprendizaje automático que analiza los datos para su Soporte (SVM) clasificación y análisis de regresión. SVM es un método de aprendizaje supervisado que examina los datos y los clasifica en una de dos categorías. Un SVM genera un mapa de datos ordenados con los márgenes entre los dos tan separados como sea posible. SVMs se utilizan en la categorización del texto, la clasificación de la imagen, el reconocimiento de la escritura, y en las ciencias. Una máquina de vectores de soporte también se conoce como una red de vectores de soporte (SVN). Metadatos Los metadatos describen otros datos. Proporciona información sobre el contenido de un determinado elemento. Por ejemplo, una imagen puede incluir metadatos que describe el tamaño de la imagen, la profundidad de color, la resolución de la imagen, cuando se creó la imagen y otros datos. Método Científico Solución de problemas mediante un enfoque paso a paso que consiste en (1) identificar y definir un problema, (2) acumular datos relevantes, (3) formular una hipótesis (4) realizar experimentos para probar la hipótesis, (5) interpretar los resultados objetivamente, y (6) repetir los pasos hasta encontrar una solución aceptable. Metodología no Un método comúnmente usado en estadísticas donde se usan pequeños tamaños de muestra para analizar datos Paramétrica nominales. Un método no paramétrico se utiliza cuando el investigador no sabe nada sobre los parámetros de la muestra elegida de la población. Métodos Monte Carlo Modelos que utilizan aproximaciones aleatorias para modelar sistemas complejos estableciendo un peso probabilístico a varios puntos de decisión en el modelo. Los resultados muestran un patrón de distribución estadística que puede usarse para predecir la probabilidad de ciertos resultados dados los inputs en el sistema que se está modelando. Estos modelos se usan típicamente para problemas de optimización o análisis de probabilidad. Minería de datos La minería de datos es el proceso computacional para descubrir patrones en grandes conjuntos de datos. Es un sub-campo interdisciplinario de la informática. El objetivo general del proceso de minería de datos es extraer información de un conjunto de datos y transformarla en una estructura comprensible para uso posterior. Modelado Predictivo El modelado predictivo es un proceso que utiliza la minería de datos y la probabilidad para pronosticar resultados. Cada modelo se compone de una serie de predictores, que son variables que probablemente influyan en los resultados futuros. Una vez que se han recopilado los datos para los predictores relevantes, se formula un modelo estadístico. Modelo de Calificación La psicometría se refiere a la medición de conocimientos, habilidades, actitudes y rasgos de personalidad. En los modelos Psicométrica de calificación psicométrica, los principios psicométricos se aplican al scoring crediticio mediante el uso de técnicas estadísticas avanzadas para pronosticar la probabilidad de incumplimiento de un solicitante. Operador de Red Móvil Una empresa que tiene una licencia expedida por el gobierno para proporcionar servicios de telecomunicaciones a través (MNO) de dispositivos móviles. Persona a Persona (P2P) Transferencia de fondos de persona a persona. Panel de Control Un Panel de Control de BI, es una herramienta de visualización de datos que muestra el estado actual de métricas y KPIs para una empresa. Los paneles de control consolidan y organizan números, métricas y, a veces, scorecards en una sola pantalla. Pequeñas y Medianas Las pequeñas y medianas empresas, o PYMES, son empresas no filiales e independientes que emplean a menos de un Empresas (PyMEs) determinado número de empleados. Este número varía según los países. Probabilidad La probabilidad es la probabilidad asumida de que el evento ocurrirá. La probabilidad se cuantifica como un número entre cero y uno (donde '0' indica imposibilidad y '1' indica certeza). Cuanto mayor sea la probabilidad de un evento, más seguro será que ocurrirá el evento. Procesamiento de Datos El procesamiento de datos es, en general, la recopilación y manipulación de elementos de datos para producir información significativa. En este sentido, puede considerarse un subconjunto del procesamiento de información, o el cambio (procesamiento) de información de cualquier manera detectable por un observador. Procesamiento de El procesamiento de imágenes es un término de significado algo amplio, que se refiere al uso de herramientas analíticas Imágenes para procesar o mejorar imágenes. Muchas definiciones de este término especifican operaciones matemáticas o algoritmos como herramientas para el procesamiento de una imagen. ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 153 Procesamiento del El campo de estudio que se centra en las interacciones entre el lenguaje humano y las computadoras se llama Lenguaje Natural (PLN) Procesamiento del Lenguaje Natural [Natural Language Processing], o PLN en forma abreviada. Se sitúa en la intersección de la informática, la IA y la lingüística computacional. El PLN es un campo que cubre la comprensión y manipulación de un lenguaje humano. Interfaz de Programación Un método para especificar un componente de software en términos de sus operaciones destacando un conjunto de de Aplicaciones funcionalidades que son independientes de su respectiva implementación. Las API se utilizan para la integración en tiempo (API) real al Sistema de Core Bancario o Sistema de Información Gerencial (SIG), que especifican cómo dos sistemas diferentes pueden comunicarse entre sí a través del intercambio de ‘mensajes’. Existen diferentes tipos de APIs, incluidas las basadas en la Web, la comunicación Protocolo de Control de Transmisión (TCP) e integración a una base de datos, o APIs escritas para sistemas específicos. Promedio Un promedio es la suma de una lista de números dividida por el número de números en la lista. En matemáticas y estadística, esto sería llamado la media aritmética. Promedio de Ingresos El ARPU es una medida utilizada principalmente por operadores de redes móviles (MNOs), definida como el ingreso total por Usuario (ARPU) dividido por el número de suscriptores. Protección de Datos La protección de datos, también llamada privacidad de la información, es el aspecto de TI que se ocupa de la capacidad que una organización o un individuo tiene para determinar qué datos en un sistema informático pueden ser compartidos con terceros. Protocolo de El Protocolo de transferencia de archivos (FTP) es un protocolo cliente-servidor utilizado para transferir archivos Transferencia de o intercambiar archivos con un equipo host. FTP es el estándar de Internet para mover o transferir archivos de un Archivos (FTP) computador a otro utilizando redes TCP o IP. Pruebas A|B La prueba A|B es un método para revisar dos versiones diferentes de un producto o servicio con el fin de evaluar la forma en la que un pequeño cambio en los atributos del producto puede impactar en el comportamiento del cliente. Este tipo de experimento permite a los proveedores de Servicios Financieros Digitales elegir múltiples variaciones de un producto o servicio, probar estadísticamente la adopción resultante en los clientes y comparar los resultados entre grupos objetivo. Prueba Aleatoria Una prueba aleatoria controlada es un experimento científico en el que las personas que participan en la prueba se asignan Controlada (RCT) aleatoriamente a diferentes contextos de intervención y luego se comparan entre sí. La aleatorización minimiza el sesgo de selección durante el diseño del experimento científico. Los grupos de comparación permiten a los investigadores determinar los efectos de la intervención en comparación con el grupo sin intervención (control), mientras que otras variables se mantienen constantes. Punto de Venta (POS) Dispositivo electrónico utilizado para procesar pagos con tarjeta en el punto en el que un cliente hace un pago al comerciante a cambio de bienes y servicios. El dispositivo POS es un dispositivo de hardware (fijo o móvil) que ejecuta software para facilitar la transacción. Dispositivos o PC originales, pero cada vez más incluyen teléfonos móviles, teléfonos inteligentes y tabletas. Reconocimiento de En TI, el reconocimiento de patrones es una rama del aprendizaje automático que enfatiza el reconocimiento de patrones Patrones de datos o regularidades de datos en un escenario determinado. Es una subdivisión del aprendizaje automático y no debe confundirse con un estudio de “actual machine learning”. El reconocimiento de patrones puede ser 'supervisado', donde se pueden encontrar patrones previamente conocidos en un dato determinado, o 'sin supervisión', donde se descubren patrones enteramente nuevos. Registros Detallados de Este es el registro del MNO de una llamada de voz o un SMS, con detalles como origen, destino, duración, hora del día o Llamadas (CDR) cantidad cobrada por cada llamada o SMS. Regresión Lineal Técnica matemática para encontrar la recta que mejor se ajusta a los valores de una función lineal, trazada en un gráfico de dispersión como puntos de datos. Scoring crediticio Un análisis estadístico realizado por prestamistas e instituciones financieras para acceder a la capacidad crediticia de una persona. Los prestamistas utilizan el score crediticio, entre otras cosas, para llegar a una decisión sobre si conceder el crédito. Los scores crediticios de una persona es un número entre 300 y 850, siendo 850 la calificación crediticia más alta posible. Segmentación de El proceso de definición y subdivisión de un gran mercado homogéneo en segmentos claramente identificables con Mercado necesidades, deseos o características de demanda similares. Su objetivo es diseñar una mezcla comercial que coincida exactamente con las expectativas de los clientes en el segmento objetivo. Segmentación La segmentación psicográfica implica dividir el mercado en segmentos basados en diferentes rasgos de personalidad, psicográfica valores, actitudes, intereses y estilos de vida de los consumidores. 154 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES Seguridad de Datos La seguridad de datos se refiere a medidas de protección de la privacidad digital que se aplican para impedir el acceso no autorizado a los computadores, bases de datos, sitios web y cualquier otro lugar donde se almacenan datos. La seguridad de datos también protege de la corrupción de datos. La seguridad de datos es un aspecto esencial de la TI para las organizaciones de todos los tamaños y tipos. Servicio de Dinero Un servicio financiero digital que se proporciona mediante la expedición de cuentas virtuales contra una sola cuenta Electrónico, bancaria agrupada como billeteras electrónicas, a las que se accede mediante un teléfono móvil. La mayoría de los Servicios Financieros proveedores de dinero electrónico son MNO o Proveedor de Servicios de Pago (PSP). Móviles (SFM) Servicio de Mensajes Un canal de comunicación que 'almacena y reenvía' que implica el uso de la red de telecomunicaciones y el protocolo SMPP Cortos (SMS) para enviar una cantidad limitada de texto de un teléfono a otro o de uno a muchos teléfonos. Servicio Suplementario Protocolo utilizado por los dispositivos móviles GSM para comunicarse con los computadores/red del proveedor de Datos No Estructurados servicios. Este canal está soportado por todos los teléfonos GSM, permitiendo una sesión interactiva consistente en un (USSD) intercambio bidireccional de mensajes basados en un menú de aplicación definido. Servicios Financieros El uso de medios digitales para ofrecer servicios financieros. Los Servicios Financieros Digitales abarcan todas las ofertas de Digitales (SFD ) telefonía móvil, de tarjeta, de POS y de comercio electrónico, incluidos los servicios suministrados a los clientes a través de redes de corresponsales. Asociación del Sistema La Asociación GSM (comúnmente conocida como ‘la GSMA’) es una organización gremial que representa los intereses de Global para las los operadores móviles en todo el mundo. Aproximadamente 800 operadores móviles son miembros de la GSMA y otros Comunicaciones Móviles 300 en el ecosistema móvil más amplio son miembros asociados. (GSMA) Super-Corresponsal Un negocio, a veces un banco, que compra dinero electrónico de un proveedor de Servicios Financieros Digitales al por mayor y luego lo revende a los corresponsales, que a su vez lo venden a los usuarios. Tipo de teléfono móvil - Un teléfono móvil que tiene la capacidad de procesamiento para realizar muchas de las funciones de un computador, Smartphone que normalmente tiene una pantalla relativamente grande y un sistema operativo capaz de ejecutar un complejo conjunto de aplicaciones, con acceso a internet. Además del servicio de voz digital, los teléfonos inteligentes modernos ofrecen mensajes de texto, correo electrónico, navegación por Internet, cámara fotográfica y de vídeo y , un reproductor de MP3 y reproducción de vídeo con capacidades de transferencia de datos integradas, capacidades GPS. Tipo de Teléfono Móvil - Un teléfono móvil de gama baja que puede hacer y recibir llamadas, enviar mensajes de texto y acceder al canal USSD, Teléfono de Gama Baja pero tiene funcionalidades adicionales muy limitadas. Tipo de teléfono móvil - Un teléfono de gama media es un tipo de teléfono móvil que tiene más funciones que un teléfono de gama baja, Teléfono de Gama Media pero no es equivalente a un teléfono inteligente. Los teléfonos de gama media pueden ofrecer algunas de las funcionalidades avanzadas que se encuentran en un teléfono inteligente, como un reproductor de media portátil, cámara digital, organizador personal y acceso a internet, pero normalmente no admiten aplicaciones complementarias. Variedad La era digital ha diversificado los tipos de datos disponibles. Los datos tradicionales estructurados encajan en las BD existentes que están destinadas a información bien definida, que sigue un conjunto de reglas. Por ejemplo, una transacción bancaria tiene una marca de tiempo, cantidades y ubicación. Sin embargo, hoy en día, el 90 por ciento de los datos que se generan son no estructurados, es decir, viene en forma de tweets, imágenes, documentos, archivos de audio, historiales de compra de clientes y videos. Velocidad Una gran parte de los datos se produce y se sirve en tiempo real. Para 2018, se estima que se van a cargar y descargar en Internet 50.000 gigabytes de datos cada segundo. Cada 60 segundos, se envían 204 millones de correos electrónicos. Como consecuencia, estos datos tienen que ser almacenados, procesados y analizados a velocidades muy altas, a veces a un ritmo de decenas de miles de bytes cada segundo. Veracidad La veracidad se refiere a la fiabilidad de los datos. Los gerentes de negocios necesitan saber que los datos que usan en el proceso de toma de decisiones son representativos de las necesidades y deseos de sus segmentos de clientes. Así, las prácticas de gestión de datos en las empresas deben garantizar que el proceso de limpieza de datos es continua y rigurosa. Esto evitará la inclusión de datos engañosos e incorrectos en el análisis. Volumen La gran cantidad de datos que se está produciendo es alucinante. Se estima que aproximadamente 2.5 quintillones de bytes de datos se producen cada día. Para tener una idea de la cantidad, este volumen de datos llenaría aproximadamente 10 millones de discos Blu-ray. La madurez de esta data se ha vuelto cada vez menor, es decir, que la cantidad de datos que tiene menos de un minuto de edad ha ido aumentando constantemente. De hecho, el 90 por ciento de esta data se han producido en los últimos dos años. Se prevé que la cantidad de datos en el mundo aumentará 44 veces entre 2009 y 2020. ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 155 Biografias de los Autores DEAN CAIRE Especialista en Scoring Crediticio, IFC Dean trabajó durante los últimos 15 años como consultor de scoring crediticio, 12 con la empresa DAI Europe y posteriormente como consultor independiente. Durante este tiempo, ha ayudado a clientes de 77 instituciones financieras en 45 países a desarrollar más de 100 modelos de scoring crediticio personalizados para los siguientes segmentos: crédito de consumo (incluyendo Servicios Financieros Digitales), arrendamientos estándar de activos, créditos para microempresas, créditos para pequeñas empresas (incluyendo Servicios Financieros Digitales para comerciantes), créditos agrícolas y leasing de equipos (incluyendo Servicios Financieros Digitales), microcréditos a grupos solidarios, y grandes créditos a compañías no cotizadas en bolsa. Dean se esfuerza por transferir el desarrollo de modelos y habilidades de gestión a las contrapartes de IF para que se puedan apropiar en forma plena de los modelos y administrarlos en el futuro. LEONARDO CAMICIOTTI Director Ejecutivo, Consorcio TOP-IX Reportando a la Junta Directiva, Leonardo es responsable de las actividades estratégicas, administrativas y operativas del Consorcio TOP-IX. El maneja el Programa de Desarrollo TOP-IX, que fomenta la creación de nuevas empresas mediante el apoyo infraestructural (es decir, ancho de banda de Internet, cloud computing y elaboración de prototipos de software) a startups y promueve proyectos de innovación en diferentes sectores, como big data y computación de alto rendimiento; fabricación abierta y tecnologías cívicas. Anteriormente, fue Científico Investigador, Oficial de Estrategia y Desarrollo de Negocios, y Dueño de Philips Corporate Research. Se graduó como Ingeniero Electrónico de la Universidad de Florencia y tiene un MBA de la Universidad de Turín. 156 ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES SOREN HEITMANN Oficial de Operaciones, IFC Soren dirige el programa de investigación aplicada y Monitoreo, Evaluación y Aprendizaje (MEL) de la alianza IFC-Mastercard Foundation. Trabaja en el vínculo de la investigación y la tecnología basadas en datos para ayudar a impulsar el aprendizaje y la innovación para los proyectos de IFC en África Subsahariana. Anteriormente, Soren lideró la medición de resultados para la VPU de riesgo de IFC y el equipo de Administración de Cartera de Evaluación y Monitoreo Regional, para Europa y Asia Central. Tiene experiencia en gestión de bases de datos, ingeniería de software y tecnología web, que ahora incorpora en su trabajo de soporte de operaciones de datos a clientes de IFC. Soren tiene un título en Antropología Cultural de la Universidad de Boston y una Maestría en Economía del Desarrollo de Johns Hopkins SAIS. SUSIE LONIE Especialista en Servicios Financieros Digitales, IFC Susie pasó tres años en Kenia creando y haciendo operar el servicio de pagos móviles de M-PESA, después de lo cual facilitó su lanzamiento en varios otros mercados incluyendo India, Suráfrica y Tanzania. En 2010, Susie fue co-ganadora del Economist Innovation Award for Social and Economic Innovation por su trabajo en M-PESA. Se convirtió en consultor independiente de Servicios Financieros Digitales en 2011 y trabaja con bancos, MNOs, y otros clientes en todos los aspectos del suministro de servicios financieros a los desbancarizados en mercados emergentes, incluyendo dinero electrónico, banca de corresponsales, transferencias internacionales de dinero, e interoperabilidad. Susie trabaja en estrategia Servicios Financieros Digitales, evaluación financiera, diseño de productos y requerimientos funcionales, operaciones, gestión de corresponsales, evaluaciones de riesgo, evaluaciones de investigación, y ventas y marketing. Sus títulos son en Ingeniería Química de Edinburgo y Manchester, Reino Unido. ANÁLISIS DE DATOS Y SERVICIOS FINANCIEROS DIGITALES 157 CHRISTIAN RACCA Ingeniero de Diseño, Consorcio TOP-IX Christian maneja el programa TOP-IX BIG DIVE que apunta a ofrecer cursos de formación para científicos de datos, iniciativas educativas orientadas a datos para empresas, organizaciones y proyectos de consultoría en el campo de la explotación de datos (Big Data). Después de graduarse en ingeniería de telecomunicaciones en el Politécnico di Torino, Christian se unió al Consorcio TOP-IX, trabajando en streaming de datos y cloud computing, y más tarde en nuevos emprendimientos web. Ha asesorado varios proyectos sobre el modelo de negocios, desarrollo de productos y arquitectura de infraestructura y ha cultivado relaciones con inversionistas, incubadoras, aceleradores y el ecosistema de Innovación en Italia y Europa. MINAKSHI RAMJI Oficial de Operaciones Asociado, IFC Minakshi dirige proyectos sobre Servicios Financieros Digitales e inclusión financiera dentro del Grupo de Instituciones Financieras de IFC en África Subsahariana. Antes de esto, fue consultora en MicroSave, una firma de consultoría de inclusión financiera con sede en la India, donde fue Analista Senior en su práctica de Servicios Financieros Digitales. También trabajó en el Centro de Microfinanzas del IFMR Trust en India, con foco en políticas relacionadas con problemáticas de acceso financiero en la India. Tiene una maestría en Desarrollo Económico de la London School of Economics y un BA en Matemáticas de Bryn Mawr College en los Estados Unidos. QIUYAN XU Científico de Datos Principal, Cignifi Qiuyan Xu es el Científico de Datos Principal de Cignifi Inc., dirigiendo el equipo de Big Data Analytics. Cignifi es una empresa de tecnología financiera de rápido crecimiento en Boston, Estados Unidos, que ha desarrollado la primera plataforma analítica comprobada para ofrecer puntuaciones de crédito y marketing para los consumidores que usan datos de comportamiento del teléfono móvil. La Doctora Xu tiene experiencia en análisis de Big Data, cloud computing, modelado estadístico, aprendizaje automático, optimización de operaciones y gestión de riesgo. Fue Directora de Analítica Avanzada en Liberty Mutual y Gerente de Gestión de Riesgo Empresarial de Travelers Insurance. La Doctora Xu tiene un doctorado en estadística de la Universidad de California, Davis y una certificación como Gerente de Riesgo Financieros de The Global Association of Risk Professionals. 158 DATA ANALYTICS AND DIGITAL FINANCIAL SERVICES The Partnership for Financial Inclusion The Partnership for Financial Inclusion es una iniciativa conjunta de $ 37.4 millones de la IFC y Mastercard Foundation para expandir las microfinanzas y avanzar los servicios financieros móviles en el África subsahariana. La Asociación también recibe el apoyo de la Fundación Bill & Melinda Gates y del Banco de Desarrollo de Austria (OeEB, Oesterreichische Entwicklungsbank.AG). Trabaja con instituciones microfinancieras, bancos, operadores de redes móviles y proveedores de servicios de pago en todo el continente para probar modelos de negocios innovadores para la inclusión financiera. El programa tiene un componente fuerte de intercambio de información. Este manual es el segundo en una serie de manuales acerca de cómo hacer una implementación exitosa de servicios financieros digitales, es una de muchas publicaciones de la Alianza. Para mayor información y acceso a todos los informes, por favor visite www.ifc.org/financialinclusionafrica Acerca de IFC La IFC, miembro del Grupo del Banco Mundial, es la institución global de desarrollo más grande y centrada exclusivamente en el sector privado. Trabajando con más de 2.000 negocios mundialmente, utilizamos nuestro capital, conocimiento experto, e influencia, para generar oportunidades donde más se necesitan. En el año fiscal 2015, nuestras inversiones a largo plazo en países en desarrollo subieron a casi $18 billones, ayudando al sector privado a jugar un papel esencial en el esfuerzo global de acabar con la pobreza extrema e impulsar la prosperidad compartida. Para mayor información, visite www.ifc.org Acerca de Mastercard Foundation Mastercard Foundation trabaja con organizaciones visionarias para proveer mayor acceso a la educación, capacitación técnica y servicios financieros para las personas que vivien en pobreza, primordialmente en África. Como una de las fundaciones independientes más grandes, su trabajo es guiado por su misión de avanzar el conocimiento y promover la inclusión financiera para aliviar la pobreza. Con sede en Toronto, Canadá, su independencia fue establecida por MasterCard cuando se creó la Fundación en 2006. Para mayor información y para registrarse para el boletín de la Fundación, por favor visite www.mastercardfdn.org. Este manual es uno de los tres manuales sobre Servicios Financieros Digitales publicados por The Partnership for Financial Inclusion, una iniciativa conjunta de la IFC y Mastercard Foundation para fomentar la expansión de la inclusión financiera. Los otros dos manuales están disponibles a solicitud desde IFC o para descargar desde el sitio web de la Alianza: www.ifc.org/financialinclusionafrica: El Manual de Canales de Distribución Alternativos y Tecnología M A ofrece una guía práctica, paso a paso, para desarrollar canales de N U A distribución alternativos que vinculan opciones de tecnología con el CANALES DE DISTRIBUCIÓN ALTERNATIVOS Y L proceso general del negocio. TECNOLOGÍA El Manual de Servicios Financieros Digitales y Gestión de Riesgo M A está diseñado para cualquier tipo de institución financiera que N U ofrece, o planea ofrecer, servicios financieros digitales, y presenta A SERVICIOS FINANCIEROS DIGITALES Y GESTIÓN L una perspectiva general de los riesgos relacionados y la mejor DE RIESGO manera de aplicar un marco de gestión de riesgo para hacer frente a estos. CONTACT DETAILS Anna Koblanck IFC, África Subsahariana akoblanck@ifc.org www.ifc.org/financialinclusionafrica 2017