Idea en resumen

El problema

Aunque los datos ofrecen enormes oportunidades, las estrategias de la mayoría de las empresas para hacerlas realidad no son eficaces.

Por qué sucede

Con demasiada frecuencia, los esfuerzos de las empresas en materia de datos no sientan las bases para usos futuros de los datos. Los equipos individuales crean una canalización de datos personalizada para cada aplicación que no se puede reutilizar fácilmente.

La solución

Cree productos de datos estándar que se puedan adaptar a las necesidades de varios tipos de usuarios y muchas aplicaciones. Los productos pueden ser gestionados por equipos dedicados dentro de las unidades de negocio, con el apoyo de una función central que coordina y estandariza el diseño.

Aviso: Traducido con el uso de inteligencia artificial; puede contener errores. Participe en esta encuesta para hacernos llegar sus comentarios y obtenga información en las preguntas frecuentes.
Read in English

Aunque todas las empresas reconocen la poder de los datos, la mayoría lucha por liberar todo su potencial. El problema es que las inversiones en datos deben ofrecer valor a corto plazo y, al mismo tiempo, sentar las bases para un rápido desarrollo de los usos futuros, mientras que las tecnologías de datos evolucionan de formas impredecibles, surgen nuevos tipos de datos y el volumen de datos sigue aumentando.

Las experiencias de dos empresas globales ilustran lo ineficaces que son las estrategias de datos predominantes en la actualidad para gestionar esos desafíos. El primero, un gran banco de Asia y el Pacífico, adoptó el enfoque del «Big Bang», suponiendo que pudiera adaptarse a las necesidades de cada equipo de desarrollo de análisis y usuario final de datos de un solo golpe. Lanzó un programa masivo para crear canales para extraer todos los datos de sus sistemas, limpiarlos y agregarlos en un lago de datos en la nube, sin tomar mucho tiempo por adelantado para alinear sus esfuerzos con los casos de uso empresariales. Tras dedicar casi tres años a crear una nueva plataforma, el banco descubrió que solo algunos usuarios, como los que buscan datos históricos sin procesar para análisis ad hoc, podían utilizarlos fácilmente. Además, se habían pasado por alto las necesidades arquitectónicas críticas de muchas aplicaciones potenciales, como las fuentes de datos en tiempo real para ofertas personalizadas de los clientes. Como resultado, el programa no generó mucho valor para la empresa.

La segunda empresa, un gran banco norteamericano, tenía equipos individuales que aprovechaban las fuentes de datos y los sistemas existentes por su cuenta y, a continuación, reunían cualquier tecnología adicional que necesitaran sus casos de uso empresarial. Los equipos crearon algo de valor al resolver desafíos como mejorar la segmentación de clientes para los canales digitales y permitir una notificación de riesgos eficiente. Pero el resultado general fue un lío gruñido de canalizaciones de datos personalizadas que no se podían reutilizar fácilmente. Todos los equipos tenían que empezar de cero, lo que hacía que los esfuerzos de transformación digital fueran muy costosos y lentos.

Entonces, si ni una estrategia de datos monolítica ni una estrategia de datos de base funciona, ¿cuál es el enfoque correcto?

Descubrimos que las empresas tienen más éxito cuando tratan los datos como un producto. Cuando una empresa desarrolla un producto comercial, normalmente intenta crear una oferta que pueda abordar las necesidades del mayor número posible de usuarios para maximizar las ventas. A menudo, eso significa desarrollar un producto base que se pueda personalizar para diferentes usuarios. Los fabricantes de automóviles hacen esto permitiendo a los clientes añadir una variedad de opciones especiales (tapicería de cuero, vidrios tintados, dispositivos antirrobo, etc.) a los modelos estándar. Del mismo modo, las aplicaciones digitales suelen permitir a los usuarios personalizar sus paneles, incluida la personalización del diseño, las combinaciones de colores y el contenido que se muestra, u ofrecer diferentes planes y estructuras de precios para las diferentes necesidades de los usuarios.

Las empresas que tratan los datos como un producto pueden reducir el tiempo que lleva implementarlos en nuevos casos de uso hasta en un 90%.

Con el tiempo, las empresas mejoran sus productos, añaden nuevas funciones (modificaciones del motor que aumentan el ahorro de combustible en un coche o nuevas funciones en una aplicación) e introducen nuevas ofertas en respuesta a los comentarios de los usuarios, las evaluaciones de rendimiento y los cambios en el mercado. Mientras tanto, las empresas buscan aumentar la eficiencia de la producción. Siempre que sea posible, reutilizan los procesos, la maquinaria y los componentes existentes. (Los fabricantes de automóviles utilizan un chasis común en coches muy diferentes, por ejemplo, y los desarrolladores de aplicaciones reutilizan bloques de código). El tratamiento de los datos prácticamente de la misma manera ayuda a las empresas a equilibrar la entrega de valor con ellos hoy y allanar el camino para obtener más valor de ellos en el futuro.

En nuestro trabajo hemos visto que las empresas que tratan los datos como un producto pueden reducir el tiempo que lleva implementarlos en nuevos casos de uso hasta en un 90%, reducir sus costes totales de propiedad (tecnología, desarrollo y mantenimiento) hasta un 30% y reducir el riesgo y la carga de la gobernanza de datos. En las páginas siguientes describiremos qué constituye un producto de datos y resumiremos las prácticas recomendadas para crear uno.

¿Qué es un producto de datos?

Un producto de datos ofrece un conjunto de datos de alta calidad y listos para usar al que las personas de una organización pueden acceder fácilmente y aplicar a los diferentes desafíos empresariales. Podría, por ejemplo, proporcionar vistas de 360 grados de los clientes, incluidos todos los detalles que las unidades de negocio y los sistemas de una empresa recopilan sobre ellos: comportamiento de compra en línea y en tienda, información demográfica, métodos de pago, sus interacciones con el servicio de atención al cliente y más. O podría proporcionar vistas de 360 grados de los empleados o un canal, como las sucursales de un banco. Otro producto podría permitir los «gemelos digitales», que utilizan datos para replicar virtualmente el funcionamiento de activos o procesos del mundo real, como piezas de maquinaria críticas o toda una línea de producción de la fábrica.

Como tienen muchas aplicaciones, los productos de datos pueden generar retornos impresionantes. En un gran banco nacional, un producto de datos de clientes ha impulsado casi 60 casos de uso, que van desde la puntuación del riesgo crediticio en tiempo real hasta chatbots que responden a las preguntas de los clientes, en múltiples canales. Esas aplicaciones ya proporcionan 60 millones de dólares en ingresos incrementales y eliminan 40 millones de dólares en pérdidas al año. Y a medida que el producto se aplique a nuevos casos de uso, su impacto seguirá creciendo.

Los productos de datos se encuentran en la parte superior de los almacenes de datos operativos existentes, como almacenes o lagos. Los equipos que los utilizan no tienen que perder tiempo buscando datos, procesándolos en el formato correcto y creando conjuntos de datos y canalizaciones de datos a medida (que, en última instancia, crean un lío arquitectónico y desafíos de gobernanza).

Cada producto de datos da soporte a «consumidores» de datos con diferentes necesidades, de la misma manera que un producto de software apoya a los usuarios que trabajan en ordenadores con diferentes sistemas operativos. Estos consumidores son sistemas, no personas, y nuestro trabajo sugiere que las organizaciones suelen tener cinco tipos. Los llamamos «arquetipos de consumo» porque describen para qué se utilizan los datos. Incluyen:

1. Aplicaciones digitales.

Requieren datos específicos que se limpien, almacenen en el formato necesario (quizás como mensajes individuales en un flujo de eventos o una tabla de registros en un data mart (un área de almacenamiento de datos orientada a un tema, función empresarial o equipo) y que se entreguen con una frecuencia determinada. Por ejemplo, una aplicación digital que rastrea la ubicación de un vehículo necesitará acceder en tiempo real a las secuencias de eventos de datos de GPS o sensores. Una aplicación de marketing diseñada para encontrar tendencias en el comportamiento de navegación de los clientes necesitará acceder a grandes volúmenes de datos de registro web a petición (a menudo denominados datos de «lotes») de un data mart.

2. Sistemas de análisis avanzados.

Estos también necesitan que los datos se limpien y se entreguen con una frecuencia determinada, pero deben diseñarse para permitir sistemas de aprendizaje automático e IA, como motores de simulación y optimización, para procesarlo.

3. Sistemas de informes.

Estos necesitan datos altamente gobernados (datos con definiciones claras que se gestionan estrechamente para garantizar la calidad, la seguridad y los cambios) que se agreguen a un nivel básico y se entreguen de forma auditada para su uso en paneles o actividades regulatorias y de cumplimiento. Por lo general, los datos se entregan en lotes, pero las empresas están adoptando cada vez más modelos de autoservicio y actualizaciones intradía que incorporan feeds en tiempo real.

4. Sandboxes de descubrimiento.

Permiten el análisis exploratorio ad hoc de una combinación de datos brutos y agregados. Los científicos de datos y los ingenieros de datos los utilizan con frecuencia para ahondar en los datos y descubrir nuevos casos de uso potenciales.

5. Sistemas externos para compartir datos.

Deben cumplir políticas y acuerdos estrictos sobre dónde se encuentran los datos y cómo se gestionan y protegen. Los bancos utilizan estos sistemas para compartir información sobre el fraude entre sí, por ejemplo, y los minoristas para compartir datos con los proveedores con la esperanza de mejorar las cadenas de suministro.

Cada arquetipo de consumo requiere diferentes tecnologías para el almacenamiento, el procesamiento y la entrega de datos y exige que esas tecnologías se ensamblen según un patrón específico. Este patrón es esencialmente un plan arquitectónico de cómo deben encajar las tecnologías necesarias. Por ejemplo, un patrón para un entorno aislado probablemente incluiría tecnologías para configurar un entorno de autoservicio multiusuario al que puedan acceder los ingenieros de datos de toda la empresa. El patrón para un sistema de análisis avanzado que utilice fuentes de datos en tiempo real podría incluir tecnologías para procesar grandes volúmenes de datos no estructurados.

Como un ladrillo de Lego, un producto de datos conectado para admitir uno o más de estos arquetipos de consumo se puede convertir rápidamente en cualquier cantidad de aplicaciones empresariales.

Harry Campbell

Pensemos en una empresa minera que creó un producto de datos que proporciona alimentaciones de datos GPS en directo de ubicaciones de camiones de transporte de minerales. Se diseñó para admitir todos los arquetipos excepto el intercambio externo de datos en su primer caso de uso, lo que mejora el rendimiento del procesamiento de minerales. La empresa pronto descubrió que el producto tenía usos mucho más allá. Cuando estuvo disponible de manera más amplia en la organización, varios empleados emprendedores lo aprovecharon inmediatamente para eliminar los cuellos de botella en el sistema de transporte de la mina. En solo tres días construyeron un prototipo de herramienta de apoyo a la decisión de rutas de camiones que redujo el tiempo de espera y las emisiones de carbono. Si hubieran tenido que diseñar los datos desde cero, habría tardado casi tres meses.

A medida que se corría la voz, los empleados interesados en otros temas relacionados con los camiones, como la seguridad, el mantenimiento y los horarios de los conductores, aprovecharon los datos para encontrar respuestas a preguntas espinosas y crear soluciones que generaran ingresos que antes hubieran sido imposibles.

Gestión y desarrollo de productos de datos

Ya sea que vendan sedanes, software o zapatillas, la mayoría de las empresas tendrán gestores de producto internos que se dedican a investigar las necesidades del mercado, desarrollar hojas de ruta de las capacidades de los productos y diseñar y marketing los productos de forma rentable.

Del mismo modo, cada producto de datos debe tener un jefe de producto designado que se encargue de formar un equipo de expertos para crearlo, apoyarlo y mejorarlo con el tiempo. Tanto el director como los expertos deben pertenecer a un grupo de utilidades de datos que pertenezca a una unidad de negocio. Por lo general, estos grupos incluyen ingenieros de datos, arquitectos de datos, modeladores de datos, ingenieros de plataformas de datos e ingenieros de fiabilidad de sitios. Su integración en las unidades de negocio da a los equipos de productos de datos un acceso rápido tanto a los expertos en la materia empresarial como a la asistencia operativa, de procesos, legal y de riesgos que necesitan para desarrollar productos de datos útiles y conformes. También conecta a los equipos directamente con los comentarios de los usuarios, lo que les ayuda a seguir mejorando sus productos e identificar nuevos usos. La primera versión del producto de datos de clientes en el banco nacional, por ejemplo, se centró en los perfiles demográficos de los clientes y la información sobre las transacciones. Las versiones posteriores incluían datos sobre las interacciones con los clientes y los clientes potenciales, lo que atraía a un número considerablemente mayor de usuarios de datos y apoyaba a los El ahorro de costes y los ingresos incrementales logrados por los primeros usos del producto financiaron las siguientes fases, creando un modelo de negocio sostenible.

Una empresa también necesita un centro de excelencia que apoye a los equipos de producto y determine normas y prácticas recomendadas para crear productos de datos en toda la organización. Por ejemplo, el centro debería definir cómo documentarán los equipos la procedencia de los datos, auditarán el uso de los datos y medirán la calidad de los datos, y debería diseñar los patrones de arquetipos de consumo para que los utilicen los equipos de productos de datos. Este enfoque puede eliminar la complejidad y el desperdicio. Además, el centro puede ser un recurso para talento especializado o expertos en datos cuando la demanda de ellos aumenta dentro de los grupos de servicios públicos o los equipos de casos de uso empresarial. Por ejemplo, en un proveedor de telecomunicaciones con el que trabajamos, expertos en visión artificial, que son escasos pero a menudo tienen demanda, se sientan en el hub central y se despliegan en unidades de negocio si así lo solicitan.

Como un ladrillo de Lego, un producto de datos conectado para admitir uno o más arquetipos de consumo se puede convertir rápidamente en cualquier cantidad de aplicaciones empresariales.

Si bien la mayoría de las empresas ya tienen parte, si no todo, del talento necesario para crear sus grupos de servicios públicos y centros de excelencia, muchas tendrán que profundizar su grupo de ciertos expertos, en particular ingenieros de datos que pueden limpiar, transformar y agregar datos para el análisis y la exploración.

Esto era especialmente cierto para la empresa minera, que necesitaba aumentar su personal de ingeniería de datos de tres a 40 personas. Para llenar ese gran vacío, sus líderes adoptaron un enfoque escalonado. Contrataron a contratistas para hacer el trabajo de inmediato y, después, se embarcaron en esfuerzos de reclutamiento de gran alcance: organizar eventos de networking, publicar artículos en LinkedIn, mejorar las habilidades de los ingenieros de software que ya formaban parte del personal y desarrollar programas de pasantías en colegios y universidades locales. Para mejorar la retención, crearon un gremio de ingenieros de datos, que les ayudó a desarrollar sus habilidades y compartir las mejores prácticas. La empresa también elaboró planes individualizados para los ingenieros de datos que garantizaban que esos profesionales tuvieran una clara trayectoria de crecimiento tras su incorporación a la empresa.

Seguimiento del rendimiento y la calidad

Para ver si los productos comerciales son un éxito, las organizaciones miran barómetros como las ventas, la retención, el compromiso, la satisfacción y la rentabilidad de los clientes. Los productos de datos se pueden evaluar con métricas acordes, como el número de usuarios activos al mes, el número de aplicaciones en la empresa, la satisfacción de los usuarios y el retorno de la inversión para los casos de uso.

La empresa de telecomunicaciones hizo un seguimiento del impacto de su primer producto de datos, que proporcionó datos completos sobre los equipos críticos de la red móvil, en 150 casos de uso. Incluían sistemas de decisión de inversiones, sistemas de planificación de escenarios y motores de optimización de redes. En total, producirán cientos de millones de dólares en ahorros de costes y nuevos ingresos en un plazo de tres años. La empresa estima que durante los primeros 10 años los casos de uso tendrán un impacto financiero acumulado de 5000 millones de dólares, lo que supondrá un rendimiento muchas veces superior a la inversión inicial.

Y del mismo modo que los fabricantes utilizan habitualmente pruebas de control de calidad o inspecciones de la línea de producción para asegurarse de que sus productos funcionan según lo prometido, los gestores de productos de datos pueden garantizar la calidad de los datos de sus ofertas. Para ello, deben gestionar estrechamente las definiciones de datos (indicando, por ejemplo, si los datos de los clientes incluyen solo a los clientes activos o también a los clientes anteriores y potenciales), la disponibilidad y los controles de acceso. También deben trabajar estrechamente con los empleados que son propietarios de los sistemas de origen de datos o que son responsables de la integridad de los datos. (Estos últimos a veces se denominan «administradores de datos»).

La calidad puede verse afectada, por ejemplo, cuando se capturan los mismos datos de diferentes formas en diferentes sistemas, lo que da como resultado entradas duplicadas. Esto era un riesgo con el producto de datos de clientes del banco nacional. Así que su jefe de producto trabajó con los administradores de los diversos repositorios de datos de clientes y aplicaciones de la empresa para crear un identificador único para cada cliente. Eso permitió que los datos de los clientes se integraran sin problemas en cualquier caso de uso o con cualquier producto de datos relacionado. El director de producto también se asoció con el centro de excelencia para desarrollar las normas y políticas gobernar los datos de los clientes en toda la empresa y para supervisar el cumplimiento, todo lo cual facilitó la reutilización del producto de datos y, al mismo tiempo, generó confianza entre los usuarios.

Por dónde empezar

Los líderes se preguntan a menudo qué productos de datos y arquetipos de consumo obtendrán el mayor y más rápido retorno de la inversión. La respuesta es diferente para cada organización.

Para encontrar el enfoque adecuado para sus empresas, los ejecutivos deben evaluar la viabilidad y el valor potencial de casos de uso en cada dominio empresarial (podría ser un proceso empresarial principal, el recorrido de un cliente o empleado, o una función) y agrúpelos primero por los productos de datos que necesitan y, después, por los arquetipos de consumo implicados. Clasificar los casos de uso de esta manera ayuda a los líderes a secuenciar el trabajo de manera más eficiente y a obtener un retorno de la inversión más rápido Por ejemplo, pueden terminar impulsando algunos casos de uso de menor valor si aprovechan los arquetipos de productos y consumo de datos de los casos de uso de mayor valor.

Para los ejecutivos del banco nacional, este enfoque iluminó varias prioridades. Primero vieron que un producto de datos de clientes que apoyara sus casos de uso de marketing y gestión del fraude más críticos podía generar un enorme valor. Luego identificaron los tipos de datos que el producto tenía que recopilar primero. Algunos de esos casos de uso requerían identificadores básicos de clientes y datos de referencia (como datos demográficos o de segmentación), mientras que otros requerían datos exhaustivos del comportamiento de los clientes. El banco también se dio cuenta de que los dos arquetipos de consumo que debía perseguir primero eran un entorno limitado de descubrimiento y análisis avanzados, que combinados respaldarían la mayoría de los casos de uso prioritarios de fraude y marketing de la empresa.

Las decisiones sobre productos de datos a menudo implican compensaciones entre impacto, viabilidad y velocidad. Idealmente, los productos objetivo iniciales y los arquetipos de consumo se aplicarán inmediatamente a casos de uso de alto valor y a una larga cartera de otros, como lo hizo el producto del proveedor de telecomunicaciones para su equipo de red.

Sin embargo, las consideraciones de viabilidad pueden hacer que una empresa ajuste su enfoque. Por ejemplo, puede que tenga sentido generar impulso primero en un área de la organización que tenga experiencia en datos y que haya ganado algo de tracción con los productos de datos, incluso si no es ahí donde reside la mayor oportunidad. Vimos que esto pasaba en la empresa minera. Inicialmente optó por desarrollar dos productos que respaldaran su planta de procesamiento de minerales, donde los casos de uso ya se habían demostrado con éxito, los gerentes estaban entusiasmados por buscar más, el equipo tenía muchos datos preparados para trabajar y había expertos con una amplia experiencia que le ayudarían.

. . .

La mayoría de los líderes actuales están haciendo grandes esfuerzos para convertir los datos en una fuente de ventaja competitiva. Pero esas iniciativas pueden fracasar rápidamente si las organizaciones no se aseguran de que el arduo trabajo que hacen hoy sea reutilizable mañana. Las empresas que gestionen sus datos como un producto se encontrarán con una ventaja de mercado significativa en los próximos años, gracias al aumento de la velocidad y la flexibilidad y a las nuevas oportunidades que puede abrir este enfoque.

A version of this article appeared in the July–August 2022 issue of Harvard Business Review.