Evite el sesgo: separe los datos

Tigo Panamá | 1 de febrero, 2021

Evite el sesgo: separe los datos

Comparte

¿Existe sesgo en Big Data? Sin dudas, sí. Ciertamente, estar a favor o en contra de un grupo de datos en comparación con otro grupo es sesgar la información. Por eso, evite el sesgo, separe los datos según temporadas y días festivos.  De esta manera, tendrá información real del comportamiento de los usuarios.

Debido a que las compras en fechas de festividades suelen incrementarse, al realizar un análisis anual de la demanda el resultado puede ser engañoso. Téngalo claro al interpretar los datos y tomar decisiones.

Por ejemplo, el año 2020 alteró el comportamiento de los canales online de ventas. Sobre todo, en rubros de fácil acceso y transporte. Es decir, que las cuarentenas, el encierro prolongado obligó al usuario a realizar más compras desde su hogar, mucho más de lo habitual. Y aunque, la tendencia parece seguir en alza, es necesario analizar con cuidado lo que dicen esos datos. Porque, extrapolar comportamientos, pudiera ser demasiado riesgoso si la situación cambia repentinamente.

¿Cómo se dan los sesgos al gestionar datos de transacciones?

Aunque, tenga toda la evidencia disponible, el humano promedio asume sus propias creencias e ideas preconcebidas sobre un tema. Igualmente, los profesionales experimentados recurren a ese “feeling” que se adquiere con la experiencia. Por lo tanto, es necesario mantener una posición neutral cuando se gestionan datos. De hecho, quien compila, analiza y presenta datos, no siempre es la persona más adecuada para tomar decisiones de negocios. A no ser que no existan decisores capacitados, debería haber un estratega comercial, independiente de la gestión de datos, encargándose de los insights.  

En ingeniería, un sesgo es un error sistemático. Y es común encontrarlos en la medición estadística. En otras palabras, los errores sistemáticos se producen casi en todas las mediciones que se realizan. Usualmente, tienen su origen en defectos de los instrumentos de cálculo, los programas, los procesos o en las personas que corren los procesos.

“El error sistemático también llamado sesgo, surge cuando se da un error en el diseño o en la selección de la muestra, en la información recogida o en su análisis.”

Evidentemente, el sesgo en la gestión de Big Data es un tema de interés para expertos en datos, pero, sobre todo, para los tomadores de decisión. ¿Conoce los tipos de sesgos que se dan al analizar datos?

Veamos los más relevantes al gestionar datos:

Primeramente, tenemos el sesgo estadístico que es una tendencia sistemática en el proceso de recopilación de datos, dando resultados erróneos y engañosos. Surge al seleccionar la muestra, al analizar la data y en otras etapas del proceso.

También, existe el sesgo de confirmación que consiste en buscar, interpretar, favorecer y recuperar información para que confirme las creencias o hipótesis de una persona con poder de decisión. Mientras, no se le presta atención, o muy poca, a la información que contradice el planteamiento.

¿Le parece conocido este comportamiento? ¿Le ha sucedido? Es por ello, que se requieren personas que tengan la entereza profesional para cuestionar y no estar de acuerdo en las ocasiones que lo amerite.

Al igual que los anteriores, el sesgo de pronóstico en la gestión de datos, muestra diferencias consistentes entre los resultados y los pronósticos siendo o demasiado altos o demasiado bajos.

Sesgo académico: Es el sesgo percibido del profesional que permite que sus creencias y conocimientos (formación académica) den forma a la investigación sin tomar en consideración la neutralidad. En muchas ocasiones sus afirmaciones se basan en evidencia anecdótica.

Finalmente, el sesgo inductivo aparece cuando se trabaja con IA y Big Data. Precisamente, ocurre con el aprendizaje automático. Al desarrollar algoritmos que aprenden a anticipar un resultado particular, el algoritmo de aprendizaje recibe casos de capacitación que muestran la conexión esperada. También, el sesgo inductivo del algoritmo de aprendizaje es el conjunto de suposiciones que ese utilizan para predecir salidas dadas las entradas que no ha encontrado.

evite el sesgo separe datos

Evite el sesgo: separe los datos

Evite el sesgo, separe datos, es mucho más que una frase. Al ser consciente de la existencia de sesgo en la gestión, se puede minimizar su recurrencia. No obstante, en todo lo que tenga el componente humano habrá algo de sesgo. Aun así, es necesario conocer los diversos tipos de sesgos a los que se enfrenta al gestionar datos.

Tal cual, sucede con otras áreas que pueden influir en la gestión comercial, los datos, si bien son precisos, también, son dependientes. Por ello, es necesario que el analista de datos, comprenda la temporalidad como elemento clave de las ventas. Es preciso que sepa que un pico de ventas no necesariamente es una representación de la realidad del mercado y que debe comparar siempre con los datos históricos.

Separe los datos compilados durantes fiestas y celebraciones. Es decir, mida ventas y transacciones de épocas de transacciones altas con su similar, no prorrateé ventas ni clicks en un año. Préstele atención, por separado, a diciembre (ventas de fin de año y festividades), febrero (San Valentín), épocas de pagos adicionales (XII mes) y sus similares.

La temporalidad, así como, las características particulares del producto o servicio a comercializar son determinantes al gestionar datos de transacciones comerciales.  Por ello, evitar el sesgo y separar los datos es clave al gestionar Big Data en el sector empresarial.

Siga leyendo sobre Analítica de datos en los negocios aquí.

Comparte

Comentarios