Un termino que aveces me agota la poca paciencia que tengo es ‘es importante determinar la correlacion’. A ver, individuo, ¿tienes idea, de que es la correlacion?
La palabra es bastante facil de mal usar, porque por su nombre se puede deducir que es la causa conjunta de un efecto. Y si eso es, pero si bien es bastante facil, de usar en una oracion. Determinar o Calcular la correlacion es una formula estadistica. Que permite colocar un numero en una variable X y Z tienen influencia en sus datos.
Es decir en una linea de tiempo, o en un set de datos. Para cada Correspondencia de X y Z si tienen relacion o no, principalmente validando si a cada movimiento de X corresponde un movimiento en Z. Lo que permite determinar si alguna funcion podria influir. F(x) = Z
Si bien una correlacion tiene 3 estados.
1. Se correlacion de forma cerrada. Los datos se van acercando \/
0. No se relacionan. | | o | \ o | /
1. Se correlacionan de forma abierta. Los datos se van /\
Si todavia no queda claro, es importante tener lo siguiente.
- Variables. Dos variables para hacer exactos.
- Variables Numericas. Las variables anteriores deben ser principalmente numeros.
- Instancias con ambas caracteristicas. Es decir las variables deben ser parte de un mismo conjunto.
Si todas las anteriores son posibles. Podremos tener un numero para correlacionar, si las anteriores no son posibles, lamentandolo mucho la persona con la que estas hablando, no tiene ni idea de que pide. Y volver al caso de metricas sin valor.
Voy a demostrarlo en este conjunto imaginario.
Supongamos que tenemos las siguientes 2 secuencias.
Ventas Totales | Verano | Otoño |
Dia 1 | 50 | 70 |
Dia 2 | 30 | 10 |
Dia 3 | 5 | 30 |
Dia 4 | 8 | 10 |
Dia 5 | 40 | 30 |
Dia 6 | 30 | 12 |
Dia 7 | 55 | 33 |
Dia 8 | 9 | 99 |
Dia 9 | 101 | 23 |
Dia 10 | 39 | 12 |
Queremos calcular la correlacion de las ventas para cada dia del Verano y del Otoño.
¿Venta de que? No importa
¿Dias, no son meses diferente? No importa, son dias desde el inicio
¿No son estrategias y productos diferentes? Nuevamente, no importa queremos calcular la correlacion.
Ok si copiamos y pegamos en excel tendremos algo como
=CORREL(B2:B11,C2:C11)
Lo cual devuelve el valor de -0.130554211
Lo que significa que no hay ningun tipo de correlacion estadistica alguna. Aunque los datos parecen tener sentido, realmente no tienen nada que ver, los unos con los otros, si ignoramos todas las preguntas logicas y con sentido anteriores.
Es muy comun tener la mala suerte, de lograr numerizar un monton de datos sin una relacion logica, calcular el coeficente de correlacion y de 1. Gritar ¡EUREKA! y crear un numero mas falso que tu ex.
Si quieren un coeficiente de correlacion que pertenezca y les permita hacer un descubrimiento necesitan que sean parte del mismo conjunto.
Por ejemplo, hace sentido, correlacionar el precio de una unidad inmobiliaria con su metraje, o el precio con el numero de habitaciones.
Hace sentido correlacionar la temperatura con la humedad. Hace sentido correlaciona las ventas con la difusion de campañas publicitarias.
NO HACE SENTIDO, correlacionar las caracteristicas del runtime Java, con las del runtime .NET, o con las de Python que es la razon de mi rabieta.
Por favor, individuo que no tiene idea de la vida, que dice palabras porque son bonitas, que dicen ‘excelente, tomemos accion’ porque lo leyeron en su libro de gerencia para tontos altamente efectiva, no le pidas a personas que saben, tonterias que no entiendes solo porque suena ejecutivo.