Del curso: Aprende data science: Conceptos básicos

Combina las técnicas de la analítica predictiva

Del curso: Aprende data science: Conceptos básicos

Combina las técnicas de la analítica predictiva

Todo lo que has visto hace referencia al pasado. Cómo recolectar distintos tipos de datos, y someterlos a análisis estadísticos, que son el punto de partida del verdadero conocimiento. El equipo de data science puede establecer correlaciones entre algunos hechos. Ahora podemos darles la vuelta a estas ideas. Usaremos el conocimiento para darle la vuelta y predecir el futuro. Esto se llama analítica predictiva. El término va muy asociado a la ciencia de datos. A veces se usan de forma intercambiable, pero no son exactamente lo mismo. La analítica predictiva es un tipo de ciencia de datos. La ciencia de datos se basa en aplicar el método científico a los datos. La analítica predictiva usa esos resultados y los transforma en acciones concretas. Piénsalo así: la meteorología es un tipo de ciencia. Estudia la física, la velocidad del viento y la atmósfera. Si sales con un meteorólogo, te enseñará por qué las nubes tienen formas diferentes y cómo la presión determina los movimientos que siguen. Es la ciencia de la meteorología. Intenta comprender el tiempo y las tendencias históricas. Aun así, la mayoría de la gente no habla de la meteorología como de una ciencia. Piensan en ella como la predicción del tiempo. La predicción del tiempo es lo que hacen los meteorólogos cuando usan la analítica predictiva. Con la probabilidad y la correlación predicen patrones del tiempo atmosférico. Los meteorólogos se valen de los datos históricos para asignar probabilidades. Pueden encontrar correlaciones entre los sistemas de baja presión y grandes tormentas. A medida que disminuye la presión, la gravedad de la tormenta aumenta. Es una correlación positiva entre la presión y las tormentas. Todos los análisis se reúnen en la respuesta del meteorólogo cuando le preguntan: «¿Cómo estará el clima mañana?» Lo que ha servido para entender el pasado se vuelve una predicción del futuro. El interés por el análisis predictivo se ha renovado. Las nuevas tecnologías e instrumentos permiten que el conocimiento sea más certero. Piensa en la predicción del tiempo. Ahora mismo, la agencia meteorológica tiene acceso a datos históricos de miles de estaciones. Pero imagina que distribuyeran millones de balizas. Los ciudadanos podrían instalarlas en sus casas y conectarlas a sus redes wifi. Con estos dispositivos económicos se puede registrar la presión del aire y la temperatura. También pueden grabar video y audio. Se podría subir toda esa información a un clúster Hadoop. Los científicos tendrían acceso a unos niveles de información sin precedente. Por eso la analítica predictiva se asocia directamente con los datos masivos de la ciencia de datos. A mayor volumen de datos, mejores serán las preguntas que el equipo pueda plantear. Así el equipo puede hacer análisis complejos. En este caso, podría observar los patrones del tiempo casa por casa y manzana por manzana, y crear modelos predictivos complejos basados en millones de hogares. Lo mismo vale para tu equipo. Tenemos una página web de zapatillas. Imagina que el equipo colecciona millones de tuits sobre la actividad de correr. Identifica a unos cuantos corredores influyentes. Podrías enviarles regalos o promociones, para que hablen bien sobre tu empresa. También se pueden usar estos datos para identificar eventos clave. Con estas nuevas herramientas se puede ganar en perspectiva sobre los datos. El equipo puede analizar millones de tuits, como la agencia meteorológica analiza petabytes de información. Puedes observar oleadas de información a tiempo real. Una regla general es que a mayor cantidad de datos, los resultados de la analítica predictiva será más robusta y precisa. Las organizaciones suelen entusiasmarse con la analítica predictiva, al punto de que no siempre dedican tiempo y recursos suficientes al equipo de data science. Quieren saltar directamente a las predicciones sin haber comprendido los datos. Cuando formas parte de un equipo de data science, tienes que explicar que la calidad de las predicciones depende del análisis previo que tu equipo haga de los datos. Tu equipo tiene que entender el pasado para poder predecir el futuro. No menosprecies el análisis. Haz buenas preguntas sobre tus datos y usa las herramientas estadísticas para crear informes. Así, tus predicciones serán muchísimo más precisas.

Contenido