What Is Logistic Regression? A Guide To Get Your Basics Right

¿Qué es la regresión logística? Una guía para encontrar lo básico


Si está intentando ingresar al campo del análisis de datos, necesita encontrar una manera de comprender las diversas herramientas y técnicas del negocio. Una de esas técnicas de análisis comúnmente utilizadas por los analistas de datos es la regresión logística. Entonces, ¿qué es la regresión logística? ¿Como funciona? ¿Cuáles son las ventajas y desventajas?

Esta guía le ayudará a comprenderlo todo, desde su importancia hasta sus usos y beneficios. Al final de esta publicación, conocerá la diferencia entre regresión logística y lineal y estará familiarizado con los diferentes tipos.

de acuerdo a Objetivo tecnológicoEs un método de análisis estadístico para predecir resultados binarios como sí o no basándose en observaciones previas de un conjunto de datos.

En otras palabras, los modelos de regresión logística predicen la variable dependiente analizando la relación entre una o más variables independientes. Por ejemplo, predice si un estudiante ingresará o no a una universidad en particular. Estos resultados binarios permiten una decisión sencilla entre dos variables alternativas.

El modelo analítico considera varios criterios de entrada en el diagrama. En el caso de la aceptación universitaria mencionado anteriormente, la función logística puede tener en cuenta factores como el promedio de calificaciones, los puntajes de los exámenes de ingreso y las actividades extracurriculares. Basado en datos históricos sobre resultados anteriores con los mismos criterios de entrada, el modelo registra la probabilidad de que nuevos casos caigan en categorías de resultados binarios.

Ahora examinemos algunos escenarios del mundo real si esto es relevante.

Calcular la probabilidad de un evento binario puede ayudarnos a determinar si un correo electrónico es spam o si una transacción con tarjeta de crédito es fraudulenta. En un contexto médico, se puede utilizar para predecir resultados de salud, como si un tumor es maligno o no.

Entonces puedes ver que la regresión logística predice todo tipo de resultados de sí o no. Al hacer predicciones, el modelo ayuda a los científicos de datos a tomar decisiones comerciales informadas para reducir riesgos, optimizar costos y aumentar la rentabilidad. ¿Y no es eso lo que quieren todas las empresas?

Por ejemplo, una compañía de tarjetas de crédito no puede ofrecer una tarjeta a cada persona que la solicite. Tienen que analizar los dos posibles resultados binarios: la persona «incumplirá» o «incumplirá» utilizando el modelo para clasificar a los clientes potenciales de la tarjeta de crédito.

La regresión logística es una técnica importante en inteligencia artificial y aprendizaje automático (AI/ML). Los modelos de aprendizaje automático (ML) son programas de software que se pueden adaptar y entrenar para realizar tareas complejas de procesamiento de datos sin intervención manual. Los modelos de aprendizaje automático creados mediante regresión logística pueden proporcionar información procesable a partir de datos comerciales y realizar análisis predictivos para reducir los costos operativos y aumentar la productividad.

A continuación se muestran algunos beneficios de este análisis que aportarán valor a los analistas de datos.

Sencillez: Los modelos requieren menos uso computacional que otros modelos de ML y, por lo tanto, son más útiles en el contexto del aprendizaje automático. Por lo tanto, incluso si no tiene un conocimiento profundo de ML, puede crear, entrenar e implementar modelos de ML eficientes mediante la regresión logística.
Velocidad: Procesa grandes conjuntos de datos a alta velocidad, porque requieren menos potencia informática en términos de memoria y procesamiento. Esto hace que los programadores que trabajan en proyectos complejos de aprendizaje automático estén desesperados por obtener resultados rápidos.
Visibilidad: Analytics proporciona a los programadores una mayor visibilidad de los procesos internos de software que otras técnicas de análisis de datos. Como los cálculos que utilizan fórmulas son menos complejos, la resolución de problemas es más sencilla.

En esta publicación, hasta ahora solo hemos explicado un tipo: la regresión binomial, donde solo tienes dos resultados posibles. Sin embargo, existen tres tipos:

Binario Este modelo estadístico predice la relación entre la variable dependiente (Y) y la variable independiente X, que es la variable dependiente binaria. Entonces, el resultado es aprobado/reprobado, 0/1, sí/no o verdadero/falso.
pluralEn este análisis estadístico, tiene una variable dependiente con dos o más resultados. Por ejemplo, supongamos que desea predecir cuál será el medio de transporte más popular en 2040. Aquí el modo de transporte se convierte en la variable dependiente con varios resultados posibles, como tren, autobús, automóvil o bicicleta.
Estándar: En esta técnica, la variable dependiente (Y) tiene una secuencia significativa de dos o más variables categóricas. Por ejemplo, considere las opciones de talla de camisa (S/M/L/XL) o de opinión de la audiencia (de acuerdo/en desacuerdo/neutral).

Regresión lineal La igualdad utiliza variables continuas como objetivos, mientras que en un modelo de regresión logística el objetivo es una variable discreta o un valor binario. El valor previsto para la regresión lineal es la media de las variables objetivo. Sin embargo, el valor predicho es la probabilidad de las variables objetivo.

GoogleSeo en colaboración con las mejores universidades del mundo. Cursos avanzados de ciencia y análisis de datos.. Estos cursos completamente en línea están diseñados para ayudarlo a profundizar en los conceptos y técnicas utilizados en análisis de datos, aprendizaje automático y aprendizaje profundo. También puede aplicar todos los conocimientos y habilidades para desarrollar un modelo de aprendizaje automático, crear una cartera lista para el trabajo, atraer la atención de su empleador y conseguir el trabajo de sus sueños.

Escríbenos contenido@emeritus.org