Construyendo un modelo de regresión

La regresión logística se refiere al algoritmo de aprendizaje automático que se usa para predecir la probabilidad de una variable dependiente categórica. En la regresión logística, la variable dependiente es una variable binaria, que consiste en datos codificados como 1 (valores booleanos de verdadero y falso).

En este capítulo, nos enfocaremos en desarrollar un modelo de regresión en Python usando una variable continua. El ejemplo del modelo de regresión lineal se centrará en la exploración de datos desde un archivo CSV.

El objetivo de la clasificación es predecir si el cliente se suscribirá (1/0) a un depósito a plazo.

import pandas as pd
import numpy as np
from sklearn import preprocessing
import matplotlib.pyplot as plt

plt.rc("font", size=14)
from sklearn.linear_model import LogisticRegression
from sklearn.cross_validation import train_test_split

import seaborn as sns
sns.set(style="white")
sns.set(style="whitegrid", color_codes=True)
data = pd.read_csv('bank.csv', header=0)
data = data.dropna()
print(data.shape)
print(list(data.columns))

Siga estos pasos para implementar el código anterior en Anaconda Navigator con "Jupyter Notebook" -

Paso 1 : inicia el cuaderno Jupyter con Anaconda Navigator.

Cuaderno Jupyter Primero

Cuaderno Jupyter Segundo

Paso 2 : cargue el archivo csv para obtener el resultado del modelo de regresión de manera sistemática.

Cuaderno Jupyter Tercero

Paso 3 : crea un nuevo archivo y ejecuta la línea de código mencionada anteriormente para obtener el resultado deseado.

Cuaderno Jupyter Cuarto

Cuaderno Jupyter Quinto