logistic regression完整代码演示
#我们将建立一个逻辑回归模型来预测一个学生是否被大学录取
#假设你是一个大学管理员,你想根据两次考试的结果来决定每个申请人的录取机会。你有以前申请人的历史数据,你可以用它作为逻辑回归的训练集。对于每一个培训的例子,你有两个考试的申请人的分数和录取决定。为了做到这一点,我们将建立一个分类模型,根据考试成绩估计入学概率。
#logistics regression完整代码#三大件
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
#%matplotlib inline#数据读取
import os
pdData = pd.read_table("LogiReg_data.txt", sep=",",header=None, names=['Exam 1', 'Exam 2', 'Admitted'])
#pdData.head()
#pdData.shape#画散点图
positive = pdData[pdData['Admitted'] == 1]
negative = pdData[pdData['Admitted'] == 0]
# print(positive) 筛选出了等于1的样本
# print(negative) 筛选出了等于0的样本
fig, ax = plt.subplots(figsize=(10, 5))
ax.scatter(positive['Exam 1'], positive['Exam 2'], s=30, c='b', marker='o', label='Admitted')
ax.scatter(negative['Exam 1'], negative['Exam 2'], s=30, c='r', marker='x', label='Not Admitted')
ax.legend()
ax.set_xlabel('Exam 1 Score')
ax.set_ylabel('Exam 2 Score')
fig.show()#定义sigmoid函数
def sigmoid(z):return 1/(1 + np.exp(-z))
#下面把sigmoid图像画出来,只是看一眼而已
#nums=np.arange(-10,10,step=1)
#fig,ax = plt.subplots(figsize = (6,2))
#ax.plot(nums,sigmoid(nums),c='r')#定义预测函数
def model(X,theta):return sigmoid(np.dot(X,theta.T)) #np.dot矩阵乘法#插入Ones列
pdData.insert(0,'Ones',1) #insert新插入一列。‘0’插入的列的位置,‘Ones’带插入列的列名,‘1’插入的值orig_data = pdData.as_matrix() #数据框变为可运算的矩阵数组
cols = orig_data.shape[1] #列数
X = orig_data[:
发布评论