python数据分析应用(代码版)
想要在Jupyter Notebook打开指定的路径文件:
- 在cmd中输入jupyter notebook,直接在当前的路径打开了
1.Numpy矩阵与通用函数使用方法
import numpy as np#导入 x=np.array([1,2,3])#创建变量 y=np.array([4,5,6]) print('数组相加结果为:',x +y)#数组相加 print ('数组相减结果为:',x - y)#数组相减 print('数组相乘结果为:',x* y)#数组相乘 print('数组相除结果为:',x/y)#数组相除 print ('数组幂运算结果为: ',x**y)#数组幂运算
数组相加结果为: [5 7 9]
数组相减结果为: [-3 -3 -3]
数组相乘结果为: [ 4 10 18]
数组相除结果为: [0.25 0.4 0.5 ]
数组幂运算结果为: [ 1 32 729]
可以看出来用来数组计算还是很方便的
x=np.array([1,3,5]) y=np.array([2,3,4]) print('数组比较结果为:',x y) print('数组比较结果为:',x== y) print('数组比较结果为:',x>=y) print ('数组比较结果为: ',x 0.0: m.append(i) print(m) m1=[x for x in m if x==int(x)] print("删除年龄异常的数据:\n",m1)
(2)来聘人员信息
#读取信息 import pandas as pd job = pd.read_csv('D:\pythonFX\jupyter\pandas\使用pandas进行预处理\来聘人员信息\hr_job.csv',index_col=0,encoding='gbk',engine='python') # print (xinxi) #1.查看缺失值的数量 print('job每个特征缺失的数目为:\n',job.isnull().sum()) #填补缺失值 job['性别']=job['性别'].fillna('未知') job['教育水平']=job['教育水平'].fillna('未知') #取平均后再添加未知 mean_num=int(job['工作次数'].mean()) job['工作次数']=job['工作次数'].fillna(mean_num) #查看修改后缺失值的数量 print('修改后缺失值的数量为:\n',job.isnull().sum()) #2.异常值替换均值,性别异常值替换为”未知“ job['性别'][job['性别']=='Other']='未知' job['工作次数'][job['工作次数']'fontsize': 15})#绘制饼鸥 plt.title('学生考试总成绩的总体分布情况饼图',fontsize=20) plt.savefig('学生考试总成绩的总体分布情况饼图.png') plt.show() #绘制学生考试总成绩的总体分布情况饼圈,设置标签、离心半径、标签字体大小和标题,最后保存图片并显示。 #绘制学生考试总成绩的总体分散情况箱线图 p= plt.figure(figsize=(16,8)) label=['数学成绩','阅读成绩','写作成绩'] gdp= (list(math_grade),list(reading_grade),list(writing_grade)) plt. boxplot(gdp, notch=True,labels=label, meanline=True)#绘制箱线图 plt.xlabel('学生考试科目') plt.ylabel('学生考试分数') plt.title('学生各项考试成绩的总体分散情况箱线图',fontsize=20) plt.savefig('学生各项考试成绩的总体分散情况箱线图.png') plt.show()
文章版权声明:除非注明,否则均为主机测评原创文章,转载或复制请以超链接形式并注明出处。