python数据分析应用(代码版)

04-19 1586阅读

想要在Jupyter Notebook打开指定的路径文件:

  • 在cmd中输入jupyter notebook,直接在当前的路径打开了

    1.Numpy矩阵与通用函数使用方法

    import numpy as np#导入
    x=np.array([1,2,3])#创建变量
    y=np.array([4,5,6])
    print('数组相加结果为:',x +y)#数组相加
    print ('数组相减结果为:',x - y)#数组相减
    print('数组相乘结果为:',x* y)#数组相乘
    print('数组相除结果为:',x/y)#数组相除
    print ('数组幂运算结果为: ',x**y)#数组幂运算
    

    数组相加结果为: [5 7 9]

    python数据分析应用(代码版)

    数组相减结果为: [-3 -3 -3]

    数组相乘结果为: [ 4 10 18]

    数组相除结果为: [0.25 0.4 0.5 ]

    数组幂运算结果为: [ 1 32 729]

    可以看出来用来数组计算还是很方便的


    x=np.array([1,3,5])
    y=np.array([2,3,4])
    print('数组比较结果为:',x  y)
    print('数组比较结果为:',x== y)
    print('数组比较结果为:',x>=y)
    print ('数组比较结果为: ',x 0.0:
    	        m.append(i)
    	print(m)
    	m1=[x for x in m if x==int(x)]
    	print("删除年龄异常的数据:\n",m1)
    
    (2)来聘人员信息
    #读取信息
    import pandas as pd
    job = pd.read_csv('D:\pythonFX\jupyter\pandas\使用pandas进行预处理\来聘人员信息\hr_job.csv',index_col=0,encoding='gbk',engine='python')
    # print (xinxi)
    #1.查看缺失值的数量
    print('job每个特征缺失的数目为:\n',job.isnull().sum())
    #填补缺失值
    job['性别']=job['性别'].fillna('未知')
    job['教育水平']=job['教育水平'].fillna('未知')
    #取平均后再添加未知
    mean_num=int(job['工作次数'].mean())
    job['工作次数']=job['工作次数'].fillna(mean_num)
    #查看修改后缺失值的数量
    print('修改后缺失值的数量为:\n',job.isnull().sum())
    #2.异常值替换均值,性别异常值替换为”未知“
    job['性别'][job['性别']=='Other']='未知'
    job['工作次数'][job['工作次数']'fontsize': 15})#绘制饼鸥
    plt.title('学生考试总成绩的总体分布情况饼图',fontsize=20)
    plt.savefig('学生考试总成绩的总体分布情况饼图.png')
    plt.show()
    #绘制学生考试总成绩的总体分布情况饼圈,设置标签、离心半径、标签字体大小和标题,最后保存图片并显示。
    #绘制学生考试总成绩的总体分散情况箱线图
    p= plt.figure(figsize=(16,8))
    label=['数学成绩','阅读成绩','写作成绩']
    gdp= (list(math_grade),list(reading_grade),list(writing_grade))
    plt. boxplot(gdp, notch=True,labels=label, meanline=True)#绘制箱线图
    plt.xlabel('学生考试科目')
    plt.ylabel('学生考试分数')
    plt.title('学生各项考试成绩的总体分散情况箱线图',fontsize=20)
    plt.savefig('学生各项考试成绩的总体分散情况箱线图.png')
    plt.show()
    

VPS购买请点击我

文章版权声明:除非注明,否则均为主机测评原创文章,转载或复制请以超链接形式并注明出处。

目录[+]