留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

在线数据揭示预期薪金的影响因素

王军 高见 杨枭 刘金虎 周涛

王军, 高见, 杨枭, 刘金虎, 周涛. 在线数据揭示预期薪金的影响因素[J]. 电子科技大学学报, 2019, 48(2): 307-314. doi: 10.3969/j.issn.1001-0548.2019.02.023
引用本文: 王军, 高见, 杨枭, 刘金虎, 周涛. 在线数据揭示预期薪金的影响因素[J]. 电子科技大学学报, 2019, 48(2): 307-314. doi: 10.3969/j.issn.1001-0548.2019.02.023
WANG Jun, GAO Jian, YANG Xiao, LIU Jin-hu, ZHOU Tao. Online Data Reveal Key Factors on Salary Expectation[J]. Journal of University of Electronic Science and Technology of China, 2019, 48(2): 307-314. doi: 10.3969/j.issn.1001-0548.2019.02.023
Citation: WANG Jun, GAO Jian, YANG Xiao, LIU Jin-hu, ZHOU Tao. Online Data Reveal Key Factors on Salary Expectation[J]. Journal of University of Electronic Science and Technology of China, 2019, 48(2): 307-314. doi: 10.3969/j.issn.1001-0548.2019.02.023

在线数据揭示预期薪金的影响因素

doi: 10.3969/j.issn.1001-0548.2019.02.023
基金项目: 

国家自然科学基金 61703074

国家自然科学基金 61673086

详细信息
    作者简介:

    王军(1988-), 男, 博士生, 主要从事大数据分析等方面的研究.E-mail:junwang31@gmail.com

  • 中图分类号: TP391

Online Data Reveal Key Factors on Salary Expectation

  • 摘要: 数据资源的丰富和分析方法的创新,促使社会经济学逐渐转变为数据驱动的定量化学科。作为定量化人力资源的组成部分,薪金研究对社会经济发展有重要意义。然而,以往研究大多基于规模有限的普查数据,对不同经济和文化背景的考虑也不足。本文基于中国人力资源网站获取的大规模简历数据,分析了多种因素对求职者预期薪金的影响,结果发现身高、工作经验和教育程度等因素影响预期薪金,并且男女存在显著的差异。其中,女性平均预期低于男性,相比男性差大约五年工作经验或一个教育学位。最后,多变量回归方法验证了分析结果的鲁棒性。
  • 图  1  预期薪金的分布

    (条形图表示频率分布,实线为正态拟合曲线)

    图  2  身高对预期薪金的影响(a、b中条形图为概率分布,实线为正态拟合曲线;c、d中条形图为平均值,误差线为标准误,实线为拟合直线)

    图  3  工作经验对预期薪金的影响(误差线表示标准误,竖直虚线对应曲线拐点处的年龄和工龄)

    图  4  教育水平对预期薪金的影响(a、b中条形图表示平均值,误差线表示标准误)

    图  5  地理经济对预期薪金的影响(a、b中实线为拟合直线,数据标签为省份缩写;c、d中期望工作地人均GDP从高到低等分为4段:Top、Upper、Lower和Bottom;条形图表示平均值,误差线为标准误)

    表  1  简历数据的统计信息

    性别 样本数量 身高/cm 年龄/岁 工龄/年 学校 学位 预期薪金/元
    78 413 173.39 29.67 5.48 2.31 1.81 8 039
    [160, 185] [18, 66] [0, 36] [1, 4] [1, 4] [1 000, 50 000]
    62 651 162.04 27.64 3.80 2.21 1.77 5 017
    [150, 175] [18, 57] [0, 31] [1, 4] [1, 4] [1 000, 50 000]
    注:学校和学位为向量化后的数值。
    下载: 导出CSV

    表  2  预期薪金的最小二乘法回归分析结果

    变量 OLS Regression Model with Dependent Variable: log(salary)
    (1) (2) (3) (4) (5) (6) (7) (8)
    female -1.243 1*** 0.018 2 -0.151 4 0.019 5 -3.469 6*** -3.628 0*** -3.145 5*** -1.718 0***
    (0.128 1) (0.026 5) (0.118 1) (0.173 9) (0.084 5) (0.142 3) (0.193 2) (0.178 6)
    height 0.007 2*** 0.011 6*** 0.009 2*** 0.005 4*** 0.003 0*** 0.007 5***
    (0.000 5) (0.000 4) (0.000 4) (0.000 5) (0.000 4) (0.000 4)
    female·height 0.005 7*** 0.002 0*** 0.000 3 0.002 2*** 0.001 0 -0.002 1***
    (0.000 8) (0.000 7) (0.000 7) (0.000 8) (0.000 7) (0.000 6)
    age 0.070 6*** 0.071 1*** 0.048 1*** 0.048 2***
    (0.000 6) (0.000 6) (0.000 7) (0.000 7)
    female·age -0.009 9*** -0.010 4*** -0.008 3*** -0.010 5***
    (0.001 0) (0.001 0) (0.001 1) (0.001 1)
    seniority -0.003 0*** -0.002 6*** 0.020 5*** 0.020 9***
    (0.000 7) (0.000 7) (0.000 7) (0.000 7)
    female·seniority -0.002 2* -0.002 3** -0.001 4 -0.000 2
    (0.001 2) (0.001 2) (0.001 2) (0.001 2)
    GDPpc 0.314 1*** 0.311 9*** 0.294 7*** 0.307 7***
    (0.004 6) (0.004 6) (0.004 3) (0.003 9)
    female·GDPpc 0.277 3*** 0.265 2*** 0.227 4*** 0.193 4***
    (0.007 6) (0.007 7) (0.007 4) (0.006 7)
    Dschool NO NO NO YES NO NO YES YES
    Ddegree NO NO NO YES NO NO YES YES
    Constant 7.485 5*** 6.661 9*** 4.636 1*** 5.393 0*** 5.227 2*** 4.312 2*** 4.583 9*** 2.237 7***
    (0.081 7) (0.016 5) (0.075 7) (0.073 4) (0.051 0) (0.091 8) (0.087 4) (0.081 5)
    Observations 141 064 141 064 141 064 141 064 141 064 141 064 141 064 141 064
    F 4 914 10 348 7 658 3 663 8 148 4 960 2 543 4 052
    Adj.R2 0.094 6 0.268 3 0.275 4 0.330 3 0.147 7 0.149 5 0.234 5 0.376 2
    RMSE 0.634 2 0.570 1 0.567 4 0.545 4 0.615 3 0.614 6 0.583 1 0.526 4
    注:回归分析在男女混合样本上使用基于最小二乘的多变量回归模型,female=0对应于基准的男性组。DschoolDdegree分别表示毕业院校和获得学位的虚拟变量。如果标记为YES,则表示考虑在回归分析中;如果标记为NO,则表示没有考虑在回归分析中。表格中是变量的回归系数,括号中是标准误。统计显著性水平为:* p < 0.1, ** p < 0.05, *** p < 0.01。
    下载: 导出CSV
  • [1] EINAV L, LEVIN J. Economics in the age of big data[J]. Science, 2014, 346(6210):1243089. doi:  10.1126/science.1243089
    [2] PENTLAND A. Social physics:How social networks can make us smarter[M]. London:Penguin, 2015.
    [3] BARABÁSI A L. Network science[M]. New York:Cambridge University Press, 2016.
    [4] 高见, 周涛.大数据揭示经济发展状况[J].电子科技大学学报, 2016, 45(4):625-633. doi:  10.3969/j.issn.1001-0548.2016.04.015

    GAO Jian, ZHOU Tao. Big data reveal the status of economic development[J]. Journal of University of Electronic Science and Technology of China, 2016, 45(4):625-633. doi:  10.3969/j.issn.1001-0548.2016.04.015
    [5] BLUMENSTOCK J, CADAMURO G, ON R. Predicting poverty and wealth from mobile phone metadata[J]. Science, 2015, 350(6264):1073-1076. doi:  10.1126/science.aac4420
    [6] HIDALGO C A, KLINGER B, BARABÁSI A L, et al. The product space conditions the development of nations[J]. Science, 2007, 317(5837):482-487. doi:  10.1126/science.1144581
    [7] GAO J, JUN B, PENTLAND A, et al. Collective learning in China's regional economic development[EB/OL]. (2017- 03-04). http://arxiv.org/abs/1703.01369.
    [8] SALESSES P, SCHECHTNER K, HIDALGO C A. The collaborative image of the city:Mapping the inequality of urban perception[J]. PLoS One, 2013, 8(7):e68400. doi:  10.1371/journal.pone.0068400
    [9] ALSHAMSI A, PINHEIRO F L, HIDALGO C A. Optimal diversification strategies in the networks of related products and of related research areas[J]. Nature Communications, 2018, 9(1):1328. doi:  10.1038/s41467-018-03740-9
    [10] GAO J. Maximizing the collective learning effects in regional economic development[C]//2017 14th International Computer Conference on Wavelet Active Media Technology and Information Processing (ICCWAMTIP). Chengdu, China: IEEE, 2017: 337-341.
    [11] LUO S, MORONE F, SARRAUTE C, et al. Inferring personal economic status from social network location[J]. Nature Communications, 2017, 8:15227. doi:  10.1038/ncomms15227
    [12] YUAN J, ZHANG Q M, GAO J, et al. Promotion and resignation in employee networks[J]. Physica A, 2016, 444:442-447. doi:  10.1016/j.physa.2015.10.039
    [13] LLORENTE A, GARCIA-HERRANZ M, CEBRIAN M, et al. Social media fingerprints of unemployment[J]. PLoS One, 2015, 10:e0128692. doi:  10.1371/journal.pone.0128692
    [14] 高见, 张琳艳, 张千明, 等.大数据人力资源: 基于雇员网络的绩效分析与升离职预测[M]//刘怡君.社会物理学: 社会治理.北京: 科学出版社, 2014: 38-56.

    GAO Jian, ZHANG Lin-yan, ZHANG Qian-ming, et al. Big data human resources: Performance analysis and promotion resignation in employee networks[M]//LIU Yi-jun. Social Physics: Social Governance, Beijing: Science Press. 2014: 38-56.
    [15] PFEFFER J, LANGTON N. The effect of wage dispersion on satisfaction, productivity, and working collaboratively:Evidence from college and university faculty[J]. Administrative Science Quarterly, 1993, 38(3):382-407. doi:  10.2307/2393373
    [16] HÜBLER O. The nonlinear link between height and wages in Germany, 1985-2004[J]. Economics and Human Biology, 2009, 7(2):191-199. doi:  10.1016/j.ehb.2009.06.003
    [17] SOHN K. The height premium in Indonesia[J]. Economics and Human Biology, 2015, 16:1-15. doi:  10.1016/j.ehb.2013.12.011
    [18] YANG X, GAO J, LIU J H, et al. Height conditions salary expectations:Evidence from large-scale data in China[J]. Physica A, 2018, 501:86-97. doi:  10.1016/j.physa.2018.02.151
    [19] WEI X, TSANG M C, XU W, et al. Education and earnings in rural China[J]. Education Economics, 1999, 7(2):167-187. doi:  10.1080/09645299900000014
    [20] 马范文.教育程度与工资收入相关性的中外比较[J].广州大学学报:社会科学版. 2002, 1(4):90-93. http://d.old.wanfangdata.com.cn/Periodical/gzdxxb-shkxb200204019

    MA Fan-wen. Correlation between education and salary abroad and in China:a comparative study[J]. Journal of Guangzhou University (Social Science Edition), 2002, 1(4):90-93. http://d.old.wanfangdata.com.cn/Periodical/gzdxxb-shkxb200204019
    [21] GREGORIO J D, LEE J W. Education and income inequality:New evidence from cross-country data[J]. Review of Income and Wealth, 2002, 48(3):395-416. doi:  10.1111/roiw.2002.48.issue-3
    [22] DUSTMANN C, MEGHIR C. Wages, experience and seniority[J]. The Review of Economic Studies, 2005, 72(1):77-108. doi:  10.1111/0034-6527.00325
    [23] ALSULAMI H. The effect of education and experience on wages:the case study of Saudi Arabia[J]. American Journal of Industrial and Business Management, 2018, 8(1):129-142. doi:  10.4236/ajibm.2018.81008
    [24] GAO J, ZHOU T. Quantifying China's regional economic complexity[J]. Physica A, 2018, 492:1591-1603. doi:  10.1016/j.physa.2017.11.084
    [25] HEINECK G. Up in the skies? The relationship between body height and earnings in Germany[J]. Labour, 2005, 19(3):469-489. doi:  10.1111/labr.2005.19.issue-3
    [26] KIM T H, HAN E. Height premium for job performance[J]. Economics and Human Biology, 2017, 26:13-20. doi:  10.1016/j.ehb.2017.01.002
    [27] DING W W, MURRAY F, STUART T E. Gender differences in patenting in the academic life sciences[J]. Science, 2006, 313(5787):665-667. doi:  10.1126/science.1124832
  • [1] 张仕斌, 黄晨猗, 李晓瑜, 郑方聪, 李闯, 刘兆林, 杨咏熹.  量子模糊信息管理数学模型研究 . 电子科技大学学报, 2024, 53(2): 284-290. doi: 10.12178/1001-0548.2022355
    [2] 周丰丰, 孙燕杰, 范雨思.  基于miRNA组学的数据增强算法 . 电子科技大学学报, 2023, 52(2): 182-187. doi: 10.12178/1001-0548.2023002
    [3] 田晟兆, 胡迎茜, 谷成, 陈端兵.  知识与数据联合驱动建模技术综述 . 电子科技大学学报, 2023, 52(6): 932-943. doi: 10.12178/1001-0548.2022289
    [4] 聂敏, 罗炜敏, 邓辉, 王伟, 夏虎, 周涛.  高校学生心理健康情况对其社交网络结构的影响研究 . 电子科技大学学报, 2021, 50(2): 317-320. doi: 10.12178/1001-0548.2020032
    [5] 顾勤, 周涛.  数据要素流通的分账机制研究 . 电子科技大学学报, 2021, 50(3): 446-449. doi: 10.12178/1001-0548.2021005
    [6] 张仕斌, 黄曦, 昌燕, 闫丽丽, 程稳.  大数据环境下量子机器学习的研究进展及发展趋势 . 电子科技大学学报, 2021, 50(6): 802-819. doi: 10.12178/1001-0548.2021332
    [7] 聂敏, 张杨, 邓辉, 王伟, 夏虎, 周涛.  利用基本信息和行为数据发现高校贫困学生 . 电子科技大学学报, 2020, 49(5): 795-800. doi: 10.12178/1001-0548.2020139
    [8] 郑德生, 李晓瑜, 蔡竟业.  基于DS的电子战多信息PCA融合方案 . 电子科技大学学报, 2019, 48(3): 409-414. doi: 10.3969/j.issn.1001-0548.2019.03.016
    [9] 孙晶涛, 张秋余.  不均衡大数据集下的文本特征基因提取方法 . 电子科技大学学报, 2018, 47(1): 125-131. doi: 10.3969/j.issn.1001-0548.2018.01.019
    [10] 何兴高, 李蝉娟, 王瑞锦, 邓伏虎, 刘行.  基于信息熵的高维稀疏大数据降维算法研究 . 电子科技大学学报, 2018, 47(2): 235-241. doi: 10.3969/j.issn.1001-0548.2018.02.012
    [11] 王璞, 谭倩, 徐仲之, 鲁恒宇, 林涛.  城市公交网络运行演化分析与瓶颈甄别 . 电子科技大学学报, 2018, 47(3): 455-461. doi: 10.3969/j.issn.1001-0548.2018.03.021
    [12] 史定华.  网络科学中的互联网加——理念、评述和展望 . 电子科技大学学报, 2016, 45(4): 616-624. doi: 10.3969/j.issn.1001-0548.2016.04.014
    [13] 高见, 周涛.  大数据揭示经济发展状况 . 电子科技大学学报, 2016, 45(4): 625-633. doi: 10.3969/j.issn.1001-0548.2016.04.015
    [14] 蒋伟雄, 刘华生, 廖坚, 廖云杰, 唐艳, 王维.  多变量模式分析在反社会人格障碍中的应用 . 电子科技大学学报, 2014, 43(2): 296-300. doi: 10.3969/j.issn.1001-0548.2014.02.027
    [15] 周涛, 张子柯, 陈关荣, 汪小帆, 史定华, 狄增如, 樊瑛, 方锦清, 韩筱璞, 刘建国, 刘润然, 刘宗华, 陆君安, 吕金虎, 吕琳媛, 荣智海, 汪秉宏, 许小可, 章忠志.  复杂网络研究的机遇与挑战 . 电子科技大学学报, 2014, 43(1): 1-5. doi: 10.3969/j.issn.1001-0548.2014.01.001
    [16] 周涛.  网络大数据——复杂网络的新挑战: 如何从海量数据获取信息? . 电子科技大学学报, 2013, 42(1): 7-8. doi: 10.3969/j.issn.1001-0548.2013.01.004
    [17] 许小可, 刘肖凡.  网络科学的发展新动力:大数据与众包 . 电子科技大学学报, 2013, 42(6): 802-805. doi: 10.3969/j.issn.1001-0548.2013.06.001
    [18] 王璞, 黄智仁, 龚航.  大数据时代的交通工程 . 电子科技大学学报, 2013, 42(6): 806-816. doi: 10.3969/j.issn.1001-0548.2013.06.002
    [19] 徐力, 史少波, 王沁.  面向SDR应用的多核DSP低功耗设计 . 电子科技大学学报, 2012, 41(1): 136-141. doi: 10.3969/j.issn.1001-0548.2012.01.026
    [20] 井润田.  关于实验经济学中理性假定的研究 . 电子科技大学学报, 1999, 28(6): 591-595.
  • 加载中
图(5) / 表(2)
计量
  • 文章访问数:  4326
  • HTML全文浏览量:  1249
  • PDF下载量:  81
  • 被引次数: 0
出版历程
  • 收稿日期:  2018-05-10
  • 修回日期:  2018-08-30
  • 刊出日期:  2019-03-30

在线数据揭示预期薪金的影响因素

doi: 10.3969/j.issn.1001-0548.2019.02.023
    基金项目:

    国家自然科学基金 61703074

    国家自然科学基金 61673086

    作者简介:

    王军(1988-), 男, 博士生, 主要从事大数据分析等方面的研究.E-mail:junwang31@gmail.com

  • 中图分类号: TP391

摘要: 数据资源的丰富和分析方法的创新,促使社会经济学逐渐转变为数据驱动的定量化学科。作为定量化人力资源的组成部分,薪金研究对社会经济发展有重要意义。然而,以往研究大多基于规模有限的普查数据,对不同经济和文化背景的考虑也不足。本文基于中国人力资源网站获取的大规模简历数据,分析了多种因素对求职者预期薪金的影响,结果发现身高、工作经验和教育程度等因素影响预期薪金,并且男女存在显著的差异。其中,女性平均预期低于男性,相比男性差大约五年工作经验或一个教育学位。最后,多变量回归方法验证了分析结果的鲁棒性。

English Abstract

王军, 高见, 杨枭, 刘金虎, 周涛. 在线数据揭示预期薪金的影响因素[J]. 电子科技大学学报, 2019, 48(2): 307-314. doi: 10.3969/j.issn.1001-0548.2019.02.023
引用本文: 王军, 高见, 杨枭, 刘金虎, 周涛. 在线数据揭示预期薪金的影响因素[J]. 电子科技大学学报, 2019, 48(2): 307-314. doi: 10.3969/j.issn.1001-0548.2019.02.023
WANG Jun, GAO Jian, YANG Xiao, LIU Jin-hu, ZHOU Tao. Online Data Reveal Key Factors on Salary Expectation[J]. Journal of University of Electronic Science and Technology of China, 2019, 48(2): 307-314. doi: 10.3969/j.issn.1001-0548.2019.02.023
Citation: WANG Jun, GAO Jian, YANG Xiao, LIU Jin-hu, ZHOU Tao. Online Data Reveal Key Factors on Salary Expectation[J]. Journal of University of Electronic Science and Technology of China, 2019, 48(2): 307-314. doi: 10.3969/j.issn.1001-0548.2019.02.023
  • 数据资源和分析方法的创新为社会经济和人力资源管理等相关领域的定量化分析提供了新思路[1]。一方面,在线信息平台广泛收集和存储了大量的社会经济数据[2]。另一方面,跨学科交叉研究催生了很多新的分析工具[3]。利用这些新工具定量分析在线数据,能够揭示社会经济状态[4]、绘制全球贫穷地图[5]、刻画产业结构[6-7]、感知城市发展不平衡[8]、制定经济发展策略[9-10]、推断个体财富状况[11]和预测个体失业率[12-13]等。在定量化人力资源方面,不仅升职和离职对员工的发展很重要[14],薪金水平更加直接影响到员工的生活水平和工作热情,也进一步影响组织的工作效率[15]

    薪金对社会经济发展有非常重要的作用,能够配置劳动力资源。反过来,薪金也受很多社会经济因素影响。在身高因素上,文献[16]发现薪金与身高呈非线性关系,高于平均身高的员工有明显的薪金优势;文献[17]发现增加10 cm身高能分别增加男性8%和女性13%的薪金;文献[18]发现身高对女性预期薪金的影响大于男性。在教育因素上,文献[19]发现受教育水平对收入有显著正向的影响;文献[20]发现我国教育水平和薪金收入总体上呈正相关关系;文献[21]发现高等教育率和教育公平对于改善收入平等性至关重要。在工作经验方面,文献[22]发现技术工人的企业任职和工作经验对薪金收入有正面作用;文献[23]发现有15~20年企业工作经验的、自然科学专业毕业的女博士拥有最高的薪金收入。

    虽然已经有一些针对薪金影响因素的分析,但这些研究一般基于规模有限的问卷和普查数据[1],且大多关注单一变量的影响,针对中国背景下的研究也不足。中国虽然近些年经济发展快、经济复杂性高[24],但发展不平衡,直接影响不同地区的薪金水平。更为重要的是,以往的研究一般使用实际薪金数据,无法剔除职场中普遍存在的身高和性别歧视对薪金的影响[18]。如今,得益于互联网和信息技术的发展,已经能够获得非干预的大规模数据,可以全面分析预期薪金的影响因素。

    本文基于人力资源网站收集的14余万求职者简历数据,分析了影响中国求职者预期薪金的核心因素。结果发现,预期薪金存在明显的性别差异,男性的平均预期薪金高于女性;求职者的身高、以往工作经验、受教育程度和期望工作地的经济发展水平对预期薪金有显著影响;最后,本文使用多变量回归验证了分析结果的鲁棒性。

    • 本文的简历数据来源于中国的两大人力资源服务商,即前程无忧网站(http://www.51job.com)和中华英才网站(http://www.chinahr.com)。求职者在使用人力资源服务平台寻找工作时,需要在线提交求职简历,公开个人基本信息和预期薪金,HR根据这些公开信息筛选合适的求职者。本文于2014年从这两大招聘网站上爬取公开的简历信息,涵盖来自中国大陆31个省份的142 190位求职者。

      简历数据主要是求职者主动公开的个人信息,包括性别(gender)、出生日期、身高(height)、工作经历、毕业院校(school)、获得学位(degree)、求职省份和预期薪金(salary)。根据出生日期,计算得到年龄(age);根据工作经历,计算得到工龄(seniority)。毕业院校根据教育部文件分为4类进行数值化:4代表“985工程”院校(985 PRG),3代表“211工程”院校(211 PRG),2代表普通高等院校(college),1代表其他院校(others)。获得学位分为4类,同样进行数值化:4代表博士学位(PhD),3代表硕士学位(master),2代表学士学位(bachelor),1代表其他学位(others)。求职省份涵盖31个中国大陆的省份、直辖市和自治区,省份名称和缩写见文献[18]。

      为了保障样本数量中有足够的合理预期薪金的普通求职者,本文通过限定求职者的身高和预期薪金来筛选数据,剔除不符合限定的数据。其中,男性的身高范围限定为[160, 185] cm,女性的身高范围限定为[150, 175] cm;预期薪金的范围限定为[1 000, 50 000]元/月。如表 1所示,使用数据涵盖141 064人,包括78 413位男性和62 651位女性;男性平均身高高于女性;男性的平均工龄和年龄都大于女性;男性的平均教育水平高于女性,男性毕业于更好的学校、取得更高的学位;男性的平均预期薪金为8 039元/月,明显高于女性的5 017元/月。

      表 1  简历数据的统计信息

      性别 样本数量 身高/cm 年龄/岁 工龄/年 学校 学位 预期薪金/元
      78 413 173.39 29.67 5.48 2.31 1.81 8 039
      [160, 185] [18, 66] [0, 36] [1, 4] [1, 4] [1 000, 50 000]
      62 651 162.04 27.64 3.80 2.21 1.77 5 017
      [150, 175] [18, 57] [0, 31] [1, 4] [1, 4] [1 000, 50 000]
      注:学校和学位为向量化后的数值。

      在对预期薪金进行自然对数运算之后,男性和女性的预期薪金呈现正态分布。也就是说,自然对数的预期薪金$\log {\text{(salary}})$服从以$\mu $为平均值、$\sigma $为标准差的正态分布$\operatorname{l} {\text{og(salary)}} \sim N(\mu ,{\sigma ^2})$。如图 1所示,自然对数运算之后的预期薪金,可以很好地被正态分布拟合(${\text{Adj}}.{\text{ }}{R^2} \approx 0.85$);男性的平均预期薪金($\mu = 8.65$)高于女性的平均值($\mu = 8.25$);男性的预期薪金分布更宽广($\sigma = 0.58$),女性的预期薪金分布更集中($\sigma = 0.47$)。

      图  1  预期薪金的分布

      除了简历数据,后续分析还使用了省份的经济发展数据,来源于《中国统计年鉴-2015》,由国家统计局(http://www.stats.gov.cn)编纂,发布全国31个省份在2014年的人均生产总值(GDPpc)数据。

    • 在挖掘预期薪金的核心影响因素方面,首先采用统计分析方法,分析单个或同一类变量对预期薪金${\text{log(salary)}}$的影响,包括身高(${\text{height}}$)、工作经验(${\text{age}}$和${\text{seniority}}$)、教育程度(${\text{school}}$和${\text{degree}}$)和地理经济(${\text{GDPpc}}$)等相关变量。然后,使用多变量回归分析方法验证结果的鲁棒性,并比较各个变量对预期薪金影响的性别差异。

      多变量分析方法采用普通最小二乘(ordinary least square, OLS)回归模型,被解释变量为预期薪金${\text{log(salary)}}$,解释变量为影响预期薪金的各个变量。由于教育水平中的${\text{school}}$和${\text{degree}}$都是分类变量,所以将他们作为虚拟变量(dummy variable)引入回归模型。为了比较解释变量对于男性和女性预期薪金的影响,分析男性和女性回归结果的截距和斜率差异,本文在混合样本(pooled sample)上进行回归,控制男性和女性在回归分析中的残差变化一致。

      在回归方程中,将女性${\text{(female)}}$作为虚拟变量,其他解释变量与${\text{female}}$形成交叉项(interaction term),所估计的回归方程如下:

      $$\begin{gathered} \log {\text{(salary)}} = \varepsilon + {\beta _0} + {\delta _0}{\text{female}} + \\ {\beta _1}{\text{height}} + {\delta _1}{\text{female}} \cdot {\text{height}} + \\ {\beta _2}{\text{age}} + {\delta _2}{\text{female}} \cdot {\text{age}} + \\ {\beta _3}{\text{seniority}} + {\delta _3}{\text{female}} \cdot {\text{seniority}} + \\ {\beta _4}{D^{{\text{school}}}} + {\delta _4}{\text{female}} \cdot {D^{{\text{school}}}} + \\ {\beta _5}{D^{{\text{degree}}}} + {\delta _5}{\text{female}} \cdot {D^{{\text{degree}}}} + \\ {\beta _6}\log ({\text{GDPpc}}) + {\delta _6}{\text{female}} \cdot \log ({\text{GDPpc}}) \\ \end{gathered} $$

      式中,${\text{female}} = 0$对应于基准的男性组;$\beta $为解释变量对于男性预期薪金的回归系数;$\delta $为相应解释变量在男女回归系数上的差异;${D^{{\text{school}}}}$为学校的虚拟变量;${D^{{\text{degree}}}}$为学位的虚拟变量;$\varepsilon $为误差项。

    • 实验中首先依次分析身高、工作经验、教育水平和经济地理对男女预期薪金的影响,考虑单个或同一类变量的作用。然后,利用多变量回归模型,验证分析结果的鲁棒性,定量刻画和比较男女预期薪金影响因素的不同,侧重于性别差异。

    • 首先,考虑男性和女性求职者的身高分布。如图 2a图 2b所示,男女的身高频率分布都可以很好地通过正态分布拟合${\text{(Adj}}{\text{. }}{R^2} \approx 0.40)$,但男性和女性的身高分布存在明显差异。具体而言,男性的平均身高$(\mu = 173.21)$显著高于女性的平均身高$(\mu = 161.64)$;男性身高的分布更宽广$(\sigma = 4.49)$,而女性身高的分布更狭窄$(\sigma = 3.68)$。

      图  2  身高对预期薪金的影响(a、b中条形图为概率分布,实线为正态拟合曲线;c、d中条形图为平均值,误差线为标准误,实线为拟合直线)

      然后,分析身高对预期薪金的影响。如图 2c图 2d所示,平均预期薪金与平均身高呈现线性关系(男性:${\text{Adj}}{\text{. }}{R^2} \approx 0.87$,女性:${\text{Adj}}{\text{. }}{R^2} \approx 0.95$)。不论对于男女,求职者的平均身高越高,平均预期薪金越高,存在Height Premium现象[25-26]。女性拟合直线的斜率(${\text{Slope = 0}}{\text{.011 5}}$)显著高于男性拟合直线的斜率(${\text{Slope = 0}}{\text{.007 9}}$),说明身高对女性预期薪金的影响大于身高对于男性预期薪金的影响。

    • 通过年龄和工龄(${\text{age}}$和${\text{seniority}}$)来近似估计求职者的工作经验,两者数值越大,则代表工作经验越丰富。如图 3a所示,随着平均年龄的增加,平均预期薪金增加,男女预期薪金的差异也增大。其中,21~25岁男性平均预期薪金与26~30岁女性相当,31~35岁男性平均预期薪金与41~45岁女性相当。如图 3b所示,以37岁左右为界,预期薪金首先随着年龄的增加而线性增长,然后稳中有增。

      图  3  工作经验对预期薪金的影响(误差线表示标准误,竖直虚线对应曲线拐点处的年龄和工龄)

      工龄同样显著影响预期薪金。如图 3c所示,随着平均工龄的增加,平均预期薪金增加,男女的差异基本保持一致。如果男女要有相近的预期薪金,那么女性比男性要增加5年以上的工龄。其中,1~5年工龄男性平均预期薪金与6~10年工龄女性相当,6~10年工龄男性平均预期薪金与11~15年工龄女性相当。如图 3d所示,以15年工龄为界,预期薪金首先随着工龄则增加而线性增长,然后基本保持平稳。

    • 通过毕业院校${\text{(school)}}$和获得学位${\text{(degree)}}$来估计求职者的教育程度,分析预期薪金受教育程度的影响。如图 4a所示,求职者的毕业院校越好,平均预期薪金越高。毕业院校对男女预期薪金的影响存在显著差异,普通高校(college)毕业的男性与“985工程”院校(985PRG)毕业的女性有相近的预期薪金,其他院校(others)毕业的男性与“211工程”院校(211PRG)毕业的女性有相近的预期薪金。

      图  4  教育水平对预期薪金的影响(a、b中条形图表示平均值,误差线表示标准误)

      预期薪金显著受到获得学位的影响。如图 4b所示,随着学位的增加,平均预期薪金增加。女性的预期薪金比男性相差一个学位,如:女性硕士(master)与男性本科(bachelor)的预期薪金相当,女性博士(PhD)与男性硕士(master)的预期薪金相当。事实上,毕业院校和获得学位共同影响预期薪金。如图 4c图 4d所示,工作经验对男女的影响有显著差异,男性预期薪金普遍高于女性。其中,“985”工程院校毕业的女性博士与“211工程”院校毕业的男性硕士有相近的预期薪金。

    • 预期薪金与地理经济状况紧密相关。一般而言,期望工作地的经济发展水平越高,求职者的预期薪金越高。如图 5a图 5b所示,不论对于男性还是女性,他们的平均预期薪金都随着期望工作地人均GDP的增加而增加,即两者存在显著的正相关。其中,男性的皮尔森相关系数($r = 0.633{\text{ }}6$)大于女性的皮尔森相关系数($r = 0.467{\text{ }}0$),说明男性预期薪金与期望工作地经济发展水平更加相关。线性拟合的结果显示,男性拟合直线的斜率(${\text{Slope}} = 0.310{\text{ }}8$)大于女性拟合直线的斜率(${\text{Slope}} = 0.222{\text{ }}5$),说明期望工作地的经济水平对男性预期薪金的影响大于女性。

      图  5  地理经济对预期薪金的影响(a、b中实线为拟合直线,数据标签为省份缩写;c、d中期望工作地人均GDP从高到低等分为4段:Top、Upper、Lower和Bottom;条形图表示平均值,误差线为标准误)

      为了更加细致地分析期望工作地的经济发展水平对求职者预期薪金的影响,将预期工作地按照人均GDP从高到低等分为4段,计算相应期望工作地的平均预期薪金。如图 4c图 4d所示,男性和女性的结果有同样的规律。具体而言,求职者在经济发展水平后50%的期望工作地(即Lower和Bottom)有相同的预期薪金,随着期望工作地经济发展水平提高到前50%(即Upper和Top),预期薪金显著增加。

    • 为了检验分析结果的鲁棒性,定量对比解释变量对男性和女性预期薪金影响上的差异,在男女混合样本上采用多变量回归模型。回归分析中的被解释变量为预期薪金${\text{log(salary)}}$,解释变量包括身高(${\text{height}}$)、工作经验(${\text{age}}$和${\text{seniority}}$)、教育程度(${\text{school}}$和${\text{degree}}$)和地理经济(${\text{GDPpc}}$)。其中,${\text{school}}$和${\text{degree}}$作为虚拟变量引入回归方程。

      表格1总结了回归分析结果。在没有控制任何其他变量时,从表格第1列看到,身高对于男性预期薪金有显著正向的影响(${\beta _1} = 0.007{\text{ }}2$),身高对女性的影响显著高于男性(${\delta _1} = 0.005{\text{ }}7$),女性的平均预期薪金显著低于男性(${\delta _0} = - 1.243{\text{ }}1$)。当只考虑工作经验的影响时,从表格第2列看到,年龄对男性有显著正向影响(${\beta _2} = 0.070{\text{ }}6$)的同时,工龄有显著负向影响(${\beta _3} = 0.003{\text{ }}0$);年龄对女性的影响显著小于男性(${\delta _2} = - 0.009{\text{ }}9$)。当同时考虑身高和工作经验的影响时,如表格第3列所示,男女的平均预期薪金没有显著差异。当增加考虑教育程度时,从表格第4列看到,身高的影响降低,男女差异不显著;年龄的影响降低,工龄的影响增加但男女差异不显著。

      表 2  预期薪金的最小二乘法回归分析结果

      变量 OLS Regression Model with Dependent Variable: log(salary)
      (1) (2) (3) (4) (5) (6) (7) (8)
      female -1.243 1*** 0.018 2 -0.151 4 0.019 5 -3.469 6*** -3.628 0*** -3.145 5*** -1.718 0***
      (0.128 1) (0.026 5) (0.118 1) (0.173 9) (0.084 5) (0.142 3) (0.193 2) (0.178 6)
      height 0.007 2*** 0.011 6*** 0.009 2*** 0.005 4*** 0.003 0*** 0.007 5***
      (0.000 5) (0.000 4) (0.000 4) (0.000 5) (0.000 4) (0.000 4)
      female·height 0.005 7*** 0.002 0*** 0.000 3 0.002 2*** 0.001 0 -0.002 1***
      (0.000 8) (0.000 7) (0.000 7) (0.000 8) (0.000 7) (0.000 6)
      age 0.070 6*** 0.071 1*** 0.048 1*** 0.048 2***
      (0.000 6) (0.000 6) (0.000 7) (0.000 7)
      female·age -0.009 9*** -0.010 4*** -0.008 3*** -0.010 5***
      (0.001 0) (0.001 0) (0.001 1) (0.001 1)
      seniority -0.003 0*** -0.002 6*** 0.020 5*** 0.020 9***
      (0.000 7) (0.000 7) (0.000 7) (0.000 7)
      female·seniority -0.002 2* -0.002 3** -0.001 4 -0.000 2
      (0.001 2) (0.001 2) (0.001 2) (0.001 2)
      GDPpc 0.314 1*** 0.311 9*** 0.294 7*** 0.307 7***
      (0.004 6) (0.004 6) (0.004 3) (0.003 9)
      female·GDPpc 0.277 3*** 0.265 2*** 0.227 4*** 0.193 4***
      (0.007 6) (0.007 7) (0.007 4) (0.006 7)
      Dschool NO NO NO YES NO NO YES YES
      Ddegree NO NO NO YES NO NO YES YES
      Constant 7.485 5*** 6.661 9*** 4.636 1*** 5.393 0*** 5.227 2*** 4.312 2*** 4.583 9*** 2.237 7***
      (0.081 7) (0.016 5) (0.075 7) (0.073 4) (0.051 0) (0.091 8) (0.087 4) (0.081 5)
      Observations 141 064 141 064 141 064 141 064 141 064 141 064 141 064 141 064
      F 4 914 10 348 7 658 3 663 8 148 4 960 2 543 4 052
      Adj.R2 0.094 6 0.268 3 0.275 4 0.330 3 0.147 7 0.149 5 0.234 5 0.376 2
      RMSE 0.634 2 0.570 1 0.567 4 0.545 4 0.615 3 0.614 6 0.583 1 0.526 4
      注:回归分析在男女混合样本上使用基于最小二乘的多变量回归模型,female=0对应于基准的男性组。DschoolDdegree分别表示毕业院校和获得学位的虚拟变量。如果标记为YES,则表示考虑在回归分析中;如果标记为NO,则表示没有考虑在回归分析中。表格中是变量的回归系数,括号中是标准误。统计显著性水平为:* p < 0.1, ** p < 0.05, *** p < 0.01。

      当仅考虑期望工作地经济发展水平时,如表格第5列所示,人均GDP显著正向影响平均预期薪金(${\beta _6} = 0.314{\text{ }}1$),对于女性的影响程度显著高于对于男性的影响程度(${\delta _6} = 0.277{\text{ }}3$)。当增加考虑身高和教育水平的影响时,这些结果得到保持(见表格第6列和第7列)。当考虑所有解释变量的影响时,如表格第8列所示,女性的预期薪金显著低于男性(${\delta _0} = - 1.718{\text{ }}0$);身高、年龄、工龄和经济地理都对预期薪金有显著正向影响。其中,身高和年龄对女性影响小于男性,工龄对男女的影响没有显著差异,经济地理对女性影响大于男性。所有的解释变量在一起,能够最大程度的解释预期薪金,解释能力可以达到${\text{Adj}}.{\text{ }}{R^2} \approx 0.376{\text{ }}2$,即所有变量可以解释37.62%的预期薪金的变化。

    • 本文基于求职者简历数据对预期薪金的影响因素进行了全面的分析。结果发现,性别、身高、工作经验、教育程度和地理经济等因素显著影响求职者的预期薪金。具体而言,男性的平均预期薪金高于女性;身高与平均预期薪金正相关,身高对女性的影响大于男性;平均预期薪金随年龄和工龄的增加而增加,但达到37岁年龄和15年工龄之后保持稳定;毕业院校越好、获得学位越高,预期薪金越高,并且女性预期薪金与男性相比相差一个学位;期望工作地经济发展水平越高,求职者预期薪金越高。多变量回归分析结果显示,性别对预期薪金的影响显著,身高和年龄对女性影响小于男性,工龄的影响没有显著差异,经济地理对女性影响大于男性。

      单变量以及回归分析结果显示,男性和女性在预期薪金上存在显著差异。如果男性和女性要达到相近的预期薪金,在工作经验上,女性需要比男性要增加5年以上的工龄,如:有6~10年工龄的女性与有1~5年工龄的男性有相近的预期薪金;在教育程度上,女性需要比男性多读一个学位,如:女性硕士与男性学士有相当的预期薪金。

      性别不平等问题一直是社会关注的热点之一。本文的分析结果也揭露出职场中潜在存在的性别不平等现象[27]。在呼吁社会共同努力消除男女不平等的同时,更希望女性同胞增加职场自信。在性别和身高等先天条件不能改变的情况下,通过增加工作经验和教育经历来提升自身能力,更加自信和主动地争取职场平等待遇。

参考文献 (27)

目录

    /

    返回文章
    返回