留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

移动用户人口统计信息预测

王亦雷 嵇智源 夏勇 秦臻 程红蓉

王亦雷, 嵇智源, 夏勇, 秦臻, 程红蓉. 移动用户人口统计信息预测[J]. 电子科技大学学报, 2015, 44(6): 917-920. doi: 10.3969/j.issn.1001-0548.2015.06.021
引用本文: 王亦雷, 嵇智源, 夏勇, 秦臻, 程红蓉. 移动用户人口统计信息预测[J]. 电子科技大学学报, 2015, 44(6): 917-920. doi: 10.3969/j.issn.1001-0548.2015.06.021
WANG Yi-lei, JI Zhi-yuan, XIA Yong, QIN Zhen, CHENG Hong-rong. Demographic Information Prediction for Mobile Users[J]. Journal of University of Electronic Science and Technology of China, 2015, 44(6): 917-920. doi: 10.3969/j.issn.1001-0548.2015.06.021
Citation: WANG Yi-lei, JI Zhi-yuan, XIA Yong, QIN Zhen, CHENG Hong-rong. Demographic Information Prediction for Mobile Users[J]. Journal of University of Electronic Science and Technology of China, 2015, 44(6): 917-920. doi: 10.3969/j.issn.1001-0548.2015.06.021

移动用户人口统计信息预测

doi: 10.3969/j.issn.1001-0548.2015.06.021
详细信息
  • 中图分类号: TP393

Demographic Information Prediction for Mobile Users

  • 摘要: 提出了一种基于支持向量机的预测方法,通过分析智能手机应用的使用情况,预测用户的人口统计信息。手机使用行为数据约为5万智能手机用户在3个月期间使用手机应用产生的网络日志文件,包括179 954 181条日志记录。通过对日志记录的主题进行分析,可将179 954 181条日志记录匹配到266个不同的主题。在此基础上,通过将每个用户的人口统计信息与该用户对266个不同主题的访问权重进行关联,可构建训练数据,并代入支持向量机模型进行计算。实验结果表明该方法对用户的性别和年龄预测能够取得良好的预测结果。
  • [1] HANNAK A, SAPIEZYNSKI P, MOLAVI K A, et al. Measuring personalization of web search[C]//Proceedings of the 22nd International Conference on World Wide Web. Switzerland: International World Wide Web Conferences Steering Committee, 2013: 527-538.
    [2] SMIT E G, VAN N G, VOORVELD H A M. Understanding online behavioural advertising: User knowledge, privacy concerns and online coping behaviour in Europe[J]. Computers in Human Behavior, 2014, 32: 15-22.
    [3] JANSEN B J, MOORE K, CARMAN S. Evaluating the performance of demographic targeting using gender in sponsored search[J]. Information Processing & Management, 2013, 49(1): 286-302.
    [4] GARERA N, YAROWSKY D. Modeling latent biographic attributes in conversational genres[C]//Proceedings of the Joint Conference of the 47th Annual Meeting of the ACL and the 4th International Joint Conference on Natural Language Processing of the AFNLP. Stroudsburg: Association for Computational Linguistics, 2009: 710-718.
    [5] YAN X, YAN L. Gender classification of weblog authors[C]//AAAI Spring Symposium: Computational Approaches to Analyzing Weblogs. California: AAAI, 2006: 228-230.
    [6] BURGER J D, HENDERSON J, KIM G, et al. Discriminating gender on twitter[C]//Proceedings of the Conference on Empirical Methods in Natural Language Processing. Stroudsburg: Association for Computational Linguistics, 2011: 1301-1309.
    [7] WEBER I, CASTILLO C. The demographics of web search[C]//Proceedings of the 33rd International ACM SIGIR Conference on Research and Development in Information Retrieval. New York: ACM Press, 2010: 523-530.
    [8] WEBER I, JAIMES A. Demographic information flows[C]// Proceedings of the 19th ACM International Conference on Information and Knowledge Management. New York: ACM Press, 2010: 1521-1524.
    [9] HU J, ZENG H J, LI H, et al. Demographic prediction based on user's browsing behavior[C]//Proceedings of the 16th International Conference on World Wide Web. New York: ACM Press, 2007: 151-160.
    [10] KABBUR S, HAN E H, KARYPIS G. Content-based methods for predicting web-site demographic attributes [C]//2010 IEEE 10th International Conference on Data Mining (ICDM). Sydney: IEEE Press, 2010: 863-868.
    [11] BREESE J S, HECKERMAN D, KADIE C. Empirical analysis of predictive algorithms for collaborative filtering[C]//Proceedings of the Fourteenth Conference on Uncertainty in Artificial Intelligence. San Francisco: Morgan Kaufmann Publishers Inc, 1998: 43-52.
    [12] SARWAR B, KARYPIS G, KONSTAN J, et al. Application of dimensionality reduction in recommender system-a case study[R]. Minneapolis: Dept of Computer Science Univ of Minnesota, 2000.
    [13] KOREN Y. Factorization meets the neighborhood: a multifaceted collaborative filtering model[C]//Proceedings of the 14th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM Press, 2008: 426-434.
    [14] PRYOR M H. The effects of singular value decomposition on collaborative filtering[R]. Hanover: Dartmouth College, 1998.
    [15] GOLUB G H, VAN LOAN C F. Matrix computations[M]. Maryland: Johns Hopkins University Press, 2012.
    [16] JOACHIMS T. Making large scale SVM learning practical[R]. Dortmund: Universitat Dortmund,1999.
    [17] LECHEVALLIER Y, SAPORTA G. Blum MGB choosing the summary statistics and the acceptance rate in approximate Bayesian computation[C]//Proceedings of Computational Statistics. Herdelberg: Springer, Physica Verlag, 2010: 47-56
  • [1] 黄一鸣, 雷航, 周瑞, 桑楠.  基于手机传感器的握持方式判断及运动状态识别 . 电子科技大学学报, 2017, 46(2): 399-406. doi: 10.3969/j.issn.1001-0548.2017.02.014
    [2] 张静, 刘忠宝.  基于流形判别分析的全局保序学习机 . 电子科技大学学报, 2015, 44(6): 911-916. doi: 10.3969/j.issn.1001-0548.2015.06.020
    [3] 何海江.  截断误差的光滑型支持向量顺序回归 . 电子科技大学学报, 2014, 43(1): 131-136. doi: 10.3969/j.issn.1001-0548.2014.01.022
    [4] 高军峰, 张文佳, 杨勇, 胡佳佳, 陶春毅, 官金安.  基于P300和极限学习机的脑电测谎研究 . 电子科技大学学报, 2014, 43(2): 301-306. doi: 10.3969/j.issn.1001-0548.2014.02.028
    [5] 刘忠宝.  新型支持向量机在风速预测模型中的应用研究 . 电子科技大学学报, 2014, 43(5): 754-757. doi: 10.3969/j.issn.1001-0548.2014.05.021
    [6] 刘忠宝, 王士同.  面向大规模数据的隐私保护学习机 . 电子科技大学学报, 2013, 42(2): 272-276. doi: 10.3969/j.issn.1001-0548.2013.02.018
    [7] 丁世飞, 齐丙娟, 谭红艳.  支持向量机理论与算法研究综述 . 电子科技大学学报, 2011, 40(1): 2-10. doi: 10.3969/j.issn.1001-0548.2011.01.001
    [8] 李星毅, 李奎, 施化吉, 周双全.  背景值优化的GM(1,1)预测模型及应用 . 电子科技大学学报, 2011, 40(6): 911-914. doi: 10.3969/j.issn.1001-0548.2011.06.020
    [9] 张雪芹, 顾春华, 吴吉义.  异常检测中支持向量机最优模型选择方法 . 电子科技大学学报, 2011, 40(4): 559-563. doi: 10.3969/j.issn.1001-0548.2011.04.017
    [10] 滕云龙, 师奕兵, 郑植.  接收机钟差灰色马尔可夫预测模型研究 . 电子科技大学学报, 2011, 40(2): 242-245. doi: 10.3969/j.issn.1001-0548.2011.02.017
    [11] 何海江, 陈姝.  由排序支持向量机抽取博客文章的摘要 . 电子科技大学学报, 2010, 39(4): 593-597. doi: 10.3969/j.issn.1001-0548.2010.04.026
    [12] 陈其松, 陈孝威, 张欣, 吴茂念.  优化SVM在锅炉负荷预测中的应用 . 电子科技大学学报, 2010, 39(2): 316-320. doi: 10.3969/j.issn.1001-0548.2010.02.035
    [13] 向国齐, 严志坚, 黄大贵.  支持向量机替代模型的遗传优化设计 . 电子科技大学学报, 2009, 38(3): 459-462. doi: 10.3969/j.issn.1001-0548.2009.03.034
    [14] 唐艳, 柳建新, 龚安栋.  ICA+CSSD的脑-机接口分类 . 电子科技大学学报, 2008, 37(3): 466-469.
    [15] 徐图, 罗瑜, 何大可.  多类支持向量机的DDoS攻击检测的方法 . 电子科技大学学报, 2008, 37(2): 274-277.
    [16] 胡丹, 肖建, 车畅.  再生核支持向量机在非线性系统中的应用 . 电子科技大学学报, 2008, 37(1): 124-127.
    [17] 祝金荣, 胡望斌.  聚类电价预测方法研究 . 电子科技大学学报, 2007, 36(6): 1278-1281.
    [18] 周巧临, 傅彦.  科学数据时间序列的预测方法 . 电子科技大学学报, 2007, 36(6): 1260-1263.
    [19] 王勇, 许录平.  独立成分分析和支持向量机的虹膜识别方法 . 电子科技大学学报, 2007, 36(3): 583-586.
    [20] 周鸣争, 汪军.  基于支持向量机的传感器非线性误差校正 . 电子科技大学学报, 2006, 35(2): 242-245.
  • 加载中
计量
  • 文章访问数:  4667
  • HTML全文浏览量:  132
  • PDF下载量:  462
  • 被引次数: 0
出版历程
  • 刊出日期:  2015-12-15

移动用户人口统计信息预测

doi: 10.3969/j.issn.1001-0548.2015.06.021
  • 中图分类号: TP393

摘要: 提出了一种基于支持向量机的预测方法,通过分析智能手机应用的使用情况,预测用户的人口统计信息。手机使用行为数据约为5万智能手机用户在3个月期间使用手机应用产生的网络日志文件,包括179 954 181条日志记录。通过对日志记录的主题进行分析,可将179 954 181条日志记录匹配到266个不同的主题。在此基础上,通过将每个用户的人口统计信息与该用户对266个不同主题的访问权重进行关联,可构建训练数据,并代入支持向量机模型进行计算。实验结果表明该方法对用户的性别和年龄预测能够取得良好的预测结果。

English Abstract

王亦雷, 嵇智源, 夏勇, 秦臻, 程红蓉. 移动用户人口统计信息预测[J]. 电子科技大学学报, 2015, 44(6): 917-920. doi: 10.3969/j.issn.1001-0548.2015.06.021
引用本文: 王亦雷, 嵇智源, 夏勇, 秦臻, 程红蓉. 移动用户人口统计信息预测[J]. 电子科技大学学报, 2015, 44(6): 917-920. doi: 10.3969/j.issn.1001-0548.2015.06.021
WANG Yi-lei, JI Zhi-yuan, XIA Yong, QIN Zhen, CHENG Hong-rong. Demographic Information Prediction for Mobile Users[J]. Journal of University of Electronic Science and Technology of China, 2015, 44(6): 917-920. doi: 10.3969/j.issn.1001-0548.2015.06.021
Citation: WANG Yi-lei, JI Zhi-yuan, XIA Yong, QIN Zhen, CHENG Hong-rong. Demographic Information Prediction for Mobile Users[J]. Journal of University of Electronic Science and Technology of China, 2015, 44(6): 917-920. doi: 10.3969/j.issn.1001-0548.2015.06.021
参考文献 (17)

目录

    /

    返回文章
    返回