关键词:价格指数;;随机森林;;最小二乘支持向量机回归;;遗传算法;;粒子群算法
摘 要:随着中国经济的高速发展,房地产行业迅速崛起,俨然成为国民经济的支柱产业,特别是近十年来,全国各地房价持续上涨,受到了全社会的广泛关注。超高的商品房价格对国家宏观经济的运行状况和国民的生活质量有着极大的影响,因此,对商品房价格指数的准确把握有助于在国家和地方层面适时做出科学合理的决策。注意到,传统的商品房价格指数数据大多来源于国家统计局系统,其调查数据存在着严重的滞后性,从而影响预测的有效性。随着互联网的普及,人们在做各项消费和投资决策时更习惯于参考网络搜索的结果,大数据时代背景下对网络搜索数据的挖掘和分析可实现市场需求和消费者行为趋势的精准预测,具有巨大的商业价值和发展潜力。本文利用Python在百度指数上爬取与昆明商品房价格指数相关的68个关键词,并基于相关系数和随机森林筛选出最终的10个关键词:楼盘网、小户型装修效果图、房贷利率上调、中国建材市场、中国建材网、住房公积金贷款、住房按揭贷款利率、租房合同、昆明搜房网、昆明租房。我们将这10个关键词作为预测变量。采用遗传算法和粒子群算法分别优化最小二乘支持向量机回归里的参数,结果表明粒子群算法得到的参数误差相对更小。因此,本文最后利用粒子群算法优化的最小二乘支持向量机回归对昆明商品房价格指数进行预测,得到的预测结果显著,模型拟合度R~2为0.9441,平均绝对误差为0.6617,均方误差为0.8073。结果表明,消费者对关键词的搜索行为确实是房产交易行为的一种体现,在很大程度上能够影响消费者的某种决策和行为。另外,利用关键词去预测房价指数可以为政府部门科学制定相应的政策提供一定的参考依据,也可以为相关从业人员提供更好的指导。
内 容:原文可通过湖北省科技信息共享服务平台(http://www.hbstl.org.cn)获取