用Python告诉你深圳房租有多高
2018-11-09 来源:raincent
概述
前言
统计结果
爬虫技术分析
爬虫代码实现
爬虫分析实现
后记
前言
最近各大一二线城市的房租都有上涨,究竟整体上涨到什么程度呢?我们也不得而知,于是乎 为了一探究竟,便用 Python 爬取了房某下的深圳的租房数据,以下是本次的样本数据:
样本数据
除去【不限】的数据(因为可能会与后面重叠),总数据量为 16971 ,其中后半部分地区数据量偏少,是由于该区房源确实不足。因此,此次调查也并非非常准确,权且当个娱乐项目,供大家观赏。
统计结果
我们且先看统计结果,然后再看技术分析。
深圳房源分布:(按区划分)
其中福田与南山的房源分布是最多的。但这两块地的房租可是不菲啊。
房源分布
房租单价:(每月每平方米单价 -- 平均数)
即是 1 平方米 1 个月的价格。方块越大,代表价格越高。
房租单价:平方米/月
可以看出福田与南山是独占鳌头,分别是 114.874 与 113.483 ,是其他地区的几倍。如果租个福田 20 平方的房间:
114.874 x 20 = 2297.48
再来个两百的水电、物业:
2297.48 + 200 = 2497.48
我们节俭一点来算的话,每天早餐 10 块,中午 25 块,晚饭 25 块:
2497.48 + 50 x 30 = 3997.48
是的,仅仅是活下来就需要 3997.48 块。
隔断时间下个馆子,每个月买些衣服,交通费,谈个女朋友,与女朋友出去逛街,妥妥滴加个 3500
3997.48 + 3500 = 7497.48
给爸妈一人一千:
7497.48 + 2000 = 9497.48
月薪一万妥妥滴,变成了月光族。
房租单价:(每日每平方米单价 -- 平均数)
即是 1 平方米 1 天的价格。
租房单价:平方米/日
以前在乡下没有寸土寸金的感觉,那么可以到北上广深体验一下,福田区每平方米每天需要 3.829 元。[捂脸]
户型
户型主要以 3 室 2 厅与 2 室 2 厅为主。与小伙伴抱团租房是最好的选择了,不然与不认识的人一起合租,可能会发生一系列让你不舒服的事情。字体越大,代表户型数量越多。
户型
户型
租房面积统计
其中 30 - 90 平方米的租房占大多数,如今之计,也只能是几个小伙伴一起租房,抱团取暖了。
租房面积统计
租房描述词云
这是爬取的租房描述,其中字体越大,标识出现的次数越多。其中【精装修】占据了很大的部分,说明长租公寓也占领了很大一部分市场。
租房描述
爬虫思路
先爬取房某下深圳各个板块的数据,然后存进 MongoDB 数据库,最后再进行数据分析。
各个板块
数据库部分数据:
爬虫技术分析
请求库:requests
HTML 解析:BeautifulSoup
词云:wordcloud
数据可视化:pyecharts
数据库:MongoDB
数据库连接:pymongo
爬虫代码实现
首先右键网页,查看页面源码,找出我们要爬取得部分。
源码
代码实现,由于篇幅原因只展示主要代码:(获取一个页面的数据)
数据分析实现
数据分析:
数据展示:
后记
最近还真是挺多事情发生的,房租的暴涨,其实是资本力量进驻了租房市场。自如、蛋壳这些长租公寓,相互抬高房租价格,而且让客户签第三方贷款协议,前期发展可能需要一点钱,但是到后期垄断市场之后,只要住房刚需在,就不会赚不回钱。最后,应对外界条件的变动,我们还是应该提升自己的硬实力,这样才能提升自己的生存能力。
版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点!
本站所提供的图片等素材,版权归原作者所有,如需使用,请与原作者联系。
上一篇:人工智能黑暗面
下一篇:组织应按“需”构建数据中心