加入收藏 | 设为首页 | 会员中心 | 我要投稿 武汉站长网 (https://www.027zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 运营中心 > 网站设计 > 教程 > 正文

Python爬取北京二手房数据,分析北漂族买得起房吗? | 附完整源码

发布时间:2018-08-25 01:51:03 所属栏目:教程 来源:徐麟
导读:技术沙龙 | 邀您于8月25日与国美/AWS/转转三位专家共同探讨小程序电商实战 房价高是北漂们一直关心的话题,本文就对北京的二手房数据进行了分析。 本文主要分为两部分:Python爬取赶集网北京二手房数据,R对爬取的二手房房价做线性回归分析,适合刚刚接触Py

探究Bedrooms与TotalPrice的关系

  1. table(DATA$Bedrooms) 
  2.   1    2    3    4    5    6    7    9  
  3. 541 1225  779  193  102   20    5    1  
  4. ##由于拥有6、7、9个卧室数的数量较少,这里我们排出这些数据。 
  5. DATA<-DATA[-(which(DATA$Bedrooms %in% "6")),] 
  6. DATA<-DATA[-(which(DATA$Bedrooms %in% "7")),] 
  7. DATA<-DATA[-(which(DATA$Bedrooms %in% "9")),] 
  8. table(DATA$Bedrooms) 
  9.    1    2    3    4    5  
  10.  541 1225  779  193  102  
  11.  
  12. library(ggplot2) 
  13. ggplot(DATA,aes(x=Bedrooms,y=TotalPrice))+geom_boxplot(col="red") 

Python爬取北京二手房数据,分析北漂族买得起房吗? | 附完整源码

  1. DATA$Bedrooms<-as.numeric(DATA$Bedrooms) 
  2. ##这里将卧室数为1、2、3命名为A,4为B,5为C 
  3. DATA$Bedrooms[DATA$Bedrooms=='1']<-"A" 
  4. DATA$Bedrooms[DATA$Bedrooms=='2']<-"A" 
  5. DATA$Bedrooms[DATA$Bedrooms=='3']<-"A" 
  6. DATA$Bedrooms[DATA$Bedrooms=='4']<-"B" 
  7. DATA$Bedrooms[DATA$Bedrooms=='5']<-"C" 

不同卧室数,TotalPrice不同。且随着卧室数的增多,总价越高,符合大众的认知。

(编辑:武汉站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读