疫情对广州房价的影响

上节我们获取了广州的房价数据,并存入了MongoDB中

数据展示:


643d23bc5ba4af54bdca640f478a7f08.jpeg

这节我们的目标就是计算出广州最高的房价、最低的房价、平均房价以及每个区的平均房价。

目录:

1、提取数据

2、计算最高的房价、最低的房价、平均房价

3、计算每个区的平均房价

4、数据可视化(和2019年12月的房价数据进行对比)

5、房价涨跌幅度



1、提取数据

从MongoDB中提取的数据是一个游标对象,而每个数据是以字典的形式存储的

5ebf8b69bf81cedf5ffab828248d3039.png

需要循环提取数据

def output_mongo(self,city):
 """提取数据"""
 results = collection.find({'city': city})
    for i in results:
        analyze = {}
        analyze['zone'] = i.get('zone')
        analyze['price'] = i.get('price')
        yield analyze

这里指定city为广州,数据只要价格和地区名


2、计算最高的房价、最低的房价、平均房价

将output_mongo返回的数据传入analyze_data

def analyze_data(self,data):
 """
    对全城房价数据进行分析,得出平均房价、最高房价、最低房价
    """
 price = ([i['price'] for i in data])
    a = []
    for i in price:
        a.append(i)
    # 平均值
    avg_price = sum(a) / len(a)
    print('平均房价是:' + str(avg_price) + '每平方米')
    # 最高的价格
    max_price = max(a)
    print('该城市最高的房价为' + str(max_price) + '每平方米')
    # 最低的价格
    min_price = min(a)
    print('该城市最低的房价为' + str(min_price) + '每平方米')

先将价格数据提取出来,之后计算最大值、最小值、平均值都很容易了


3、计算每个区的平均房价

将output_mongo返回的数据传入analyze_zone

def analyze_zone(self, data):
 """分析同城不同地区的房价"""
 a = []
    for i in data:
        a.append(i)
    zone_name = []
    house_price = []
    for i in a:
        zone_name.append(i.get('zone'))
    zone_name = set(zone_name)  # 对地区名进行去重
    for i in zone_name:
        price = 0
        zone_num = 0    # 地区出项的次数
        for j in a:
            if j['zone'] == i:
                zone_num += 1
                price += j['price']
        house_price.append(price//zone_num)     # 得到平均房价
    zone_data_dict = dict(zip(zone_name, house_price))  # 得到地区与价格的字典
    z = list(zip(list(zone_data_dict), list(zone_data_dict.values())))
    zone_price_list = sorted(z, key=lambda x: (x[1]))
    return zone_price_list

analyze_zone方法会将每个地区的房价相加求平均值


4、数据可视化(和2019年12月的房价数据进行对比)

我这里将数据都计算并整理好,房价和地区一一对应

price04 = [16022,19550,20176,22867,28017,34064,47098,49951,58837,68216,74486]
now_price = [16270,20131,21563,25492,28666,34259,46460,50081,65994,62630,62358]
zone = ['从化','花都','增城','南沙','黄埔','番禺','白云','荔湾','海珠','越秀','天河']

怎么对比比较好呢?这里采用柱状图的方式,图例如下:

79d1a4da3487b88f5dd1b32065cb06ca.jpeg

将需要对比的两组数据放在一起,这样就可以直观的看出差距

代码如下:

import numpy as np
import matplotlib.pyplot as plt

price04 = [16022,'天河']
x = np.array([i for i in range(0,33,3)])
x1 = x + 0.9
x2 = x + 2.1
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.bar(x1,price04,label='去年12月份')
plt.bar(x2,now_price,label='现在')
for i in range(len(x)):
     plt.text(x1[i],price04[i],ha='center')
     plt.text(x2[i],now_price[i],ha='center')
plt.xticks(x + 1.5,zone)
plt.legend()
plt.show()

我们没有直接将地区名作为x轴,而是将一个数组作为了x轴,但是最后x轴显示的还是地区名,这是因为xticks()方法,我们还是先看看xticks()的源码是如何解释的吧

1adb9894081aae30e11d5dde937cc1da.png

xticks()方法的ticks参数的意思就是,指定刻度放置x轴的标签,labels这个标签可以覆盖bar()方法设置的x轴标签,上图帮助我们理解,我们试试看如果没有添加labels参数会是什么结果吧,

plt.xticks(x + 1.5,zone)改为plt.xticks(x + 1.5)

图例:

3d08499009356bdfa3dc1d9ed4b8bb59.jpeg

这次x轴的标签就变为一个个数字了(这其实就是x轴的刻度)

通过图我们就能比较直观的看出广州各个区的平均房价在这次疫情中的变化,可以看出天河区、越秀区的房价下降的是比较明显的,海珠区的房价上涨是比较明显的。


5、房价涨跌幅度(可视化)

上面的图只能比较直观的看出涨跌明不明显,但是我不但想知道谁涨了谁跌了,而且还要知道具体的涨跌幅度是多少,这才更容易帮助我分析。

计算方法:涨跌幅 = (现在的房价-去年房价)/去年房价

代码如下:

price04 = [16022,62358]
percent = []
for i in range(len(price04)):
    percent.append(round(((now_price[i] - price04[i])/price04[i]) * 100,3))
print(percent)

运行结果:

[1.548,2.972,6.875,11.479,2.316,0.572,-1.355,0.26,12.164,-8.189,-16.282]

可视化展示:

代码如下:

import numpy as np
import matplotlib.pyplot as plt

price04 = [16022,3))
zone = ['从化','天河']
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.bar(zone,percent,color='r',label='涨跌幅度')
for i in range(len(percent)):
    if percent[i] < 0:
        plt.text(zone[i],percent[i]-1,percent[i],ha='center')
    else:
        plt.text(zone[i],percent[i]+1,ha='center')
plt.legend()
plt.show()

运行结果:

6b1d5e88ed7f27383345f6393c779312.jpeg

从这幅图中我们可以看出在疫情期间只有白云、越秀、天河三个区的房价有所下降,尤其是天河区下降了16.282%,南沙区和海珠区领涨分别涨了11.479%、12.164%

原文地址:https://blog.csdn.net/weixin_44623587/article/details/126070861

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


文章浏览阅读752次。关系型数据库关系型数据库是一个结构化的数据库,创建在关系模型(二维表模型)基础上,一般面向于记录SQL语句(标准数据查询语言)就是一种基于关系型数据库的语言,用于执行对关系型数据库中数据的检索和操作主流的关系数据库包括Oracle、Mysql、SQL Server、Microsoft Access、DB2等非关系型数据库NoSQL(nOSQL=Not Only SQL),意思是“不仅仅是SQL”,是非关系型数据库的总称。除了主流的关系型数据库外的数据库,都认为是非关系型主流的NoSQ.._redis是非关系型数据库吗
文章浏览阅读687次,点赞2次,收藏5次。商城系统中,抢购和秒杀是很常见的营销场景,在一定时间内有大量的用户访问商场下单,主要需要解决的问题有两个:1. 高并发对数据库产生的压力;2. 竞争状态下如何解决商品库存超卖;高并发对数据库产生的压力对于第一个问题,使用缓存来处理,避免直接操作数据库,例如使用 Redis。竞争状态下如何解决商品库存超卖对于第二个问题,需要重点说明。常规写法:查询出对应商品的库存,判断库存数量否大于 0,然后执行生成订单等操作,但是在判断库存是否大于 0 处,如果在高并发下就会有问题,导致库存_php库存结余并发
文章浏览阅读1.4k次。MongoTemplate开发spring-data-mongodb提供了MongoTemplate和MongoRepository两种方式访问MongoDB,MongoRepository的方式访问较为简单,MongoTemplate方式较为灵活,这两种方式在Java对于MongoDB的运用中相辅相成。_springboot插入指定的mongodb数据库
文章浏览阅读887次,点赞10次,收藏19次。1.背景介绍1. 背景介绍NoSQL数据库是一种非关系型数据库,它的特点是可以存储非结构化的数据,并且可以处理大量的数据。HBase是一个分布式、可扩展的列式存储系统,它是基于Google的Bigtable设计的。HBase是一个开源的NoSQL数据库,它的核心功能是提供高性能的随机读写访问。在本文中,我们将对比HBase与其他NoSQL数据库,例如Redis、MongoDB、Cass...
文章浏览阅读819次。MongoDB连接失败记录_edentialmechanisn-scram-sha-1
文章浏览阅读470次。mongodb抽取数据到ES,使用ELK内部插件无法获取数据,只能试试monstache抽取mongodb数据,但是monstache需要mongodb replica set 模式才能采集数据。############monstache-compose文件。#replicas set 启动服务。# 默认备份节点不能读写,可以设置。# mydb指的是需要同步的数据库。#登录主mongodb初始化rs。#primary 创建用户。# ip地址注意要修改。# ip地址注意要修改。_monstache csdn
文章浏览阅读913次,点赞4次,收藏5次。storage:fork: trueadmin登录切换数据库注意: use 代表创建并使用,当库中没有数据时默认不显示这个库删除数据库查看表清单> show tables # 或者 > show collections表创建db.createCollection('集合名称', [options])table1字段类型描述capped布尔(可选)如果为 true,则创建固定集合。固定集合是指有着固定大小的集合,当达到最大值时,它会自动覆盖最早的文档。_mongodb5
文章浏览阅读862次。Centos7.9设置MongoDB开机自启(超全教程,一条龙)_mongodb centos开机启动脚本
文章浏览阅读1.3k次,点赞6次,收藏21次。NoSQL数据库使用场景以及架构介绍
文章浏览阅读856次,点赞21次,收藏20次。1.背景介绍1. 背景介绍NoSQL数据库是一种非关系型数据库,它的设计目标是为了解决传统关系型数据库(如MySQL、Oracle等)在处理大量不结构化数据方面的不足。NoSQL数据库可以处理大量数据,具有高性能、高可扩展性和高可用性。但是,与关系型数据库不同,NoSQL数据库没有固定的模式,数据结构也不一定是表格。在NoSQL数据库中,数据存储和查询都是基于键值对、列族、图形等不同的...
文章浏览阅读416次。NoSQL定义:非关系型、分布式、开放源码和具有横向扩展能力的下一代数据库。由c++编写的开源、高性能、无模式的基于分布式文件存储的文档型数据库特点:高性能、高可用性、高扩展性、丰富的查询支持、可替换已完场文档某个指定的数据字段应用场景:社交场景:使用mongodb存储用户信息游戏场景:用户信息,装备积分物流场景:订单信息,订单状态场景操作特点:数据量大;读写操作频繁;价值较低的数据,对事物性要求不高开源、c语言编写、默认端口号6379、key-value形式存在,存储非结构化数据。_nosql
文章浏览阅读1.5k次,点赞3次,收藏2次。Exception in thread "main" redis.clients.jedis.exceptions.JedisConnectionException: Failed to create socket. at redis.clients.jedis.DefaultJedisSocketFactory.createSocket(DefaultJedisSocketFactory.java:110) at redis.clients.jedis.Connection.connect(Conne_redis.clients.jedis.exceptions.jedisconnectionexception: failed to create so
文章浏览阅读6.5k次,点赞3次,收藏12次。readAnyDatabase(在所有数据库上都有读取数据的权限)、readWriteAnyDatabase(在所有数据库上都有读写数据的权限)、userAdminAnyDatabase(在所有数据库上都有管理user的权限)、dbAdminAnyDatabase(管理所有数据库的权限);:clusterAdmin(管理机器的最高权限)、clusterManager(管理和监控集群的权限)、clusterMonitor(监控集群的权限)、hostManager( 管理Server);_mongodb创建用户密码并授权
文章浏览阅读593次。Redis是一个基于内存的键值型NoSQL数据库,在实际生产中有着非常广泛的用处_搭建本地redis
文章浏览阅读919次。Key 的最佳实践[业务名]:[数据名]:[id]足够简短:不超过 44 字节不包含特殊字符Value 的最佳实践:合理的拆分数据,拒绝 BigKey选择合适数据结构Hash 结构的 entry 数量不要超过 1000(默认是 500,如果达到上限则底层会使用哈希表而不是 ZipList,内存占用较多)设置合理的超时时间批量处理的方案:原生的 M 操作Pipeline 批处理注意事项:批处理时不建议一次携带太多命令。Pipeline 的多个命令之间不具备原子性。_redis高级实战
文章浏览阅读1.2k次。MongoDB 递归查询_mongodb数据库 递归
文章浏览阅读1.2k次。通过实际代码例子介绍:如何通过MongoTemplate和MongoRepository操作数据库数据_springboot操作mongodb
文章浏览阅读687次,点赞7次,收藏2次。首先欢迎大家阅读此文档,本文档主要分为三个模块分别是:Redis的介绍及安装、RedisDesktopManager可视化工具的安装、主从(哨兵)模式的配置。_redis 主从配置工具
文章浏览阅读764次。天下武功,无坚不摧,唯快不破!我的名字叫 Redis,全称是 Remote Dictionary Server。有人说,组 CP,除了要了解她外,还要给机会让她了解你。那么,作为开发工程师的你,是否愿意认真阅读此心法抓住机会来了解我,运用到你的系统中提升性能。我遵守 BSD 协议,由意大利人 Salvatore Sanfilippo 使用 C 语言编写的一个基于内存实现的键值型非关系(NoSQL)..._redis 7.2 源码
文章浏览阅读2k次。MongoDB 的增删改查【1】_mongodb $inc