如何解决在多边形内过滤GeoPandas数据框,并从其中删除不存在的数据框
我有一个.csv文件,其中包含一些点(经度,纬度)。我使用以下代码将其转换为DataFrame并从DataFrame转换为GeoDataFrame:
CSV文件:
日期;用户ID;经度;纬度
2020-01-02; 824664; -79.8831613; -2.1811152000000003
2020-03-01; 123456; 80.8831613; 2.1811
2020-01-15; 147835; -80.78035200000001; -1.4845725
我用来将.csv转换为gdf的代码:
df = pd.read_csv('datos25.csv',sep=';',low_memory=False,decimal='.')
gdf = geopandas.GeoDataFrame(
df,geometry=geopandas.points_from_xy(df.Longitud,df.Latitud))
然后,我使用以下代码定义属于国家的多边形:
world = geopandas.read_file(geopandas.datasets.get_path('naturalearth_lowres'))
ec = world[world.name == 'Ecuador']
现在,我要做的是gdf中的每个POINT,验证它是否在多边形/国家/地区中,如果不是,请从DataFrame中删除该行
例如,在这种情况下,几何列中的第二个值是:
要点(80.8831613 2.1811)
应将此值所在的行从数据框中删除,因为它不在多边形/国家/地区中
我该怎么做?
解决方法
需要空间操作within
来识别点几何是否位于多边形几何内。在下面的代码中,朝着识别落在多边形内的所有点(厄瓜多尔)的目标执行所有必要的步骤。在最后一步,将创建一个图以可视化/检查结果。
import pandas as pd
import geopandas
from shapely.geometry import Point #Polygon
df = pd.read_csv('ecuador_data.csv',sep=';',low_memory=False,decimal='.')
world = geopandas.read_file(geopandas.datasets.get_path('naturalearth_lowres'))
ecuador = world[world.name == 'Ecuador']
# add new column to df
df['withinQ'] = ""
withinQlist = []
for lon,lat in zip(df.Longitude,df.Latitude):
pt = Point(lon,lat)
withinQ = pt.within(ecuador['geometry'].values[0])
#print( withinQ )
withinQlist.append(withinQ)
# update values in the that column,values: True/False
df['withinQ'] = withinQlist
# uncomment next line to see content of `df`
#print(df)
# Date User_ID Longitude Latitude withinQ
# 0 2020-01-02 824664 -79.8832 -2.1811 True
# 1 2020-03-01 123456 80.8832 2.1811 False
# 2 2020-01-15 147835 -80.7804 -1.4845 True
# select points within ecuador,assign to `result_df` dataframe
result_df = df[df.withinQ==True]
# select points outside ecuador,assign to `xresult_df` dataframe
xresult_df = df[df.withinQ==False]
# for checking/visualization,create a plot of relevant geometries
ax1 = ecuador.plot(color='pink')
ax1.scatter(result_df.Longitude,result_df.Latitude,s=50,color='green')
#ax1.scatter(xresult_df.Longitude,xresult_df.Latitude,s=30,color='red')
剧情:
对于所得的数据帧result_df
,其内容将如下所示:
Date User_ID Longitude Latitude withinQ
0 2020-01-02 824664 -79.8832 -2.1811 True
2 2020-01-15 147835 -80.7804 -1.4845 True
,
为将来参考,您可以使用此link中的文档,我发现它非常有用!
您正在寻找的过程称为“多边形中的点”,正如其他答案所述,您可以使用.within()函数
现在,我已经拥有了:
#find point in polygon
#code below returns a series with boolean values
#if value is True it means the point in that index location is within the polygon we are evaluating
pip = gdf.within(ec.loc[0,'geometry'])
#creating a new geoDataFrame that will have only the intersecting records
ec_gdf = gdf.loc[pip].copy()
#resetting index(optional step if you don't need to keep the original index values)
ec_gdf.reset_index(inplace=True,drop=True)
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。