如何优化批量经纬度距离计算,提升代码执行效率?

ID:20829 / 打印

如何优化批量经纬度距离计算,提升代码执行效率?

批量经纬度距离计算优化

所需解决的问题是计算两张含经纬度的表的点之间距离,并找出距离某点的其他点。

原代码问题:
原代码处理时间过长,主要耗时代码为:

df41 = df4[(df4['longitude']>df4_lon_min) & (df4['longitude']<df4_lon_max) & (df4['latitude']<df4_lat_max) & (df4['latitude']>df4_lat_min)]

优化方案:
减少不必要的条件语句,采用矩阵求解代替循环计算,优化如下:

df41 = df4[(df4['longitude']>df4_lon_min) & (df4['longitude']<df4_lon_max)] df42 = df4[(df4['latitude']<df4_lat_max) & (df4['latitude']>df4_lat_min)] df41 = pd.concat([df41, df42], axis=0, ignore_index=true)  # 如果需要保留行数据,避免重复,可改用 df41.append(df42)

或采用矩阵求解:

from scipy.spatial import distance_matrix  ...  min_distance = 15 tmp = distance_matrix(df1, df2)  # 求出 df1、df2 的所有距离 idx = np.where(tmp<min_distance)  # 比对距离边界,获取原始数据索引

经过优化后,处理时间将大幅缩短,具体效果需根据数据量和具体应用而定。

上一篇: 使用 torchtext 加载 Multi30k 数据集时,如何解决 UnicodeDecodeError 错误?
下一篇: MySQL LEFT JOIN 更新语句筛选最大值字段问题:如何使用 LEFT JOIN 更新关联表中最大值?

作者:admin @ 24资源网   2025-01-14

本站所有软件、源码、文章均有网友提供,如有侵权联系308410122@qq.com

与本文相关文章

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。