如何优化批量经纬度距离计算，提升代码执行效率？

ID:20829 / 打印

批量经纬度距离计算优化

所需解决的问题是计算两张含经纬度的表的点之间距离，并找出距离某点的其他点。

原代码问题：
原代码处理时间过长，主要耗时代码为：

df41 = df4[(df4['longitude']>df4_lon_min) & (df4['longitude']<df4_lon_max) & (df4['latitude']<df4_lat_max) & (df4['latitude']>df4_lat_min)]

优化方案：
减少不必要的条件语句，采用矩阵求解代替循环计算，优化如下：

df41 = df4[(df4['longitude']>df4_lon_min) & (df4['longitude']<df4_lon_max)] df42 = df4[(df4['latitude']<df4_lat_max) & (df4['latitude']>df4_lat_min)] df41 = pd.concat([df41, df42], axis=0, ignore_index=true)  # 如果需要保留行数据，避免重复，可改用 df41.append(df42)

或采用矩阵求解：

from scipy.spatial import distance_matrix  ...  min_distance = 15 tmp = distance_matrix(df1, df2)  # 求出 df1、df2 的所有距离 idx = np.where(tmp<min_distance)  # 比对距离边界，获取原始数据索引

经过优化后，处理时间将大幅缩短，具体效果需根据数据量和具体应用而定。

上一篇: 使用 torchtext 加载 Multi30k 数据集时，如何解决 UnicodeDecodeError 错误？

下一篇: MySQL LEFT JOIN 更新语句筛选最大值字段问题：如何使用 LEFT JOIN 更新关联表中最大值？

作者：admin @ 24资源网 2025-01-14

本站所有软件、源码、文章均有网友提供，如有侵权联系308410122@qq.com

与本文相关文章

发表评论:取消回复

◎欢迎参与讨论，请在这里发表您的看法、交流您的观点。

如何优化批量经纬度距离计算，提升代码执行效率？

与本文相关文章

栏目导航

最新文章

随机文章

热门文章