geohash作为Solr的位置信息搜索算法,有必要了解其基本的实现原理。geohash算法的wiki链接为
http://en.wikipedia.org/wiki/Geohash,这里再结合自己的理解,重新复述一下。
由经纬度变成base32标识
geohash的思想,是将所有的经纬度坐标,通过geohash,变成一个唯一的base32标识。他将世界上的所有区域进行分块,每个维度都是32块,进而将范围逐渐变小、变小,最后的一堆数字,就成了这个base32的唯一标识。比如说“DRT2Y”这个标识,首先确定D:
OK,找到D区域后,再将D进行分块,精确到DR:
类似的,继续找到DRT:
以此类推,慢慢的精确到你指定的点,这就变成了唯一的base32标识。
base 32的对应表如下:
encode:由经纬度到base32
使用wiki上的例子,纬度为42.6,经度为-5.6的点,转化为base32的话要如何转呢?
拿纬度来进行说明,纬度的范围为-90到90,将这个范围划为两段,则为[-90,0]、[0,90],然后看给定的纬度在哪个范围,在前面的范围的话,就设当前位为0,后面的话值便为1.然后继续将确定的范围1分为2,继续以确定值在前段还是后段来确定bit的值。就这样慢慢的缩小范围,一般最多缩小13次就可以了(经纬度的二进制位相加最多25位,经度13位,纬度12位)。这时的中间值,将跟给定的值最相近。
结合图,看的更明白些:
其中val可以认为是下一次的中间值,而err是误差,通过mid+err=val,err当前值是上一次误差的一半。
这样,取出图中的bit位:1011 1100 1001,同样的方法,将经度(范围-180到180)算出来为
0111 1100 0000 0。
得到了经纬度的二进制位后,下面需要将两者进行结合:从经度、纬度的循环,每次取其二进制的一位(不足位取0),合并为新的二进制数:01101 11111 11000 00100 00010。每5位为一个十进制数,结合base32对应表映射为base32值为:ezs42。这样就完成了encode的过程
decode:由base32到经纬度
相信知道了encode的过程后,decode的过程很容易推导了。不清楚的可以参考wiki。这里就不细说了。
after
接下来,我会写一下Lucene/Solr是如何应用geohash的,包括创建索引、查询索引,以及距离的计算等。
- 大小: 136.6 KB
- 大小: 100.2 KB
- 大小: 100.2 KB
- 大小: 20.5 KB
- 大小: 50.2 KB
分享到:
相关推荐
Geohash算法就是将经纬度编码,将二维变一维,给地址位置分区的一种算法 此檔案為C語言實現 函式庫使用介紹: 1)編碼 char* geohash_encode(double lat, double lng, int precision); 以所需精度獲取緯度和經度並...
Geohash算法实现,经纬度到geohash编码的实现
GeoHash将二维的经纬度转换成字符串
根据IP或经纬度查询城市-离线版 根据IP或经纬度查询城市-离线版
行政区划数据库_with 经纬度-省市区-邮编-区号-拼音-简称
geohash解决计算附近距离,搜索附近的商业点,两个经纬度距离,地理位置应用处理
2017最新全国省市区行政区域数据库-包含编码-经纬度-拼音-邮编
数据更新于:2020年11月06日 ,包含4个json(省级、地级、县级、乡级),3个整理后的txt,1个java文件 带注释,具体可看文章:https://mp.csdn.net/editor/html/115234415
经纬度计算软件-可以批量计算4G站共址的2G站,3G站,非常适于与网络规划与优化
行政区划数据库_with+经纬度-省市区-邮编-区号-拼音-简称
geohash基本原理是将地球理解为一个二维平面,将平面递归分解成更小的子块,每个子块在一定经纬度范围内拥有相同的编码。GeoHash将二维的经纬度转换成一维的字符串。
深汕合作区经纬度坐标点-json格式
全国省市经纬度坐标点-文本格式 如:117.496002197,40.6653366090001;···· 逗号隔开经纬度,分号隔开每个坐标点
行政区划数据库_with 经纬度-省市区-邮编-区号-拼音-简称
2016省市县行政区划数据库_(经纬度-省市区-邮编-区号-拼音-简称-首字母)
基于solr-geo空间搜索 1、Solr的schema.xml配置 定义坐标field 2、Solr的data-config.xml配置 建立索引 3、java查询语法 坐标距离、分页、排序
geohash简介: geohash是一种地址编码,它能把二维的经纬度编码成一维的字符串。geohash有以下几个特点: 首先,geohash用一个字符串表示经度和纬度两个坐标。某些情况下无法在两列上同时应用索引 (例如MySQL 4...