xung的小窝

单模式匹配问题定义在一个主文本字符串S内查找一个模式串W的出现位置. 在下述中,用下标i表示在主字符串S中的下标,S长度为n,下标j表示在模式串W中的下标,W长度为k. 解决算法 BF(Brute Force)算法 BF算法是最容易想到的解决单模式匹配问题的算法,是一种暴力搜索算法.算法时间复杂度O(n*k). 算法的基本思想是: 用i依次遍历S,在循环内,再遍历j来判断当前是否匹配上. 算法伪代码如下: def bf_string_matcher(S,W): if (S or W) is None: return n = len(S) k = len(W) for i in range(0, n-k+1) : match = True for i in range(0, k) : if W[i] is not S[i+j]: match = False break if match: print "Pattern occurs with shift",i KMP算法 KMP算法全称是Knuth-Morris-Pratt算法,是以3个发明人名字命名的,是解决单模式匹配问题的经典算法.时间复杂度为O(n+k),其中求next数组的时间复杂度为O(k),匹配时比较的时间复杂度为O(n). KMP算法和BF算法比较起来, 最主要的改进是有效利用了已匹配的信息,使得算法可跳过一些没有必要再进行尝试的比较.在遇到匹配失效时,i无需迭代到i+1,而是可以直接跳过一些,迭代到i+m,j也无需回溯到0. 原理解释下面假设S=BBC ABCDAB ABCDABCDABDE,W=ABCDABD.以一个具体例子说明KMP算法的原理: 上面一个基本的事实是,当空格与D不匹配时,其实W前面的ABCDAB是与S当前空格前的6个字符是完全匹配的.这样,也就意味着接下来的5次(6-1)后移中,部分比较是可以提前计算出来的: 可以看到当前已经匹配上的部分是ABCDAB,而后续的5次后移的比较中,分别会进行ABCDAB的等长的前缀与后缀的比较,如果这些前缀与后缀不等,实际上就意味着这次移位的比较最终是失败的(因为最终要匹配成功,必须完全匹配,只要部分有一个地方不匹配,就匹配失败),可以跳过这些移位.这个例子中,可以直接向后移动4位(i+4).而且此时已知AB=AB,故j也无需再回溯到0,而是可以回溯到j+2,这样接下来需要进行的比较是S[i+j]与W[j],即S[10]与W[2]. 显然,遇到所有的部分匹配,都可以用这种方法加速.而对于一个确定的W来说,所有的部分匹配就是W的所有前缀.每种情况下的部分匹配, 关键是要计算出在这个部分匹配下,部分匹配部分的最大的公共前缀和后缀,这个公共的最大前缀和后缀的长度就作为部分匹配值,因此当W确定后,可以在一个O(k)的复杂度下,计算出W的一个表,这个表叫部分匹配表(或者其变形next表或失配函数表). 这这个例子中,此表值为: 搜索词 A B C D A B D 部分匹配值 0 0 0 0 1 2 0 因此,KMP算法匹配是的流程是,先根据当前的W,计算出其部分匹配表.(一个长度为k的数组即可表示.) 然后在S上,根据W和此表,进行比较搜索. ...

最近看到一篇GPS工作原理的文章: 中文翻译版:https://pages.longtian.info/gps/ 英文原文:https://ciechanow.ski/gps/. 发现质量挺高的. 页面内容有很多交互式类似h5的页面. (为了防止原页面丢失, 这里保存了下来: gps工作原理.rar) 有空的时候,可以研究一下. 基本原理通过到3点的距离,确定位置(自己的位置在以3个点为圆心,各个距离为半径的圆的交点) 用时间计算距离(选定一个恒定速度的传播介质,传播信号,利用信号发出和接受到的时间差,计算出距离) 信号从哪里发出? 方案1(主动系统): 从自己发出,监测点接收. 不可行在这样的系统里地标会主动的响应使用者获得信息的请求。一旦使用者增多，系统的复杂性就会大幅地增加。即使我们想出巧妙的方法来让地标甄别输入信号并给出不同的响应，也无法保证不会有部分用户使整个系统过载. 方案2(被动系统): 监测点(地标)发出信号,使用者接收信号. 实际的方案解决了系统过载的问题. 监测点总是在固定的时间点(如每分钟的0秒)发出信号. 遇到的问题用户时钟和系统时钟可能不能总是保持一致. 从而造成计算出的时间有误差,使得最终无法准确测量距离. 解决用户时钟和系统时钟不同步的问题保证监测点的系统时钟是一致的. 因为所有的地标的有相同系统时间，所以我们的时钟和每个地标的偏差是一模一样的. 因为这个偏差是相同的，所以三个计算得出的距离都是要么一起偏短，要么一起偏长。当我们收到所有三个信号后，我们可以试着猜这个偏差的具体是多少，只有唯一的一个偏差值能够让三个圈在同一个点交汇，这个点正是我们在地图上的位置。引入第三个位置已知的发射器,我们不仅准确地计算出了位置，而且连用户时钟时钟的偏差也得到了。这就让我们可以将用户时钟和定位系统的时钟同步 - 这样我们就获得了一个准确时间的可靠来源. 从平面升级到3D空间平面上的圆圈需要升级为空间中的球面,3个球面可以相交于2个点: 但如果考虑到实际的使用场景, 这2个点一个在地面之上,一个在地面之下, 所以3个发射器,就可以唯一无歧义的确定自己在空间中的位置了(位置和高度). 类似于平面的场景,当用户没有和系统完美同步的时钟时, 只用3个发射器, 会找到多个不同的偏差, 让三球相交于一点. 从而无法确定偏差. 这时引入第四个发射点, 可以解决这个问题. **需要至少四个发射装置来计算伪距的方法正是 GPS 用的来计算接收器位置和时钟偏差的方法. **背后的数学原理: 我们要处理到四个发射器距离，归结为四个方程：方程的左边是接收器的未知位置到红，绿，蓝，黄四个发射器用 3D 勾股定理计算出来的距离。右边是从四个发射器到接收器的时间 t，未知的接收器的偏差 b. 最终解这组方程从而得到接收器的位置 x y z 和时间偏差 b 到这里我们目前建立的这套体系已经能够在距离地标较近的情况下，正确地计算我们的位置和时钟偏差. 像 GPS 那样对整个地球都可用传输介质: 不用可见光而是用电磁辐射的另一种形式 - 特定频率的电磁波信号发射源的可见性我们所处的环境不是平坦的, 电磁波遇到山丘会被阻挡解决办法: 将发射器升到足够高地球本身有曲率, 是球状,而非平面地球曲率本身就像山一样遮挡了发射器的视平线: 我们把发射器放得越高，能看到的区域就越大: 因此,我们需要卫星携带发射器.