博文

【转载】Google 搜索技巧

图片
1. 引子 跟书中描述的经历类似,公司里有着多年经验的同事都会推荐大家使用 Google 进行搜索,我在刚开始使用谷歌进行搜索时,发现和百度好像没区别,没有说的那么好用呀。直到学习了一些搜索技巧以后,才发现原来是自己的搜索方法有问题,Google 搜索真是太棒了,彻底和百度说拜拜。接下来分享一些常用的搜索技巧。 2. 什么是搜索技巧?** 所谓的搜索技巧就是在搜索关键字时,配合一些通配符,帮助快速定位到想要的结果。而搜索技巧常常作为 SEO(Search Engine Optimization) 技术学习的一部分。** ** SEO : 是一种通过了解搜索引擎,以及提高目的网站在有关搜索引擎内排名的方式. ** SEO 相关的书都会有一个章节用来讲搜索技巧,如果想要了解更多和 SEO 相关的技术,可以去 Google 一下。 3. 怎样使用?以一个 Case 对应一个 Solution 的方式,介绍常用的搜索技巧。通过搜索结果的截图对比,更加直观地看出使用了搜索的技巧的神奇之处。
Case 1. 搜索到的结果 “东拼西凑”我想搜索 "android 网络定位" ,直接输入关键字,会发现有些搜的结果是 “东拼西凑” 的,没按照 "android 网络定位" 顺序来搜。
Solution 1. 使用 "" 进行完全匹配使用方法:"关键字",通过给关键字加双引号的方法,得到的搜索结果就是完全按照关键字的顺序来搜。
Case 2. 不想要搜索某个关键词手机定位的方式有 GPS、网络和基站定位这几种,我想了解网络定位相关的原理,在搜 “android 网络定位时”,不想让 GPS 的关键字出现。和上面的例子一样,直接输入关键字,搜索结果里面会带有 GPS 相关信息。
Solution 2. 使用 - 排除关键字使用方法:关键字 - 排除关键字 , Tip:- 后面没有空格。搜索后的结果都没 GPS 关键字。

学习搜索引擎原理

什么是搜索引擎
搜索引擎是一个帮助用户搜索他们需要内容的计算机程序。换一种说法,搜索引擎把计算机中存储的信息与用户的信息需求 (information need) 相匹配,并把匹配的结果展示出来。

网络爬虫
互联网上的信息存储在无数个服务器上,任何搜索引擎要想回答用户的搜索,首先要把网页存在自己本地的服务器上,这靠的就是网络爬虫。

其次,如何高效的爬取数据也是一个很大的挑战。比如需要有成千上万个爬虫程序同时爬取数据,高效的将数据存储起来以便之后分析等。这种分布式程序的实现是一个相当大的工程。

索引
互联网上的数据千千万万,大海捞针的搜索怎么就这么快?难道 Google 发明了什么逆天科技吗?其实不是。这都要归功于搜索引擎的索引了。


如果要你在一本书里找一个关键词,应该怎么找?假设有充足的时间,最暴力的方法就是从头到尾看一遍,最后总能找到关键词所在的位置。不过这是不是太麻烦了?有更好的方法吗?

有。索引就是帮助程序进行快速查找的。大家都用过新华字典。字典前边的按照偏旁部首查字的部分就是索引。搜索引擎也一样。这里要介绍第一个最重要的数据结构:反转列表(inverted list)。


索引除了反转列表还包含了很多各种数据结构。比如维护文档 ID 到实际文档的 Document Manager,存储每个单词属性信息的 Term Dictionary,存储文档属性的数据结构等等。


搜索
有了索引,就可以快速找到所需内容了。前边说过搜索引擎根据用户的信息需求查找匹配的内容。信息需求来自于用户输入。如何理解它有很大学问。这里用户的输入也富有技巧性,后面会专门学习如何高效使用搜索引擎。


转载自https://www.zhihu.com/question/19937854,有删减

Hello Blogger

终于有了自己的博客啦,在blogger安家~

本来想用gitpage的,最后还是觉得blogger方便,直接在后台编辑博文就可以发布了。

差点被评论难到了,blogger自带的评论在国内加载不出来?换成来比力算了。。

如果有人看到这里的话,留个言如何~~