前往顾页

谷歌搜刮案例

时候:2018-10-09 10:14来源:知行网www.zhixing123.cn 编辑:麦田守望者

  起首登岸GOOGLE的网站---www.谷歌.com, 第一次进入GOOGLE,它会按照你的操纵体系,肯定说话界面。需求提示的是,GOOGLE是经由过程cookie来存储页面设定的,所以,如果你的体系禁用cookie,就无法对GOOGLE界面进行小我设定了。
      GOOGLE的首页很清爽,LOGO下面,摆列了四年夜服从模块:网站、图象、消息组和目次办事。默许是网站搜刮。


1.搜刮成果请求包含两个或两个以上的关头字

      一般搜刮引擎需求在多个关头字之间加上“+”,而GOOGLE无需用明文的“+”来表示逻辑“与”操纵,只需空格便可以了。
      示例:搜刮所有包含关头词“讲授设想”和“建构主义”的中文网页
      搜刮:“讲授设想 建构主义”
      成果:约有16,700项适合讲授设想 建构主义的查询成果,以下是第1-10项。 (搜刮用时 0.13 秒)
      重视:文章中搜刮语法内里的引号仅起援引感化,不克不及带入搜刮栏内。


2.搜刮成果请求不包含某些关头字

      GOOGLE用减号“-”表示逻辑“非”操纵。       
      示例:搜刮所有包含“讲授设想”而不含“建构主义”的中文网页
      搜刮:“讲授设想 -建构主义”
      成果:已搜刮有关讲授设想 -建构主义的中文(简体)网页。 共约有5,150项查询成果,这是第1-10项 。 搜刮用时0.40秒。
      重视:这里的“+”和“-”号,是英笔墨符,而不是中笔墨符的“+”和“-”。别的,操纵符与感化的关头字之间,不克不及有空格。比如“易筋经 - 吸星年夜法”,搜刮引擎将视为关头字为易筋经和吸星年夜法的逻辑“与”操纵,中间的“-”被忽视。


3.搜刮成果起码包含多个关头字中的肆意一个

      GOOGLE用年夜写的“OR”表示逻辑“或”操纵。假定你是布兰妮和批头士的歌迷,现在要查找所有关于布兰妮和批头士的中文网页。
      示例:搜刮包含“讲授设想”或“建构主义”、或二者均有的中文网页。
      搜刮:“讲授设想OR建构主义”
      成果:已搜刮有关讲授设想 OR建构主义的中文(简体)网页。 共约有31,300项查询成果,这是第1-10项 。
      重视:小写的“or”,在查询的时候将被忽视;如许上述的操纵实际上变成了一次“与”查询。


4.对搜刮的网站进行限定

      “site”表示搜刮成果范围于某个详细网站或网站频道,如“sina.com.cn”、“edu.sina.com.cn”,或是某个域名,如“com.cn”、“com”等等。如果是要解除某网站或域名范围内的页面,只需用“-网站/域名”。
      示例:搜刮中文教诲科研网站(edu.cn)上所有包含“金庸”的页面。
      搜刮:“金庸 site:edu.cn”
      成果:已搜刮有关金庸 site:edu.cn的中文(简体)网页。 共约有1,730项查询成果,这是第1-10项 。 搜刮用时0.23秒。
      搜刮:“鲁迅 site:edu.sina.com.cn”
      成果:已在edu.sina.com.cn搜刮有关 鲁迅的中文(简体)网页。 共约有672项查询成果,这是第1-10项 。 搜刮用时0.24秒。
      重视:site后的冒号为英笔墨符,并且,冒号后不克不及有空格,不然,“site:”将被作为一个搜刮的关头字。别的,网站域名不克不及有“http”和“www”前缀,也不克不及有任何“/”的目次后缀;网站频道则只范围于“频道名.域名”体例,而不克不及是“域名/频道名”体例。诸如“金庸 site:edu.sina.com.cn/1/” 的语法是错误的。


5.查询某一类文件

      “filetype:”,服从已非常强年夜,可以做很多意想不到的事情。最首要的文档搜刮是PDF搜刮。PDF是ADOBE公司开辟的电子文档格局,现在已成为互联网的电子化出版标准。目前GOOGLE检索的PDF文档年夜约有2500万摆布。PDF文档凡是是一些图文并茂的综合性文档,供应的资讯一般比较集合全面。
      示例:搜刮关于电子商务(ECOMMERCE)的PDF文档。
      搜刮:“ecommerce filetype:pdf”
      成果:已向英特网搜刮ecommerce filetype:pdf. 共约有25,500项查询成果,这是第91-100项 。 搜刮用时0.44秒。
      “filetype”的另外一个强年夜用处则在图片搜刮。下文将对GOOGLE的图片搜刮服从作详细申明,此处只是略提一下。进入“http://images.谷歌.com/”,查找关于本拉登的JPG图片。


6.搜刮的关头字包含在URL链接中

      “inurl”语法前往的网页链接中包含第一个关头字,前面的关头字则呈现在链接中或网页文档中。有很多网站把某一类具有不异属性的资本称呼显现在目次称呼或网页称呼中,比如“MP3”、“GALLARY”等,因而,便可以用INURL语法找到这些相关资本链接,然后,用第二个关头词肯定是不是有某项详细质料。INURL语法和根基搜刮语法的最年夜辨别在于,前者凡是能供应非常切确的专题质料。
      示例:查找微软网站上关于windows2000的宁静课题质料。
      搜刮:“inurl:security windows2000 site:microsoft.com”
      成果:已在microsoft.com内搜刮有关inurl:security windows2000 的网页。 共约有188项查询成果,这是第1-10项 。 搜刮用时0.27秒。


7.搜刮的关头字包含在包含在网页题目中

      “intitle”和“allintitle”的用法近似于下面的inurl和allinurl,只是后者对URL进行查询,而前者对网页的题目栏进行查询。网页题目,就是HTML标识表记标帜说话title中之间的部分。网页设想的一个准绳就是要把主页的关头内容用简练的说话表示在网页题目中。是以,只查询题目栏,凡是也能够找到高相关率的专题页面。
      示例:查找讲授设想的相关质料。
      搜刮:“intitle:讲授设想”
      成果:已搜刮有关intitle:讲授设想的中文(简体)网页。 共约有465项查询成果,这是第1-10项 。 搜刮用时0.16秒。


8.图片搜刮

      GOOGLE首页点击“图象”链接就进入了GOOGLE的图象搜刮界面“images.谷歌.com”。你可以在关头字栏位内输入描述图象内容的关头字,如“NBA ”,就会搜刮到年夜量的关于NBA的图片。GOOGLE给出的搜刮成果具有一个直观的缩略图(THUMBNAIL),和对该缩略图的简朴描述,如图象文件称呼,和年夜小等。点击缩略图,页面分成两祯,上祯是图象的缩略图,和页面链接,而下祯,则是该图象所处的页面。屏幕右上角有一个“删除帧”的按钮,可以把框架页面敏捷切换到单祯的成果页面,非常便利。GOOGLE图象搜刮目前支撑的语法包含“+”,“-”,“OR”,“site”和“filetype”。
      示例:查找美国教诲网上的宇宙年夜爆炸jpg图片
      搜刮:“BIG BANG filetype:jpg site:edu”
      成果:搜刮有关 BIG BANG filetype:jpg site:edu 的图片(实验版)。 共约有337项查询成果,这是第1-20项 。 搜刮用时1.99秒。


9.目次内搜刮

      如果不想搜刮遍及的网页,而是想寻觅某些专题网站,可以拜候GOOGLE的分类目次“http://directory.谷歌.com/”,中文目次是“http://directory.谷歌.com/Top/World
/Chinese_Simplified/”。
      目前GOOGLE利用的分类目次采取了ODP的内容。“Open Directory Project”是网景公司所掌管的一项年夜型大众网页目次。由环球各地的任务编辑职员来考核遴选网页,并遵循网页的性子及内容来分门别类。是以,在某一目次门类中进行搜刮常常能有更高的射中率。别的,GOOGLE对目次中登录的网站进行了排序,可让一般的检索更具高效力。       示例:查找一下关于癌症医治和照顾护士方面的中文质料
      搜刮:先进入中文简体分类目次,再进入“健康”子目次,肯定选中“只在健康中搜刮”单选项目。在搜刮栏内填入“癌症”进行搜刮。
      成果:在分类健康项中搜刮癌症。 共约有370项查询成果,这是第1-10项 。 搜刮用时0.05秒。
      可以看到,上述查询成果比浅显的检索更有效,因为在分类健康项中进行搜刮剔除很多不相关的诸如消息之类的有效信息。不过,对中文用户而言,现在最年夜的问题是志愿的中文目次编辑太少,导致收录站点太少,是以搜刮成果范围显得过于局促。希望这个问题能跟着GOOGLE和ODP项目在海内名声的清脆而能获得改变。


10.消息组搜刮

      消息组有详确的分类主题,某些主题另有专人办理和编辑,具丰年夜量的有价值信息。  进入GOOGLE消息组“http://groups.谷歌.com/”,你有两种信息查找体例。一种是一层层的点击进入特定主题会商组,另外一种则是直接搜刮。现在,我们进行一个最简朴的搜刮实验,查找一下消息组中关于山顶洞人的会商信息。
      搜刮:“建构主义”
      成果:在各群组内搜刮 建构主义 共约有18项查询成果,这是第1-10项 。 搜刮用时0.29秒。
      搜刮成果默许遵循“留言内容”摆列,但是你也能够点击“遵循日期”按钮,让帖子遵循公布日期摆列。
      因为消息组中的帖子其实是多,并且又触及一些浅显搜刮所没有的语法,所以建议利用“高级群组搜索”进入高级搜刮界面。消息组高级搜刮供应留言内容、分类主题、题目、留言者、留言代码、说话和公布日期作为前提进行搜刮。此中作者项指作者发帖所用的独一辨认号电子信箱。

------分开线----------------------------
标签(Tag):谷歌搜刮案例
------分开线----------------------------
保举内容
猜你感兴趣