在谈搜索与人的关系之前,我们有必要学习一下搜索引擎的工作原理,大致可以分为以下三部分:
1、搜集信息:搜索引擎的信息搜集基本都是自动的。搜索引擎利用称为网络蜘蛛(spider)的自动搜索机器人程序来连上每一个网页上的超连结。机器人程序根据网页链到其他中的超链接,就象日常生活中所说的“一传十,十传百……”一样,从少数几个网页开始,连到数据库上所有到其他网页的链接。理论上,若网页上有适当的超连结,机器人便可以遍历绝大部分网页。
2、整理信息:搜索引擎整理信息的过程称为“建立索引”。搜索引擎不仅要保存搜集起来的信息,还要将它们按照一定的规则进行编排。这样,搜索引擎根本不用重新翻查它所有保存的信息而迅速找到所要的资料。想象一下,如果信息是不按任何规则地随意堆放在搜索引擎的数据库中,那么它每次找资料都得把整个资料库完全翻查一遍,如此一来再快的计算机系统也没有用。
3、接受查询:用户向搜索引擎发出查询,搜索引擎接受查询并向用户返回资料。搜索引擎每时每刻都要接到来自大量用户的几乎是同时发出的查询,它按照每个用户的要求检查自己的索引,在极短时间内找到用户需要的资料,并返回给用户。目前,搜索引擎返回主要是以网页链接的形式提供的,这些通过这些链接,用户便能到达含有自己所需资料的网页。通常搜索引擎会在这些链接下提供一小段来自这些网页的摘要信息以帮助用户判断此网页是否含有自己需要的内容。
仔细想想,这个倒跟我们人类的成长与发展很相似:
1、搜索信息:
我们的学习过程也就是一个搜索信息的过程,从开始我们呱呱坠地,来到世间的那天起,我们的思想接受不同信息的熏陶,不同的信息通过不同的媒介,不同的表现形式,通过中枢神经传递给我们的大脑,当然信息的表现形式呈现多元化,包括声音,图像,视频和一些可视介质,这点倒是跟互联网现在的信息表现形式相类似,有图像,视频,网页,音频等。
2、整理信息:
这个就相当于我们的大脑存储信息,大脑存储信息并不是杂乱无章的,也是分层次,分类型和时间进行存储,我们采集来信息是杂乱无章的,只有再重新整合,归类,衔接之后,才能趋于完整和成熟,我们的大脑就是一个庞大的数据库系统,时刻存储和调用我们需要的信息资源,当需要用到该信息的时候,外界不断的凸显该信息的相关内容,在一些约束条件的制约下,大脑有规则的对所存储的信息进行筛选,将有用信息调用出来。
3、接受查询:
生活中遇到某些困难的时候,我们需要不断的在大脑数据库中寻找,东找,西凑到相关的信息,偶尔会求助他人(其他搜索引擎),查询到的信息,我们也会用一个可视化界面(SERP)表现给大家,往往对于同一个问题,我们会有多种方案罗列出来。完成这一动作的同样是我们的五官。
4、垂直搜索:
由于我们每个人的社会阅历,成长经历,知识背景,职业等的不同,我们大脑所存储的信息资源也都是不同的,所有偏重,这类似于我们现在看到的垂直搜索的概念了,也就是一些专业搜索,行业搜索。