爬网程序可以访问和读取您希望用于搜索查询的单个文件或内容片段。这
些文件的关键字和元数据存储在内容索引(有时称为“索引”)中。该索引包含关键字和元数据,关键
字存储在索引服务器的文件系统中,而元数据存储在搜索数据库中。该系统可维护关键字、与单个内容
片段关联的元数据以及从中对内容进行爬网的源的 URL 之间的映射。
爬网内容编辑
爬网内容 (Office SharePoint Server 2007),对内容进行爬网是指系统访问和分析内容及其属性(有时
称为“元数据”)从而建立可提供搜索查询服务的内容索引的过程。
通过成功地对内容进行爬网,爬网程序可以访问和读取用户希望用于搜索查询的单个文件或内容片段。
这些文件的关键字和元数据存储在内容索引(有时称为“索引”)中。该索引包含关键字和元数据,关键
字存储在索引服务器的文件系统中,而元数据存储在搜索数据库中。该系统可维护关键字、与单个内容
片段关联的元数据以及从中对内容进行爬网的源的 URL 之间的映射。
爬网原因编辑
当服务器场已部署并运行一段时间后,搜索服务管理员通常必须更改爬网计划。其原因如下:
1、为了适应停机期和高峰使用期的变化。
2、为了适应作为内容宿主的服务器上内容更新频率的变化。
爬网情况编辑
独立于较快主服务器上承载的内容,对较慢主服务器上承载的内容进行爬网。
对新的内容源进行爬网。
爬网的频率与目标内容更新的频率相同。例如,可能需要对每日更新的库执行每日爬网,并对很少更新
的库执行较低频率的爬网。