一、简介
全文检索是指计算机索引程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置,当用户查询时,检索程序就根据事先建立的索引进行查找,并将查找的结果反馈给用户的检索方式。
二、种类
全文检索的方法主要分为按字检索和按词检索。
按字检索是指对于文章中的每一个字都建立索引,检索时将词分解为字的组合。
按词检索指对文章中的词,即语义单位建立索引,检索时按词检索,并且可以处理同义项等。
三、工作原理
全文检索是指计算机索引程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置,当用户查询时,检索程序就根据事先建立的索引进行查找,并将查找的结果反馈给用户的检索方式。
四、功能
(1).建立索引
(2).处理查询返回结果集
(3).增加索引
(4).优化索引结构
五、结构
该系统核心具有索引引擎、查询引擎、文本分析引擎、对外接口等等。
六、特点
(1).最大程度上符合了网民对搜索的依赖
(2).查询时不访问数据库,降低了系统的压力。
(3).统计功能完善,抓住了市场方向。
(4).具有较好的移植性。