没优化之前的索引文件包含了一系列的文件,其中每个文件的功能对应如下。
1.segments_* 文件描述一组索引的参数,使用头文件固定格式描述后面的内容,包括每个独立新建索引的大小、属性等。
2.Fnm文件是索引域的描述文件,一个独立的索引(PerIndex)叫做一个Segment(索引段),一个fnm文件描述了本索引的File数,各个Field的属性编号。
3.fdx文件是文档索引域值索引文件,采用定长方式储存,根据docid排序可直接定位,用来记录每个文档的stord fields值的储存的位置(文件偏移)。
4.Fdt文件是文档域值存储文件,存储stored fields值的文件。通过fdk中记录的偏移访问。
5.tis文件是存储每个term在文档中的分布信息。如文档频率、每个term文档出现次数记录的偏移和位置记录的偏移排列顺序。先按Field名字字典排序,在每个Field按term字典排序。
6.tii文件是tis文件的索引和精简,排列格式是一样的,但是不包含有每个term属性的信息。这个文件可以完全读入内存。
7.frp文件是tis文件的扩展。记录每个term在每个包含文档的具体出现频率。
9.prx文件是tis文件的延伸,记录每个term在每个文档的偏移信息。这个文件省略了docid,必须配合frp文件使用。
10.tvx、tvd、tvf用来索引和保持每个文档的向量化字段的信息。
分享到:
相关推荐
模拟设计物理文件的存储过程(连续文件、索引文件)
索引类型-说明 索引文件有数据文件和索引表文件组成。 索引表中存放记录的关键字和记录在文件中的位置。 多级索引。
检查索引文件与实际数据文件的一致性,需满足索引文件中的文件名与实际文件文件名一致
文件索引的创建 文件索引的创建 文件索引的创建 文件索引的创建 文件索引的创建 文件索引的创建
操作系统实验,使用vc,实现混合索引文件系统! 支持创建文件目录,查找文件和目录,显示目录内容!显示文件和目录所在盘块! 操作系统实验,使用vc,实现混合索引文件系统! 支持创建文件目录,查找文件和目录,...
这里我讲一下自己扩充nachos二级文件索引的解题过程。做一道试验题,总会遇到很多问题,而在解决问题的同时,也是提高能力的过程。
操作系统模拟实现单级目录、单级索引的索引文件系统课设报告
SQL SERVER索引文件迁移到文件组,可以将索引和数据文件分在不同的文件组中,实现物理分离,便于管理
本软件对指定的目录下的指定属性、指定扩展名文件(包括子目录下的文件)进行编目索引,保存为txt、htm、word文件(word文件需安装office)。 被勾选属性的文件可以索引,未勾选属性的文件将不被索引。既有勾选属性...
模拟设计物理文件的存储过程——串联文件、索引文件,其中有代码,实现了多级索引,个人原创。
lucene索引文件格式介绍,很详细,每一个文件都解释了,一目了然,做项目用的
被勾选属性的文件可以索引,未勾选属性的文件将不被索引。既有勾选属性,又有未勾选属性的文件,不备索引。 被索引文件扩展名若都不选表示选择无扩展名文件。 索引文件中每一项就是文件名,可以无扩展名,可以...
保存为txt文件(索引文件)。 索引文件中每一项就是文件名,按所属目录进行分类,文件名每一项可以进行连续编号,也可以按目录分别进行编号,还可以不要编号,可以选择编号方式。目录名单独编号。 该软件简单易用...
windows 环境下对所有文件进行全盘检索,不必记住相应路径。 免安装,支持正则等操作。==============
lukeall,Lucene索引文件查看工具可支持Lucene4.7版本的索引查看,直接双击打开,选择索引目录进行使用
源码里面的路径需要自己改变,测试数据为utf-8编码,源码里面附有gb转...里面的方法适用与建立简单的文件内容索引(把文本作为数据库)。没用二进制的存取方式是为了c++和php兼容。(简单的模仿了FAT(文件分配表))
非常不错的索引文件查看工具!大家可以试试!
VC知识库1-53期合订本索引文件。(注:不含各期杂志)
索引结构文件包括一级索引,二级索引 #include #include #include #include #include #define BLOCKNUM 8000 //磁盘物理块个数 #define DIRECT_ADDR_NUM 10 //直接寻址地址个数 #define INDEXTABLE_NUM 100 //...
关于索引的介绍,以及b+树结构图,两种索引性能比较,索引优化建议