单项选择题

A.使用较短的seed word
B.对数据库预先屏蔽重复性的低复杂度区域
C.选择邻居单字时,只选择高度相似的邻居单字
D.从最初始找到的hit里面去掉一些零散的hit,只保留hit cluster
E.提前给数据库建索引
F.不计算p-value,只计算E-value