Hi,这是dot的腾讯微博,别吝惜你的关注,赶紧登录,和TA互动吧!

dot

征proximity的简化算法,允许某些条件下牺牲质量,这个在业内一定有成熟方案
姚星 : unigram:n docs的tf统计,新增unigram需相当谨慎!phrase:外围gob,求交单独统计。bigram:n docs的统计。bigram weigth较小未必建倒排,gob的锚文本、title也可采用bigram,未必所有需要proxmity。
正在加载...