SEO算法分析(TF-IDF算法)

【SEO算法分析】搜索了一个词叫做“可以把服务器做很多虚拟主机卖吗”,从用户的字面的理解大家都懂,通过三个不同的搜索引擎,其实百度的相关结果40w数据左右,谷歌在52w,360未知(数据小),百度首页正确答案只有一个(百度自身产品百度知道),360一个问答(360产品)是正确的,谷歌无

那么我们先来进行分词,借助腾讯的分词算法工具来进行分词操作,分词以后得到的数据为:可以-把-服务器-做-很多-虚拟主机-卖-吗。严格来说虚拟主机这种属于词组,由于虚拟和主机同时出现在一起,搜索引擎分词算法把两个词合并成一个词组操作。而搜索引擎有一个计算原则就是名词优先,因为名词非常容易定位网页核心关键词主题,比如这个query的名词为服务器和虚拟主机,也就是最重要的词,其实作为用户一看这句疑问查询词的话,这两个词也是最重要的,也是搜索引擎非常智能的地方(所以很多新手SEO就不要再去猜百度这种搜索引擎怎么知道你网页好不好这种话题了,搜索引擎算法比各位想象的要强大和规范)。

那么搜索引擎为什么出来的结果都是不对称的,明明搜索的是一台服务器能不能做很多主机来卖,但是正确答案极少,其实我们可以通过一个共同点可以发现,这个词的搜索答案在百度40w的结果和谷歌50w的结果里面都没有很少的正确答案,即使有,也是由于搜索引擎对于分词算法的不严谨导致优质答案没有体现在100内,那么很多朋友可能在思考如何去捕获一些行业的搜索引擎流量,其实这种就是一个规则

具体思路如下:我们可以采集数十万的词库,选择词库里面高频词较少的词进行优质内容聚合采集,然后归档成一个有效内容库,推送给百度等各大搜索引擎,然后在这些词根后面统一加上一些通用性的语气词,比如怎么样,好吗等等,可以制造出大量的网站词库内容出来。

 

尽管搜索引擎已经有海量的内容,但是真正严格来说,有很多词搜索引擎是捕获不到优质的搜索结果,而借助分词+高频词处理(TF-IDF算法)以及优质内容构建可以快速的去拟补搜索引擎空白的领域,然后短时间内得到搜索引擎的一些优质流量!备注:多思考 多研究 多发现 理解搜索本质

未经允许不得转载:集众思SEO » SEO算法分析(TF-IDF算法)

赞 (0)

评论 0

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址