• <rt id="zltsm"><nav id="zltsm"></nav></rt>

    <cite id="zltsm"><span id="zltsm"></span></cite>
      <rp id="zltsm"><optgroup id="zltsm"></optgroup></rp>

      【SEO知識】SEO知識之搜索引擎基本概念、如何研究排名

      來源: 時間:2020-12-23 16:02:23 次數:

      在16年以前,豐聚覺得研究「排名」是比較難的,后來搞了一堆單頁站群、泛站群、資訊站群和少數幾個單站,大概前后10萬域名出頭,發現「搞定收錄」其實比「搞定排名」麻煩的多,甚至應付廣告主沒事總tm扣量、跑路不結算、域名被停止解析....,這個豐聚覺得都比研究排名麻煩。
      當下,隨著互聯網的崛起,且互聯網的崛起使許多線下的傳統行業越來越吃力,所以許多傳統行業的老板們,都紛紛開始向互聯網轉變,慢慢的,這種形式也被人們稱為“網絡營銷”,而網絡營銷的方式大部分老板們都選擇了SEO,但一些老板也想通過自己的學習,將SEO研究明白,而本期云南豐聚網絡,將講解SEO如何研究排名的規律方法,一起來看看。


      首先,先從搜索引擎的基本概念開始了解吧:

      一、搜索引擎基本概念:

      1.爬取、索引
      搜索引擎爬取全網海量頁面 → 進行基本的質量評分 → 過濾出小部分質量較佳的網頁 → 創建倒排索引(能夠通過關鍵詞查詢文檔)。
      2.召回
      用戶發起搜索請求 → 搜索引擎先對關鍵詞進行糾錯處理 → 拆成多個詞項 → 去索引中查找能夠命中這些詞項的文檔,可能就是這個數
      3.粗排
      但是文檔的實在數量太多了,一股腦的都推給用戶顯然很二逼,用戶不可能都看完,只會看其中極小的一部分,另外也沒法保證質量。
      所以要從海量召回的文檔中,刪除其中內容高度重復的文檔,并篩選與搜索詞比較相關的760個文檔,展現給用戶。
      這個環節屬于海選,需要大量計算,為了不讓用戶等待過長,一般用快捷優先且相對簡單的處理方式,比如BM25、TF-IDF、LDA,具體還有啥咱也不知道。
      4.精排
      之后就是對760篇文檔排序的過程,它的目的是讓排序結果的比較大概率符合用戶預期的結果,這樣用戶才更有可能點進去了解詳情,從而提升搜索的業務價值。
      這部分比海選要復雜的多,涉及一大堆數據挖掘、機器學習、用戶行為分析、用戶意圖識別等算法,大概包括:
      4.1通過用戶搜索詞和前N次搜索詞,結合歷史日志中其他搜索該詞的用戶瀏覽行為,來揣測用戶可能的搜索意圖
      4.2文檔的更新時間
      4.3文檔的歷史點擊率
      4.4文檔瀏覽后終結搜索的比例
      4.5用戶的網絡維度特征(IP、網絡類型、地域....)
      4.6與搜索詞文本匹配度非常高的TopN條文檔
      ....太多了咱也不知道
      上述過程,對應著搜索引擎中,爬取、索引、召回、粗排、精排的幾個階段,屬于搜索引擎系統入門級的常識。
      5.重排
      現在精排后面,還有重排,根據用戶的搜索場景(網絡、設備、近期點擊行為等)和媒體熱點,實時調整排序,比如:
      你用wifi跟手機網絡,搜索結果可能有所不同
      今天上午點擊的某個結果,下午再次搜索時排名就上去了。
      了解完這些之后,那研究排名如何的吧。

      二、如何研究排名

      這里我們就只用一家來看看。
      1.研究收錄 vs 研究排名
      在16年以前,豐聚覺得研究「排名」是比較難的,后來搞了一堆單頁站群、泛站群、資訊站群和少數幾個單站,大概前后10萬域名出頭,發現「搞定收錄」其實比「搞定排名」麻煩的多,甚至應付廣告主沒事總tm扣量、跑路不結算、域名被停止解析....,這個豐聚覺得都比研究排名麻煩。
      2.研究大站 vs 研究小站
      所以,豐聚覺得,大站與小站,研究排名,是兩種路線:
      大站研究的是,做的詞怎樣上首頁。
      小站研究的是,做哪些詞能上首頁。
      3.長尾關鍵詞 
      long long time ago,在做站群的時候,當時開發的還不是泛解析程序,能承載無限個關鍵詞的。是庫里有多少詞,這個程序就生成多少對應數量的頁面,或二級域名。
      這意味著,如果庫里面塞了一堆根本不可能排在首頁的關鍵詞,這是浪費系統資源的,畢竟新域名收錄有限,自然希望收錄的頁面,都是大概率能上排名的頁面。
      一個流量詞呢,在搜索結果表現,有4種特征:
      Top.10結果愛站權重很高(平均權重>7);
      Top.10結果愛站權重很低(平均權重<2);
      搜索結果數很低(搜索結果數<1000);
      有高有低(平均權重2-4);
      第.一種可能這個詞競爭度很大,或者本身是比較敏感的詞,比如醫療養生類的,所以百度特意分流給了一些信任度高的大站。
      第二種可能這個詞是違禁的,但百度有沒來得發現,也可能這個詞還沒被很多人發現。這個可以根據搜索結果的標題,是否完全命中關鍵詞來判斷,能命中是前者,不能命中是后者。
      第三種是這個詞是違禁的,且已經被百度發現刪除。
      第四種是正常的詞,比如不算熱門的小說、漫畫名啥的。
      已排名優先的清洗關鍵詞措施,是找出第1種和第3種詞,然后刪除掉。
      所以當時找詞,比如從愛站導出來的競品網站關鍵詞,會先按如上方法洗詞,洗完之后在上線。同等域名數量的情況下,能多出25%的流量。
      以上是研究長尾詞能夠大概率上首頁的問題。

      云南豐聚網絡科技有限公司 備案號:滇ICP備16002385號-11


      云南天助網
      日日摸夜夜摸狠狠摸 网站地图