一個合格的SEOer需要對搜索引擎的原理有一定的了解,這樣在進(jìn)行seo時可以做到有理可依,有條不紊,而不必拘泥于固定的優(yōu)化方法和技巧。索引器是搜索引擎的一個比較重要部分,它一般使用集中式索引算法或者分布式索引算法。
索引器的算法對索引器,對搜索引擎是至關(guān)重要的,比如:我們熟悉的百度新聞,它是,比較具有實(shí)時性,并且數(shù)據(jù)量也是相當(dāng)?shù)拇蟆;葜輘eo理解是:為網(wǎng)站提供生態(tài)式的自我營銷解決方案,讓網(wǎng)站在行業(yè)內(nèi)占據(jù)領(lǐng)先地位,從而獲得品牌收益;SEO包含站外SEO和站內(nèi)SEO兩方面;SEO是指為了從搜索引擎中獲得更多的免費(fèi)流量,從網(wǎng)站結(jié)構(gòu)、內(nèi)容建設(shè)方案、用戶互動傳播、頁面等角度進(jìn)行合理規(guī)劃,使網(wǎng)站更適合搜索引擎的索引原則的行為。深圳網(wǎng)絡(luò)推廣公司在互聯(lián)網(wǎng)中成名的網(wǎng)站有很多,但單純的靠seo來生存的網(wǎng)站幾乎沒有,為什么?因?yàn)閷τ诰W(wǎng)站來講流量就是金錢,誰也不愿意在一棵樹上吊死,而且seo的見效快慢和網(wǎng)站流量的多和少又有關(guān)系,這就導(dǎo)致形成了一個死循環(huán)。此時索引器的算法對索引器的影響就顯得十分突出了。因此有人說,一個搜索引擎的有效性在很大的程度上取決于索引器的質(zhì)量。
接下來我們一起來系統(tǒng)了解索引器的功能,索引器的功能是理解搜索器搜索的信息,并對收集回來的網(wǎng)頁進(jìn)行分析,提取相關(guān)網(wǎng)頁信息,如網(wǎng)頁的關(guān)鍵詞,頁面使用的編碼,網(wǎng)頁URL等等。深圳網(wǎng)絡(luò)推廣在互聯(lián)網(wǎng)中成名的網(wǎng)站有很多,但單純的靠seo來生存的網(wǎng)站幾乎沒有,為什么?因?yàn)閷τ诰W(wǎng)站來講流量就是金錢,誰也不愿意在一棵樹上吊死,而且seo的見效快慢和網(wǎng)站流量的多和少又有關(guān)系,這就導(dǎo)致形成了一個死循環(huán)。然后更具搜索引擎的相關(guān)算法進(jìn)行大量復(fù)雜的計(jì)算,得到一些相關(guān)信息,然后利用這些相關(guān)信息建立相應(yīng)的網(wǎng)頁索引數(shù)據(jù)庫。
1. 索引項(xiàng)
通過前面的介紹,你一定了解了索引器的一些知識,下面有必要對索引項(xiàng)有所了解。什么是索引項(xiàng)了舉個例子,比如我們平時所說的索引器索引的時間,編碼,標(biāo)題等等都屬于索引項(xiàng)。
索引項(xiàng)可以分為兩種,一種是客觀索引項(xiàng),另一種是內(nèi)容索引項(xiàng)。其中客觀索引項(xiàng)是與文檔的內(nèi)容無關(guān)的,比如,我們發(fā)一遍帖子,里面的發(fā)帖,發(fā)帖時間,帖子地址等等都是客觀索引項(xiàng);而內(nèi)容索引項(xiàng)是反應(yīng)文檔內(nèi)容的,其理解起來就很容易了,在此就不舉例了。內(nèi)容索引又可以分為單索引項(xiàng)和多索引項(xiàng)兩種。
2. 中文分詞
中文分詞,你一定會想到全球最大的中文搜索引擎百度,因?yàn)榘俣人阉饕嬖谥形姆衷~上有著深厚的技術(shù)功底。一般搜索引擎索引英語單詞或者句子時候,是比較容易提取的,因?yàn)橛⑽膯卧~之間是用空格分開的,而這一切都是約定俗成的。但是對于漢語書寫的句子,就不能憑空格區(qū)別了,必須要進(jìn)行詞語的切分,也就是我們常說的分詞。
中文分詞是文本提取的基礎(chǔ),對于輸入的一段中文,然后進(jìn)行中文分詞,然后搜索引擎達(dá)到識別語句含義的效果。
中文分詞的方法一般可以分兩種,一種是機(jī)械匹配方法,另一種是概率統(tǒng)計(jì)方法。其中機(jī)械匹配是建立在已有的詞典大全上的,是和里面詞語匹配而得到的分詞結(jié)果。它一般分詞方法有:正向最大匹配法,逆向最大匹配法,最少切分和雙向最大匹配法。概率統(tǒng)計(jì)方法是通過概率統(tǒng)計(jì)后,然后再進(jìn)行處理而得到分詞。
3. 對seo的啟示
根據(jù)上面分析搜索引擎索引器的原理,我們可以粗略判斷一個搜索引擎的技術(shù)成熟程度,例如上面說到百度5分鐘自動更新新聞。如果網(wǎng)站是新聞資訊類的,可以注重信息發(fā)布的實(shí)時性;我們在確定網(wǎng)站的核心關(guān)鍵詞和關(guān)鍵詞時根據(jù)中文分詞原理,去掉冗余的詞語,把網(wǎng)站最核心的關(guān)鍵詞反饋給搜索引擎,這樣搜索引擎會給網(wǎng)站一個不錯的排名。
seo技術(shù)不僅僅是這一方面就能攻無不克的,還需要整體了解搜索引擎的結(jié)構(gòu)和工作原理的。當(dāng)然我會在后面陸續(xù)分享一些搜索引擎的知識,并分享自己根據(jù)這些原理和幾年的seo實(shí)戰(zhàn)經(jīng)驗(yàn)。