影音先锋男人网,全網國產.日韓.歐美.各類影視全部免費觀看

致力于企業(yè)品牌

形象建設(shè)和傳播

> 網(wǎng)絡(luò)營(yíng)銷

> 百度推廣

> 常見疑問

> 建站快訊

飛揚(yáng)動(dòng)力推薦文章

· 國(guó)內(nèi)在線分享服務(wù) 云筆記網(wǎng)址收

· 我國(guó)首個(gè)自主可控的華為原生鴻蒙

· 遠(yuǎn)程管理服務(wù)器時(shí)，有哪些登錄服

· SSH連接、RDP連接和FTP

· 某房屋安全檢測(cè)公司的網(wǎng)絡(luò)推廣方

· 山西醫(yī)藥醫(yī)療器械網(wǎng)站備案前置審

太原網(wǎng)站制作：首頁 > 新聞中心 > 網(wǎng)站知識(shí)

從五個(gè)方面淺析搜索引擎如何處理搜索詞

arezimacoaching.com 2011-03-20 10:09:13 來源：飛揚(yáng)動(dòng)力瀏覽次數(shù)：8367

　　搜索引擎其實(shí)也是WEB2.0的典范，因?yàn)樾枰幚碛脩糨斎肓藬?shù)據(jù)，所以能很好和用戶產(chǎn)生交互。但對(duì)于搜索引擎而言，并不會(huì)把用戶輸入的所有詞語都直接用于排名，而是首先會(huì)經(jīng)過自己的處理，這次處理之后的詞語才能直接用戶排名。本文根據(jù)自己的總結(jié)和大家分享搜索引擎是如何處理我們輸入的搜索詞。

　　第一、首先分詞：分詞是一大特色，無論我們輸入的是長(zhǎng)句子或者是短語，搜索引擎都會(huì)把這些詞語進(jìn)行切分，將這些搜索的字符串切分成以詞為基礎(chǔ)的關(guān)鍵詞組合。比如我們輸山西熱泵網(wǎng)，百度自動(dòng)將www.sxrb123.com排上第一個(gè)作為結(jié)果。只要這樣，才能更好的通過自己已經(jīng)預(yù)處理后的數(shù)據(jù)庫(kù)進(jìn)行查詢和比對(duì)，把所有符合這些詞的也沒列舉返回給用戶。這個(gè)分詞和頁面分詞的原理有些類似。

　　第二、去停止詞：我們?cè)谒阉鲿r(shí)候帶有很多的主觀性，很多時(shí)候把口語話的一些詞語都用在了搜索詞上，但這次詞往往對(duì)要搜索的內(nèi)容沒有實(shí)質(zhì)性的幫助，但我們已經(jīng)養(yǎng)成了輸入這些詞的習(xí)慣，所以搜索引擎必須要能去停止詞，最大程度上保證搜索的準(zhǔn)確率以及相關(guān)性。

　　第三、指令的處理：平時(shí)我們?cè)谒阉鲿r(shí)會(huì)輸入多個(gè)詞語，其實(shí)默認(rèn)的情況下，搜索引擎把多個(gè)默認(rèn)的詞語都按照“與”來進(jìn)行詞語。比如你搜索“減肥”“網(wǎng)站”時(shí)，搜索引擎會(huì)默認(rèn)我們輸入的“減肥網(wǎng)站”來進(jìn)行處理，單獨(dú)包含“減肥”或者“網(wǎng)站”的內(nèi)容理論上將不會(huì)返回，但實(shí)際情況往往也會(huì)出現(xiàn)單獨(dú)包含一個(gè)詞語的網(wǎng)站。另外，還要處理各種高級(jí)搜索指令的詞語，比如加號(hào)減號(hào)等。

　　第四、錯(cuò)誤矯正：很多時(shí)候我們輸入都會(huì)存在錯(cuò)誤的問題，拼音本來諧音就比較多，輸錯(cuò)也實(shí)屬正常，但如果搜索引擎不進(jìn)行糾錯(cuò)的話，就會(huì)返回很多我們不希望看到的結(jié)果。所以，有時(shí)候我們即使輸入的全拼，搜索引擎也會(huì)根據(jù)這個(gè)來提示正確的中文。

　　第五、分類對(duì)待：不同詞語一般是不同對(duì)待的，這是搜索引擎的一個(gè)特色功能。比如我們搜索一般性的關(guān)鍵詞，返回的一般以網(wǎng)頁居多，而當(dāng)我們搜索一個(gè)明星的名字，則會(huì)出現(xiàn)很多新聞、視頻、圖片等綜合的搜索結(jié)果。所以，搜索引擎要根據(jù)用戶的需求去進(jìn)行判斷。這次判斷都是在預(yù)處理階段進(jìn)行的。比如我們搜索二手絎縫機(jī)的信息，也可以看見絎縫機(jī)的信息等。

　　好了，搜索引擎對(duì)于搜索詞的處理基本是從這五個(gè)方面進(jìn)行，在這里給大家做個(gè)總結(jié)：分詞、去停止詞、指令的處理、錯(cuò)誤矯正、分類對(duì)待。雖然這個(gè)對(duì)于我們做網(wǎng)站沒有直接的關(guān)系，但多了解一些基礎(chǔ)知識(shí)相信會(huì)有間接的作用。網(wǎng)站，用戶，搜索引擎本來三個(gè)就是一體的，這三個(gè)組成了整個(gè)互聯(lián)網(wǎng)。很多道理也是想通的，知道了這些簡(jiǎn)單的知識(shí)，有可能會(huì)引發(fā)我們其它方面的一些思考和啟示。

網(wǎng)站建設(shè)成功案例

左云縣人大常委會(huì)

北京綠房子裝飾工程設(shè)計(jì)有限公司

寧武智庫(kù)科技有限公司

山西盛龍華磁材有限公司

山西鑫郭記餐飲文化有限公司

太原網(wǎng)站建設(shè) 網(wǎng)站知識(shí)最近更新

· SSH連接、RDP連接和FTP連接VPS服務(wù)器	· 遠(yuǎn)程管理服務(wù)器時(shí)，有哪些登錄服務(wù)器的軟件？
· 山西醫(yī)藥醫(yī)療器械網(wǎng)站備案前置審批所需材料清單	· 網(wǎng)站內(nèi)容常見可能違反廣告法的重要提醒
· SSL證書是什么？SSL服務(wù)器證書免費(fèi)贈(zèng)送	· 網(wǎng)站對(duì)歷史發(fā)布信息進(jìn)行備份和查閱的相關(guān)管理制度及執(zhí)行情況
· IIS7禁止某個(gè)IP或IP地址范圍訪問網(wǎng)站的方法	· 什么是域名證書？有法律效用嗎？
· 營(yíng)銷型網(wǎng)站必須具備的要素	· 泉州企業(yè)網(wǎng)站服務(wù)器放境外打不開怎么解決？
· 網(wǎng)站備案可能會(huì)被注銷的八種原因	· 醫(yī)院網(wǎng)站備案怎么弄？

關(guān)于我們

飛揚(yáng)動(dòng)力立足山西，面向全國(guó)，專注營(yíng)銷型網(wǎng)站建設(shè)與推廣，以領(lǐng)先的網(wǎng)絡(luò)營(yíng)銷實(shí)力，打造太原網(wǎng)站建設(shè)行業(yè)品牌。用良心做好服務(wù)，用實(shí)力做好質(zhì)量！

聯(lián)系我們

地址：太原市長(zhǎng)風(fēng)西街62號(hào)長(zhǎng)風(fēng)世紀(jì)廣場(chǎng)C-1603

電話：0351-763 7101

QQ/微信：94589848

E-mail：c141@163.com

掃描二維碼

關(guān)注我們的公眾號(hào)

建站推廣快速了解

建站推廣熱線

133 1343 5212

飛揚(yáng)動(dòng)力提供企業(yè)網(wǎng)站策劃設(shè)計(jì)和維護(hù)推廣等網(wǎng)站相關(guān)服務(wù)，通過網(wǎng)站真正實(shí)現(xiàn)網(wǎng)絡(luò)成交！| 在線留言 | 所有產(chǎn)品 | 主業(yè)務(wù)：太原網(wǎng)站建設(shè)/太原網(wǎng)絡(luò)推廣