【林克威專欄】做電商,網站內的搜尋要如何藉由產品策略優化搜尋排序?
【林克威專欄】做電商,網站內的搜尋要如何藉由產品策略優化搜尋排序?
搜尋引擎說穿了就是用來檢索資訊的系統,目的是協助搜尋儲存在電腦系統中的資訊。有很多人不知道,搜尋的結果一般被稱為:hits,大多會以表單的形式呈現。
使用者大多會藉由網站內的搜尋介面欄位進行初步搜索,時常會應用這樣的方式,快速找到想要的項目,進行後續的資訊獲取。也因為應用這樣的方式,成功改善用戶的體驗,轉化率自然而然也提高。
不過有些人會好奇,如何創建一個高效率的站內搜尋引擎?尤其在電商當道的時代,對於資訊的提供以及掌握,也決定了使用者在網站上的活躍度以及忠誠度。
搜尋與點擊做得好,就能避免跳出
對於電商、媒體內容平台以及SaaS服務等B端企業而言,投注在站內搜索功能的資源和技術越多,相對的降低跳出率、促進用戶轉化率就能較能夠實踐。同時,這也是快速蒐集用戶真實想法的好工具,每一次的搜尋和點擊,都促進了每個網站或電商平台的營運,企業甚至可藉此進行優化,特別是在當使用者進行站內搜尋時出現「查無資料」或是「無結果相符合」時,當企業掌握以上全局,夠可以反映出改善用戶體驗的方式就是:幫助使用者快速找到心中所想的內容,才能增加轉換率,降低跳轉率。
那麼如何快速建立一個高品質以及高效率的網站搜尋引擎?接下來我會以產品策略的視角切入。
系統逐漸複雜化,搜尋檢索技術成為其中關鍵!
先試想,任何一個複雜系統後面奠基的都是簡單系統,也就是說,是先有了單一的系統後再經由進一步的彙整和統籌技術,逐漸建立起這其中良好的運作方式。
也就是說,針對資訊檢索,過去所使用的測試集規模通常較小,而現在真實的資訊檢索環境複雜化許多。對此,自1992年起,一個名為TREC (Text REtrieval Conference) 的評估會議開始每年規律的在美國舉行。這樣的大型的實驗室測試機制,可以比較不同資訊搜尋的效能優劣,且舉行論壇讓人們有機會交流討論,因此TREC在資訊檢索領域中早已成為倍受矚目的標竿測試環境。最近的熱議的TF-IDF演算法,是一種用於資訊檢索常用加權技術。其中,更包含兩個關鍵要素:詞頻(TF)以及逆文檔頻率(IDF),這兩個要素的統計會在加權後獲得搜尋排序。
讓我們先來看一看這兩個專有名詞的定義:
- 詞頻(TF,即Term Frequency):詞頻指的是搜尋的詞彙在一篇文檔中出現的頻率。
- 逆向檔案頻率(inverse document frequency,idf):逆向檔案頻率則是是指搜尋的詞彙在整個語料庫中的頻次。
所以不難看出,當使用者輸入搜尋的詞彙後,對率先比對整個文檔庫中哪些文檔中包含的搜尋的詞彙為最多。而且,如果這樣的搜尋頻次包含的越多,所出現的這篇文件排名就越高。不過也要避免一些輔助句子表達的詞,也就是說,輸入的詞彙需要精準、講重點。
再來,引入第二個關鍵要素—逆向檔案頻率。它的應用邏輯跟詞頻相反,反而是降低語料庫中出現頻次多的詞的權重。 一個詞在語料庫中重複出現的次數越多,所包含搜尋詞彙的文件的排名就越低。
TF-IDF排序演算法主要針對非結構性長文本而設計,比如大型企業文檔,歷年判案文書,全球論文檢索庫等設計。
這類演演演算法是搜尋引擎的基石,很好的理解它們的原理,有助於我們設計自己的站內搜索。 接下來,我們談談針對獨立站、小程式、APP應用內搜索搜索問題應該怎麼設計和處理。
電商如何藉由數據屬性來優化排序?
由上述可以知道,搜索技術問題相當廣泛,而我們這次只談電商網站上,搜索的產品設計。
市場上,電商網站、軟體程式以及App的資訊(例如:流覽量、點讚數、轉發數、收藏數等)其實並非隨機混排,而是針對某一特定規則走,它包含非常多面向的細節,概述如下:
- 搜尋的屬性:包含標題、正文、標籤、文章描述、圖片描述、評論內容等。 這些屬性可以作為搜索的基礎屬性放入我們的站內搜索中。
- 熱議程度:包含使用者在電商網站上點讚、轉發、留言以及針對留言進行點讚,最後則是收藏和關注,藉由這些用戶的行為產生的指標,可協助電商管理者判斷網站內容的優質程度。
- 管理策略:作為經營者,有時候在管理上會依照經驗和後台數據進行判斷,手動調整一些內容,同時微調這些內容的在搜尋結果中的排序權重。
要如何管理並且進行最精確的判斷?首先要關注以下層面:
- 詞語相符程度:使用者輸入多個關鍵字中,相符程度最高者,排序理當較前。
- 精確程度:抓穩最關鍵的精準詞,沒有冗字,也會使排序在更前面。
- 搜索詞所屬位置:處於重要屬性中的詞,排名會更高。例如:標題或描述裡包含了搜索詞的文檔,排名將高於只有正文才出現搜巡詞彙的文件檔案。
- 業務屬性權重:有時我們所搜尋的關鍵詞彙,會是電影的名稱,而不是影星的名字。
- 錯別字:錯別字呼應了上述精確程度的問題,有錯別字當然精準度低。
因此,也再次呼應一開始所提,「站內搜尋」不需要使用係數或任何形式的加權平均值方式來判別排序權重,反而運用產品策略作為調整搜尋結果的切角更為有效。一旦電商網站搜尋檢索做得好就能夠成功降低跳出率,尤其對於B端企業來說,是強化使用者黏著度和促進轉化率的最佳利器。
除此之外,電商網站管理者在其中也佔了相當重要的角色,透過數據理解自己使用者,甚至是描繪使用者輪廓。特別是收集無搜尋結果的搜索詞,有助於更好的改進網站內容。
原文來自:林克威的電商老闆創業誌
圖片出處:unsplash
更多科學與科技新聞都可以直接上 明日科學網站 www.tomorrowsci.com