8.15價格戰期間,一淘網實時發布了對各大B2C電商的比價監測數據,那一淘網如何能夠保證時間的及時性與準確性呢?據一淘網工程師黑俠透露,在8.15價格戰期間,“價格擂臺”頁面大家電及3C數碼等品類商品的價格數據更新頻率達到15分鐘一次。
黑俠介紹,一淘搜索引擎的工作原理與通用搜索類似,都需要經過抓取、抽取、入數據庫、建索引、以及頁面展示等流程。對于購物搜索來說,搜索引擎蜘蛛就等于是一淘派出的“價格情報員”,一淘通過搜索蜘蛛自動瀏覽購物網站的商品頁面,收集所有購物網站的商品信息,抽取出商品標題、商品價格、商品圖片等重要信息存入數據庫,并建成索倒排引,在用戶搜索以后,來自于不同商家的,符合用戶搜索關鍵詞的商品信息就會一一展示出來了。
在8.15價格戰期間,一淘蜘蛛對于參與價格戰的大家電、3C數碼產品價格的抓取頻率高達5分鐘一次,再經過抽取、索引、頁面展現等過程,“擂臺”頁面商品的價格刷新頻率在15分鐘至30分鐘左右,全程再現了價格戰“戰況”。
除了實時監測當前的商品價格信息外,一淘從去年開始就保持著對重要商品、熱門商品價格變化情況的記錄,因此,對于那些價格變化頻繁的商品,一淘也能夠在第一時間將商品價格變化趨勢通過價格“曲線圖”等方式展現給消費者。所以,不只是8.15價格戰前夜的商品價格,即使是兩年以前的價格信息,一淘都可以追查出來。
一淘網披露的數據顯示,收錄的購物網站數量超過5000家,數據庫中的商品總數量超過10億件;除了商品價格信息外,還收錄了超過2億條商品的評論、新聞、資源等其它導購信息。
除了通過技術抓取保證實際的時實準確外,與商家合作由商家主動提供數據也是一種方法。據了解,目前一淘已經與當當、凡客、1號店等國內超過99%的購物網站建立了合作關系,合作購物網站數量超過1000家,這些商家都會主動、定時向一淘網提供商品數據。
據黑俠透露,在一淘日常的比價搜索中,至少能夠保證重要商家及商品價格信息平均每小時刷新一次;而對于一些冷門網站及商品來說,價格的更新頻率也至少在每天一次左右。
推薦閱讀
北京時間9月6日消息,據國外媒體報道,亞馬遜公司明天將在洛杉磯發布新款設備,其中就包括上周已停售的Kindle Fire的升級版。有消息稱,杰夫-巴貝佐斯(Jeff Bezos)可能會展示一款家庭影視設備。 科技博客AllThingsD首>>>詳細閱讀
地址:http://www.xglongwei.com/a/b2b/20120906/83829.html