B2C站内搜索初探—写给不懂技术的你

2012-02-15 17:51:48来源:[标签:来源] 阅读 ()

新老客户大回馈,云服务器低至5折

  这之前:

  1、想写这篇文章很久,但一直纠结在搜索引擎具体的技术原理细节中,看得愈多,不懂的地方也愈多,迟迟不敢动手,这是非程序猿出生的痛苦。

  2、所有人都知道搜索是个复杂的玩意,本文试着主要从非技术角度思考并搭建一个适用于b2c网站的站内搜索系统,不涉及到太多的技术细节。至于具体的实现代价这里未做考虑(是通过简单的sql+缓存搞定、用lucene或Sphinx等全文检索引擎做二次开发、甚至找google 百度买代码做二次开发,听你们程序猿的吧,你做不了主)。

  3、本文多次提到站内搜索,而非站内搜索引擎,这两者间有巨大差别(我不是很确定最终设计出来的是否会是一个真正意义上的站内搜索引擎)。

  4、本文参考了较多资料,例举如下,供参考学习

  《web信息架构-设计大型网站》这本经典书籍(不建议新手购买)

  美女西乔的几篇文章http://blog.xiqiao.info/2009/06/02/343

  yeeach.com 的几篇文章

  以及部分关于全文检索的论文

  在这之后,我们进入正文

  1、在开始考虑规划一个b2c站内搜索前,需要考虑清楚以下2个问题

  站内搜索要解决的问题和意义

  下面描述2类常见的搜索场景

  某用户小李,对网站A已较熟悉,要买电脑,此时知道网站A有电脑销售。直接输入关键词:Thinkpad X系列进行较精准的查询。

  某用户小白,听说了b2c网站A,第一次登陆,看见琳琅满目的商品。刚好之前浏览过相似网站,或对目前商品的类目有较全面的认识。想迅速定位脑海中已有的某几种商品。于是输入较宽泛的关键词进行模糊搜索:如输入羊毛外套、全棉T恤等较模糊的关键词。

  (1)站内搜索刚好满足这两类用户的需求。

  (2)通过分析用户关键词搜索频次,了解用户的潜在需求。(针对这点,我一直有个想法,若发现大量搜索关键词为A的某类商品,而恰巧网站没有。网站为降低风险,是否可以采用预定的方式,先上架与目标关键词A吻合的商品X?)

  (3)对于网站运营人员,通过分析用户的关键词搜索日志,能修正商品命名方式,编辑出更加符合用户认知的命名方式(这里顺便提下一个免费强大统计用户站内搜索的工具—google analytics)

  

 

  分析你的网站是否需要站内搜索

  实际上现在站内搜索在b2c网站基本是标配,但这里仍然唠叨一下网站是否需要站内搜索,或仅仅是搜索而不引擎?

  (1)考虑网站商品的属性:以标准品、常见商品为内容的站点搜索使用率会高;而较偏门的商品,如绣刺、礼品这类B2C网站,用户对要搜索的关键词认知不够,大部分用户建立不起较清晰的心智模型,搜索使用率会偏低。

  (2)考虑网站可能使用站内搜索用户的绝对数,10万级别UV/日的网站,站内搜索使用用户的数量已经比较可观了,需要考虑他们的需求。

  (3)考虑商品类目数量、品牌数、sku数量,根据一点小小的经验,单品牌sku小于500的服装类网站站内搜索使用率远小于5%。

  (4)考虑客户重购率、购买周期(其实本质是考虑新客老客的组成),新客为主的用户,基本是试探性搜索,搜索使用率也偏低。

  总结一下:商品偏门、流量不高、sku少、新客为主的站点,站内搜索基本是摆设,即使要上站内搜索,亦可简单应付。

  这里要提到一点:很多客服经常自己需要用商品款号搜索商品,认为非常需要站内搜索,这不是用户需求,只能说明后端系统没做好。

  通过这么几个标准去判断,你会发现某些网站参考淘宝把站内搜索醒目的摆放在网站最中央显眼处是多么愚蠢!

  2、考虑清楚这两个问题后,你决定要上站内搜索了,那么先简单了解搜索引擎的工作机制

  以下是搜索引擎的工作机制

  爬虫抓取内容——建立(包括新增和删减)索引—储存索引—查询(用户查询)—–查询分析—查询结果排序—呈现结果

  (1)要提到的是,电子商务的信息通过手工录入或其它方式已经导入到了系统,不需要用到爬虫程序。

  (2)所谓索引,是指搜索系统对信息进行加工,把信息转换成搜索系统能快速理解并方便查询的过程。要多哪些内容建立索引、对哪些内容的组件进行索引,是下文要探讨的方向。

  (2)查询分析,这是最有技术含量的部分、涉及到搜索引擎的核心算法,对于中文全文检索,这里又涉及到所谓的分词技术。

  比较复杂,下文亦会做简单解说。

  (3)查询结果排序,这也是较复杂的部分,排序方式多种多样。最常见并合理是“根据搜索关键词的相关性”进行排序,什么是最相关的搜索结果?对同一个关键词,每个人的理解可能不一样,而要通过程序去理解并判定,技术含量可见一斑。最著名的是Google 首创的page rank 排名运算法则。下文也将对b2c的排名算法做简单阐述。

  (4)搜索结果呈现,对不懂技术的人来说,这是最容易把握,并指点江山的部分。下文会做重点阐述。

  为了便于区分什么是站内搜索,什么是站内搜索引擎,这里贴一张分析表格(出处不详):

  

 

  本文先说到这里,下一篇文章将阐述以下问题

  想让用户搜什么?

  想让用户搜索产品的哪些组建?

  如何平衡查全率和查准率

  为了让用户迅速定位查询的关键词,要做哪些工作?

  要呈现哪些内容组件给用户?

  查询结果的排列方式?

  其它辅助性功能。

  界面设计

        原文地址:http://aboutb2c.com/255

标签:

版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点,本站所提供的摄影照片,插画,设计作品,如需使用,请与原作者联系,版权归原作者所有

上一篇:影响用户购买欲的几点因素分析

下一篇:菜鸟郝晓奇:从业一年心得和经验的分享