Archive for 2010-02-07

网络营销数据解读(二)——事情不是你看到的那样

error10

上次(请先点击这里查看《事情不是你看到的那样——网络营销数据解读(一)》)出了10道题问大家说结论是否一定正确,很多朋友也很捧场地回答了问题。

基本上,10道题的结论都有问题。下面我分几篇文章来介绍怎样才能系统和科学的解读网络营销数据。

今天我们可以来讨论一个最基础,而且看起来很简单的问题:我们真的知道报告里的原始数据的含义么?

给一个简单的测试(这次后面是有答案的:p):

举例来说,如果您看到一份Marketing Agent给您的报告,里面说“我们发出去了10 million Email, deliver rate(到达率) 99.99%,unique open rate(打开率)高达19%,unique CTR(点击率)19%,看了信的人都点击了,说明设计很棒! 效果非常好!从点击来看,80%的客户都是New Visitor(新访客),说明我们这次活动对于抓取新用户是很成功的。唯一的缺陷是我们的网站抓住客户的能力,访客来到了网站之后,ATOS(平均访问 时间)只有19秒,我们下次应该进一步优化网站……”

您对这番话的理解是不是:

  • 到达率99.99%,那么有9.999 million的客户收到了邮件。
  • 有1.9 million的客户打开了email,也有1.9 million点击了email——这样想起来应该打开邮件的客户都点击了。
  • 1.9 million里面有80%是新用户,我让1.52 million本来不认识我的客户更了解我了。
  • 1.9 million访客,他们平均在我网站逗留了19秒——时间太短了,我们应该想想办法。

如果您觉得4条都是错的——恭喜您不用花时间看下去了。

如果您觉得4条里面有对的,说明您可能对某些网络营销数据还可以多了解一些:

1. New Visitor代表的不是“新用户”、“新顾客”或者“新访客”,它代表的是您的监控工具跟您说 “来的这个人我之前没见过”——每次有人访问网站,监控工具就会往那个人机器里留个痕迹(cookie)以便以后相认,下次他再来,系统察看他机器,发现 有这个痕迹,就觉得“这人我见过”然后把它归入“老访客 ”,而如果找不到这个痕迹,就会认为他是新访客。所以,当您的老访客换了一台机器,系统也会把他当作一个新访客;当您的老访客有意无意清空了痕迹 (cookie),系统还是会把他当作新访客……总而言之,80%的New Visitor不代表有80%的人从来没来过你网站,这个数据需要打个折扣——具体要根据您网站特点具体情况具体分析。

2. Open Rate不代表有百分之多少的人打开了您的邮件,它代表的是“有多少人的邮箱下载了您的监控图 片”——系统很难知道用户到底有没有看邮件,所以大部分系统会采用一个诡异的方式来侦测:他们在每个邮件里面加一张只有一个像素大小的小图片,然后用你的 email有没有去下载使用这张图片来判断你有没有打开这封信。所以,如果您的email默认不显示图片(比如gmail对于陌生邮件就都不显示图片), 系统就会认为这封邮件没有被打开过。所以unique open rate = 19%常常代表有超过19%的用户打开过邮件(看没看就不知道了……),这个数据可能是25%,那么就不是每个打开过邮件的人都点击了邮件。

3. Deliver Rate不代表有多少客户“收到”了你的邮件,它常常只代表这些客户的邮件服务器“没有把你的邮件退回来”,这封邮件命运难测,有可能是就此消失掉了(客户没有收到),也可能是直接进了客户的垃圾邮件箱,过了几天被自动清除了。99.99%也是要打一个折扣的。

4. ATOS,这个解释起来更加的复杂……对常见的监控系统来说,它是不知道访客具体在网站上停留了多久的。 为了计算您在网站的停留时间,它会在您打开第N个页面时去看一下表(比如09:30:22),然后在您打开第N+1个页面时再看一下(比如 09:30:50),然后它拿两个时间相减,得到您在第N个页面上停留时间(比如28秒)——说到这里您应该已经发现问题:它没法知道您在最后一个页面停留了多长时间。 对于市场营销来说(特别是针对新用户的 campaign),这个问题更严重——因为很多人点击广告,来到landing page,然后就走了,这些人一共就只访问了一个页面!系统拿不到第二个页面打开的时间信息,所以有可能会把这些人在网站的停留时间都算作0秒,那么您得 到的所谓“平均停留时间19秒”其实是个非常扭曲的数据,并不能代表真实情况(数据偏小)。举例来说,我在自己的 blog(www.MarsOpinion.com)上安装了Google Analytics,它监控的用户访问时间如下图,可以看到ATOS是3:11秒:

image

如果我只看那些“只访问了一个页面”(对于blog来说,很多人只是上来看最新更新,bounce rate很高)的访客,会发现ATOS居然是0秒:

image

而我如果看“访问超过一个页面”的访客,这个数据又变成了惊人的9:46!是第一个数据的3倍!

image

现在,您是不是觉得这些“一目了然”的数据其实并不是那么清楚?

如果我们对那些数字代表什么含义都不清楚的话,解读又从何说起呢?

再来一个非常常见(无数家EMail Solution咨询公司都有类似的Case Study)的例子看能不能让您更晕:

1. www.MarsOpinion.com(我的 blog,鉴于不注明出处的转载越来越多,不得以都用自己blog做例子,把链接放到文章里面)的Shopping Cart Abandonment Rate为70%,100个人把东西放到购物车里,只有30人完成订单结了帐,有70个人本来想买东西最终放弃了!

2. 我们为www.MarsOpinion.com设计了一系列高科技人性化无以伦比的高级Campaign——去掉形容词之后你会发现Campaign的本 质是给这些Abandoned Cart的Customer发一封Email,内含“You forgot something in your cart“的提醒,以及一些incentives,例如折扣券。

3. 这个Campaign非常成功,AS Email的open rate比普通commercial email提高300%,CTR提高400%,转化率提高100%! 本来已经放弃购物的消费者收到了信,有10%的人通过点击这封Email再次来到了网站购物!所以我们可以推算出Abandonment Rate从70%下降到了63%!最终消费客户会增加23%! MarsOpinion.com年销售额2亿美金,所以我们预计这个这个Campaign可以帮助他们成长4600万美金!鉴于我们这个Solution 只卖200万,ROI高达2300%!

4. 为了体现我们的专业,我们做了A/B Testing:我们发现在客户放弃购物24小时后马上发Email,转化率比在3天后再发这封信要高87%!另外,我们发现,放一个coupon在邮件 里,转化率会提高47%!——我们经过精密计算,发现额外的销售和利润足以cover折扣券的成本。经过严谨的测试,我们决定……。

您觉得这个论证有问题么?问题在哪?

========== 我是分隔线 ==========

这个Case问题很多,但是最根本的——也是在其他Case中最流行的——就是计算Marketing Contribution的方式

因为Web Analytics的完善,网络营销常常能够取得比传统营销方式更完整全面的反馈信息,就好像读者留言所说“我们应该看实际效果,看带来了多少销售,带来了多少利润!”。

关键是:我们监控到的“带来XXXXXX”实际的含义是什么?Campaign创造的效果么?1000个人点击广告,300个人买东西,真的代表这个Marketing Channel为公司“带来”了1000个Visit和300个订单么?

不是的,我们监控的效果,那些数据,只能表明有“多少效果可能是由XX Campaign带来”,更具体地说,是“有多少人在点击了广告后的某一段时间内下了订单买了东西“,而不是“XX Campaign产生了这些订单”。你监控到这个campaign“带来”了300张订单,只能说明这个广告在购物过程中可能起到了作用,但并不能说这个 广告创造了300个订单——有可能300个人里面有299个原本就会来买:)

回到上面那个例子,Shopping Cart Abandonment Rate为70%其实并不能代表有70%的潜在客户放弃了购买。产生Abandonment的原因有无穷多,从技术上来说,很多Web Analytics Tool会把在一个Session“有加入购物车行为,但是没有结帐行为”就当成一个Abandonment,这样的话,客户离开电脑两个小时再下订单, 也会被算作Abandon了一次;从业务上来看,很多人用购物车来代替Wish List进行购物比较,这些人在实际购物前都会被计算很多次Abandonment,另外还有很多人仅仅是决定过一会儿再买(例如回家看看另一张信用卡卡 号),这些人也会被系统认为“放弃了购物”。了解了这个词的真实含义之后,我们至少可以知道一点——“其实这些人中间有很多本来就会回来买东西的”。假设 这些人中间9.5%的人本来就会回来购物好了,那么其实所谓的“本来已经放弃购物的消费者收到了信,有10%的人通过点击这封Email再次来到了网站购 物!”只是给网站多挽回了0.5%的客人而已,所谓的“这个 Campaign可以帮助他们成长4600万美金!”自然也就变成了增长230万美金。

之后的A/B Testing其实就更扯了(这也是业界真实的案例,而且这个A/B Testing的结论还被多家援引,成为了所谓Best Practice的论据)。假设我们说说的那9.5%的回头客会分散在Abandonment一小时后到30天后完成购物(时间越靠近 Abandonment,购物概率越大),你在24小时后发信当然效果比3天后发信“效果好”,不是因为你能产生更多订单,而是因为你能把更多的原本会发 生的订单效果计算到自己头上。因为发了Coupon之后Conversion Rate升高就说要发Coupon也是很扯的说法。真要算,Coupon成本要计算进去,而且这个成本不应该和所有使用了Coupon的订单去比(因为其 中大部分是本来就会购物的),而是应该和增量去比。假设我们所说的是10%的Coupon,那么成本就是4600*10%=460万美金,而按照前文所述 的实际销售增量才230万美金,就算你毛利率50%,也还是亏损几百万。何况,插入Coupon之后可能会引发一系列连锁反应——例如让消费者找到规律, 之后要买什么东西就Abandon一个Shopping Cart然后等Coupon来了再买之类,之后亏损会更大。

========== 我还是分隔线 ==========

综合第一个例子,如果我们不够了解New Visitor, Deliver Rate, Open Rate, ATOS,Abandonment Rate, Sales Attribution的真实含义,而只是望文生义想当然的话,我们很可能就会作出错误的判断。更糟的是,还有很多的名次定义比文中描述的这些更复杂和混 乱。

所以我的建议是:

1. 如果您是购买企业级的、付费的产品(例如Omniture),请在签合同时的时候顺便把training hours也买了,然后列张表把你关心的各个指标的具体定义问清楚(不同vendor的定义还不一样@__@),不要想当然

2. 如果使用免费的产品——例如Google Analytics,请仔细阅读文档,或者招一个愿意阅读文档深入了解工具的人。

3. 找专业人士咨询。——至于你找的人是否专业,你可以用本文中的例子去问他看他的结论,呵呵。有些人会把文 中的话说一遍之后告诉你其他更深入的信息(例如你用的工具其实是可以查ATOS的,只是误差有60秒之类;或者告诉你其他方法获得inbox deliver rate之类),另一些“网络营销专家”可能就会直接转话题开始和你谈概念谈人生谈理想,呵呵。

4. 如果实在找不到人,至少心里面要知道“不能望文生义,这些词未必是他们表面的意思”,给自己留有余地。

========== 我还是分隔线 ============

介绍两篇不错的文章,一篇的确不错,一篇帮朋友做实验

Avinash:搜索引擎优化指标&分析的问与答

Windows 7 中文版下载地址以及破解方法

看到这里,可能有几个读者会产生新的问题说:so what?

假如我们认真学习了(或者找到了懂行的人来帮我们),我们是否就能够解读数据,并且用数据来帮助我们更好的决策呢?

基本上……做到目前这一步还是不行,抱歉。

下一次接着说:怎样才能让这些数字对我们的生意更有意义

载声明:转载时请以超链接形式标明文章原始出处: http://www.marsopinion.com/2009/04/08/interpret-online-marketing-and-web-analytics-data/

网络营销数据解读(一)——事情不是你看到的那样

P1000848

如果您对以下问题的回答都是"不一定",而且您可以说出"不一定"的原因……这个系列之后的文章请直接跳过,不用浪费时间看了:)

1. 假如我们给Brandmarketing.com.cn(假设它是电子商务网站)在QQ和新浪上花同样的钱投放了广告,QQ广告一天展示了 5,000,000次,带来了50,000个访客,200个订单,新浪广告一天展示了4,000,000次,带来60,000个访客,300个订单。您觉 得我们是否应该减少在QQ的投放,加大在新浪的投放?

2. 假如新浪广告的Impression, Click和Order都是QQ广告的5倍,是否说明了新浪的投放ROI更高?

3. 假如QQ一天带来了50000个访客,30000个浏览了超过3个页面,新浪一天带来60000个访客,40000个浏览了超过3个页面,是否说明新浪流量更匹配?

4. 假如QQ一天带来了50000个访客,在您网站注册了300个新帐户,新浪一天带来60000个访客,400个注册了新帐户,所以新浪的投放性价比更高?

5. 您原来的SEM Manager离职,来了个新的,他来了之后关键字广告ROI大为提升,其他数据不变,CPO(平均订单成本)从20块下降到18块,我们应该表扬他吗?

6. 品牌宣传活动,您有两个landing page,A页面的Bounce Rate(有多少比例的访客看过这个页面马上离开)是80%,B页面的Bounce Rate是90%;Web Analytics显示,A页面最终产生了400个订单,B页面只有200个。我们认为A页面活动较为吸引人,或者页面设计较好,对么?

7. 您有一个网站,访问量很大,而且您做了监控,发现应该大多是真实的流量——但是,转化率很低(如果是e-commerce,就是成交量小,如果是别的,可能是下载量小、注册量小),结论是您的网站内容不够吸引人,对么?

8. 您发现您顾客的平均购买周期是30天,所以您认为每10天来一次的客户是超级忠实客户,而已经60天没来的客户可能是流失客户,需要用之前那篇粗糙却方便的客户关系管理模型来挽回这些客户,您觉得这个思路合理么?

9. 假如我们的网站上个月每天访问量是2万,这个月每天访问量1万5,说明我们网站出了什么问题,对客户吸引力下降了,对么?

10. 我们打算在网站上安装在线客服,当客户访问网站一定时间后还没有convert(下单、注册、下载你的电子书,试玩你的游戏),就弹出在线客服窗口来和客 户沟通。因为Web Analytics告诉我们说所有客户的平均停留时间是100秒,所以我们决定在100秒时弹出这个窗口,您觉得这样做合理么?

网络营销数据解读(二)——事情不是你看到的那样

转载声明:转载时请以超链接形式标明文章原始出处: http://www.marsopinion.com/2009/04/08/interpret-online-marketing-and-web-analytics-data-1/

SEO案例:锚文本、关键字、nofollow、Web标准化

前面谈到了做SEO需要注意的好几个因素。但是因为工作上的原因,好多因素没有讲透的。(不过其实有些东西我给我们团队的人都没有讲过的。)我看到一些人的回复,对有些SEO因素有误解。

还有,我看到很多人都没怎么关注“Web标准化”这一篇文章。其实这篇文章不是在解释为什么要web标准化,而是这样的:几乎所有的SEO站内优化,最终都要体现在网页代码里,而在网页代码里,“结构层”和“内容层”里的东西如何写是很重要的。

所以接下来讲一个具体的案例,让大家了解一下一个SEO同行是怎么应用这些基本的因素的。

这个案例就是Globalsources,是一个非常重视SEO的网站。它在细节上的考虑,帮助它获得了很不错的SEO流量。

先看它的页面:

http://www.globalsources.com/manufacturers/A-C-Motor.html

GlobalsourcesGlobalsources

首先,它很重视锚文本,因为锚文本描述了被链接的页面的内容。所以全站内所有指向首页(首页统一用顶级域名 www.globalsources.com)的链接,锚文本都是两个选好的关键字。

但是一般从网站设计的角度考虑,有很多指向首页的链接,是不能都用文字的。可以看看它网页的上部分,至少就有2个:

1,链接指向首页的logo就不是文字。遇到这样的情况,它就退而求其次,给这个链接的title属性和logo图片的alt文本都用和锚文本一样的文字。代码如下:

<a name=”top” href=”http://www.globalsources.com”>
<img title=”globalsources.com – manufacturers” src=”http://…../SITE/I/GS2.GIF” border=”0″ alt=”globalsources.com – manufacturers” /></a>

这些文本也起到了和锚文本一样的效果。

2,有时候,指向首页的锚文本是一些” Home”、“back”之类的文字,这些文字削弱了对首页的描述。它的处理方式就是把这些文字图片化,然后再和那个logo的处理方式一样,在 title和alt里面加文本。 大家看到的那个“Global Sources Home”其实不是文字,是图片而已。代码如:

<a name=”top” href=”http://www.globalsources.com”>
<img title=”globalsources.com – manufacturers” src=”http://ak……/I/HOMEICON.GIF” border=”0″ alt=”globalsources.com – manufacturers” width=”119″ height=”13″ align=”absBottom” /></a>

再来看它的锚文本是怎么选的。这个就涉及到SEO关键词的选择了。

它就给首页选了两个关键字:manufacturers (产品型搜索),globalsources(导航型搜索)

manufacturers 这个词语自然不必说,这个词语准确了描述了这个网站的内容,也是一个转化率很高的词语,本身的搜索量也是非常的大。给首页用这个词语,还有一个好处,是给 这个网站“定了性”。所以它的其他很多页面在manufacturers的长尾关键词上都排得很好。关于“给网站定性”这一说会在以后的文章中解释。

而选“globalsources”这个词语,有些人可能有点惊讶的。其实,当你拥有自己独有的一个品牌或产品名,它就成了你自己的“导航型搜索”关键词。在看那篇“SEO关键词选择” 的文章中,有些人可能只想着怎么把别人的“导航型搜索”流量导到自己的网站上来,却忽视了属于自己的“导航型搜索”。就象我在回复中说的那样,你有一个自 己的品牌,你的客户可能是从朋友那里听到或你的广告上看到,然后才来搜索这个词语的。但是一搜之下,发现找不到你的网站,或者只有你的代理商排在前面。而 这个客户可能是有购买意向,那这个损失是蛮大的。这种丢失了自己的“导航型搜索”关键词的情况,在很多中小网站中比较多。有时候,竞争对手抢了你的“导航 关键字”,在把本来属于你的客户转化成自己的。这一点,在PPC中,是公开的策略了。

而globalsources这个网站,即使“globalsources”这个词不用在锚文本里,其实搜索这个词语它还是能排第一的。因为它是一 个大站,一定有很多网站介绍它的时候,锚文本是这个关键字。而且它的域名就是它的品牌名,在外部链接的很多锚文本中,就会包含这个词语。如: 很多外部链接的锚文本就是它的域名本身—www.globalsources.com。所以外部链接的权重就可以让这个词语排第一。

不过,外部因素是很难控制的。它还要靠内部的锚文本来加强一下,加强这个词语的绝对排名优势,确保一定可以出现sitelink。

这样一操作,现在它的两个目的都达到了:

1,用美国IP ,在英文版的google.com 上搜索 “Manufacturers”,它排在第三。

一定要用美国IP ,在英文版的google.com查询一定要用美国IP ,在英文版的google.com查询

2,同样,搜索“globalsources”,排名第一,而且有sitelink。

sitelinksitelink

这篇博文写得有点啰嗦,所以要分成两篇来讲这个案例。其实,还可以给globalsources的做法改进一下的。大家可以先想一想怎么改进。

上篇谈到了Globalsources是如何应用“锚文本”和“关键字”的。这篇还是讲Globalsources,我们来给它的做法改进一下,看看如何应用“nofollow”和“Web标准化”。

Globalsources的这些SEO优化,全是Stephen在06年指导他们完成的。之后,他们就一直延续了那时候的改造而没有进一步优化。

为了处理“Global Sources Home”这个文字干扰主页内容的表达,它用的是把文字转化成图片的方式。其实就像在上篇的评论中“cm”说的那样,可以保留这个文字,而用nofollow把这个锚文本屏蔽掉的。 不知道大家还记得吗,在“锚文本的重要性”中提到过:一个链接被nofollow, PR和锚文本是不会被传递的。所以,用了nofollow,也是一种不错的解决方法。这样,在大网站的话,和网页设计人员也好交代了。不然,文字图片化在他们看来是很奇怪的做法。这样做不会削弱锚文本对首页的影响力。

在那篇和ZAC的nofollw争论后,有很多人都问我为什么不用robots.txt文件或者 meta robots标签来控制爬虫的抓取。其实,nofollow是这两种方式无法替代的。具体的原因,等你真正打算用nofollow,来查看一个网页上所有的链接的时候就知道。

nofollow的应用,在另一个国外大网站上已经用到了炉火纯青的地步。这个或许以后可以说。

再来看“web标准化”,SEO要在这方面做文章就要时刻想着“web标准化”中的那个网页模型。那个模型不是给网页设计人员看的。

Globalsources 在处理logo指向首页的链接中,用的是退而求其次的方法。其实不用退而求其次的,有一种更好的方法,这种方法就是“图片替换”。有比较多的国外SEO人在用。

先看Globalsources的代码,是这样写的:

<a name=”top” href=”http://www.globalsources.com”>
<img title=”globalsources.com – manufacturers” src=”http://…../SITE/I/GS2.GIF” border=”0″ alt=”globalsources.com – manufacturers” /></a>

而“图片替换”的代码就是这样的:

1,

<div id=”logo”>
<a href=”http://www.globalsources.com/”
title=”globalsources.com – manufacturers”>globalsources.com – manufacturers</a>
</div>

然后在CSS文件里这样写:

2,

#logo a {
background: url(http://…../SITE/I/GS2.GIF);
height:80px;
width:300px;
text-indent:-1000px;
}

这样的做法,是先做一个完美的“内容层”和“结构层”给搜索引擎看。代码1中,既有锚文本,又有title属性。而不像原来一样是没有锚文本的,只有title属性和alt文本。

代码2是一个“表现层”,text-indent:-1000px; 的意思把文字偏移到屏幕的一千个像素以外。用户看不到那些文字的。然后把那张logo图片作为这个<div>的背景。把原来那个的logo图 片放在CSS里来了。这样在外观上和原来是一模一样的。这种做法完美的平衡了用户体验与SEO。

这里有一个问题,就是google认不认为这个是作弊的方法。因为这个好像是隐藏内容,用户看到的和搜索引擎看到的不一样。这个担心确实有点道理。不过暂时来看,这个方法要应用得当,是没什么负面影响的。

因为这个方法其实一开始是网页设计人员为了更好的web标准化而做的。此方法由来以久而且比较多的网页设计人员在用。在08年11月份,有人咨询过 google的工程师,这个方法,在技术上不会被列入作弊的范围的。但是如果你恶意应用,还是会被认为作弊。比如在里面写一大堆东西,或者用来隐藏一篇文 章等等。

这种“图片替换”的思想就是把“内容层”的无关因素移到“表现层”。然后想办法怎么在“内容层”和“结构层”更好的表达信息给搜索引擎看。我上次说的web标准化会有很多技巧,这就是其中一个。还有更多技巧大家可以去发掘。

下篇博客我会讲一个三年前就预测到google会使用的排序方法。以及讲述一下我为什么能预测到这个。

来源:http://www.semyj.com

分词与索引库

分词是很多做SEO的人常听到的概念,为了让大家在这个方面不会有疑惑,现在要来讲一下分词以及索引库。这也是更深入的了解搜索引擎的开始。

搜索引擎每天都是在处理一个基本的需求:用户搜索一个关键词,搜索引擎马上找到相关的网页给用户。这个过程要怎么实现呢? 下面就分步来了解这个过程。

首先搜索引擎要尽可能多的把互联网上的网页搜集下来,这样能提供大量的网页给用户查询。这一部分由爬虫来解决,顺着互联网上的链接一个个往下抓取。 最后就有了一堆记录着网页各种信息的资料库。目前的现状,最后能使这个资料库里有大概100多亿个网页。资料库里记录了这些网页的URL,整个网页的 HTML代码,网页标题等等信息。

然后,搜索引擎拿到用户输入的这个关键词后,要从这个资料库里把相关的网页找出来给用户。这里就碰到好几个问题了:

1,要怎么快速的从上100亿个网页里找出匹配的网页的呢?

要知道这是从上百亿的网页里找符合这个关键词内容的网页,如果像用word里那种用ctrl + F 轮询的查找方式的话,即使用超级计算机,也不知道要消耗多少时间。但是现在的搜索引擎,在几分之一秒里就实现了。所以一定是做了一些处理才实现的。

解决办法也倒简单,就是建立一份索引库。就像我们查《新华字典》一样,我们不会翻遍《新华字典》的每一页来查那个字在哪页,而是先去索引表那里找这 个字,拿到页码后,直接翻到那页就可以了。搜索引擎也会为上百亿的网页建立一个索引库,用户查询信息的时候,是先到搜索引库里查一下要找的信息在哪些网 页,然后就引导你去那些网页的。

如下图:

索引库索引库

2,索引库里用什么样的分类方式?

我们知道,《新华字典》的索引表是用字母列表或者偏旁部首的分类方式的。那么搜索引擎的索引库里是怎么分类的?是不是也可以用字母列表的方式?

搜索引擎如果以字母列表的方式排列索引库,那么平均每个字母下要查询的网页数量是  100亿÷26=3.85亿 ,也还是一个很大的数字。而且搜索引擎上,今天是100亿个网页,过不了多久就是300亿个网页了。

最后,终于找到一个解决办法:索引库里用词语来分类。

因为尽管互联网上的网页是不断激增的,但是每一种语言里,词语的数量都是相对固定的。比如英语就是一百多万个单词,100亿 ÷ 1百万 =  1 万;汉语是8万多个词语,100亿÷8万=12万5千。都是计算机很容易处理得过来的。

用词语来分类还有一个好处,就是可以匹配用户查询的那个词语。本来用户就是要查这个词语的,那我就按这个词语去分类就是。

所以,搜索引擎的索引库,最后就是这个样子的:

模拟的索引库模拟的索引库

理论上,当用户输入关键词“mp3 player”搜索时,搜索引擎就从 “mp3”那行 和 “player”那行里拿出同时都有的、交集的url来即可。

上图也是现在英文版的google.com上的真实排名情况,可以看到 www.winamp.com 这个网站在搜索“mp3”的时候排第4位,在搜索“player”的时候也排第4位。当搜索“mp3 player”的时候,因为没有其他网站比它更匹配这个词语,所以它排在了第一位。

排第一排在第一

当搜索引擎把一个网站抓取下来后,接着要做的事情就是把网页里的词语分开放到索引库里。分词在这个时候就要应用到了,所谓的分词,其实很简单,就是把词语分开而已。

英语的分词好处理一点,因为英语的每个单词之间是用空格分开的,基本上就只要处理一些虚词、介词,还有一些词语的单复数,变形词等等。但是中文的分 词就复杂很多了,句子中的每个字都连在一起,有时候即使是人来判断,都还有产生歧义的时候。中文的分词有很多方法,也很容易弄懂的,如正向切分法,逆向切 分法等等,网上有很多相关的资料。

谷歌的中文分词方法是从国外一家第三方公司买的。百度的分词方法是自己创立的,可能在词库上面比谷歌有点优势。不过其他方面差了一些。

当爬虫找到一个网页的时候,在搜索引擎看来,这个网页就是一大堆词语的组合。基本流程如下:

搜索引擎的处理过程搜索引擎的处理过程

看完这个流程图,应该能给大家在做内部优化的时候有所启发的。

我建议大家再去看一下《把Web标准化进行得更彻底一点》这篇文章,还有《丰富网页摘要”,让你的网站与众不同》以及《SEO案例:锚文本、关键字、nofollow、Web标准化(一)》和 《SEO案例:锚文本、关键字、nofollow、Web标准化(二)》。那些文章和这篇文章一样,都是在讲同一个问题。

一定要站在搜索引擎的角度,把它的这些原理了解清楚了,才会让你明白哪些因素才是你应该关注的重点。

有人说: SEO就是重在细节。这应该是经验之谈。但是不知道大家有没有想过的是:是不是可能原本这些看似细节的东西,其实就是应该注意的重要的东西呢?如果你不能 控制好你的排名,有没有想过可能你以前特别在意的一些SEO因素,其实有些并不是重点?;而只是你把影响排名的部分因素弄错了?

上面的很多知识,其实在《搜索引擎营销:网站流量大提速》里都有提及的。那本书要去精读的原因之一就是它讲了很多看似很普通的原理,但是都是有用的。

比如在选关键词的时候,也可以参考一下这个词语的索引量。从上面的原理可以看出,这个索引量反应了这个词语在这种语言当中人们使用的流行程度。所以国外有些计算关键词KEI指数的公式里,也把这个关键词的索引量加入了进来。

http://www.semyj.com/archives/544

怎样形成一套非常科学系统的SEO方法

尽管SEO在中国已经不陌生,甚至都有形成一个行业的趋势,但是至今业内都还没有一套非常科学系统的分析方法。原因恐怕要归结于搜索引擎优化这个行 业的特殊性。搜索引擎严格保守他们的算法,只公布一些大家很难去知道原因的指南。所以很多SEOer都在玩一个永远也不知道具体规则的游戏,这是这个行业 混乱的根源。

我多次强调《google网站质量指南》 的重要性,还因为这是搜索引擎告诉网站主的仅有的一些正确的规则,如果连这点规则都不好好掌握,那我还不确定大家能从什么地方得到更权威的指导。但是在实 战中,尽管你熟读这个《指南》已经比很多人更了解搜索引擎的规则,不过仅仅知道这点东西是不够的,一套科学系统的分析方法能让你走得更远。

我想SEO经过了这么多年的发展,已经不应该再出现那种靠感性分析去做SEO的分析方法了。这种分析方法常用的语句就是:我觉得搜索引擎会如何如 何。如:我觉得搜索引擎不会那么笨,这点一定能处理好;我觉得搜索引擎会把这个因素当作排名的因素之一……。如果你是依靠感性分析去做SEO的,那你的 SEO流量的变化曲线也是很感性的。当然更不能去无根据的臆测和道听途说。如:没有理论基础的去猜想搜索引擎会怎么样或者每逢搜索引擎的相关人员以及什么 权威人士发表什么演说,就去盲目听从。

既然搜索引擎不告诉我们具体算法,那我们怎么才能建立这套科学系统的分析方法?答案是:从你知道的确信一定正确的理论开始,慢慢在实践中进化。

在上一篇《网页加载速度是如何影响SEO效果的》 中的那个分析过程,就是从一个确切知道的理论去分析,然后得到了另一个确切的影响SEO流量的因素。在这个过程中,确信没有错的理论是:搜索引擎爬虫一定 要抓取过那个页面以后,才会有机会收录这个网页的。根据文章中那个接下来的数据分析,可以得到:网页加载速度会在很大程度上影响SEO流量。

那接着分析,什么措施能影响网页加载速度呢? 网络环境、服务器硬件、CMS本身都能影响网页加载速度。优化其中的任何一项,都能提升网页加载速度。那马上又可以得出:网络环境影响SEO流量、服务器硬件影响SEO流量、CMS本身的速度影响SEO流量。

接着分析,CMS本身的优化可以做的事情有哪些呢? 启用Gzip压缩、合并CSS和JS文件、减少DNS查询、启用缓存等等都能优化CMS本身的速度。……这些东西,看起来是这么的眼熟,那是因为在 《google网站管理员工具》里的“网站性能”里,已经把这些建议都告诉你了。但是根据我们上面的这个分析过程,可以知道, “网站性能”里提到的这些优化,都是CMS本身的优化,并没有提到网络环境和服务器硬件的优化。只不过你确定这两个因素是确实影响SEO流量的。如果哪一 天《google 黑板报》或者 google的官方博客(需要翻墙)上出现一篇文章,告诉你如何挑选一个好的服务器托管商,千万不要惊讶,因为你早就知道为什么了。google一直以来都在用这种方式告诉你要如何去优化一些什么因素,只是站在他们的立场,不会详细向你解释为什么要这么做。

通过数据分析,还能知道谁影响的程度大一点,谁小一点。

很多的常识因素都可以这样一步步进化下去,这个分析过程,是非常科学的。不管是对你自己还是其他人,其中的原理你都可以解释得非常清楚。并且在这个 进化的过程中,你会发现你越来越能控制好SEO流量了。每一步的进化,意味着你对搜索引擎的了解又多了一点、SEO的知识结构又完善了一点,同时,对 SEO流量的控制能力又变强了一点。同时,你发现你和网页设计师以及工程师的矛盾也越来越少,因为好的SEO,是不会让SEO和网页设计师以及工程师的利 益是矛盾的。

知识结构、SEO可控性、部门关系知识结构、SEO可控性、部门关系

只要经历过非常多这样的分析过程,一定会颠覆很多人原有的SEO知识结构。因为以前很多流传的SEO方法,很多都是感性分析的居多,没有解释为什么要这么做,没有数据上的支撑,甚至没有理论上的支撑,所以没有抓住重点。我在《分词与索引库》说过,可能你以为是细节的东西,其实是重点,你以为是重点的东西,其实都可以忽略。

那么,在日常的SEO工作中,是一些什么能力支撑着你去进行这样一个分析过程呢?

不知道大家还是不是记得我在《怎么样学SEO》提到的那四种能力,在这个分析过程中:

1,弄懂搜索引擎相关技术和原理:可以从根本上了解搜索引擎,确定很多一定正确的理论,并可以找到很多值得去分析的线索。

2,了解网站制作相关的技术:能让你清楚网站上有哪些因素能影响搜索引擎的哪些方面,并用什么方法来解决问题。

3,数据分析能力:可以了解各种现有的因素如何影响SEO流量,并依靠这种能力挖掘更多的因素。科学系统的SEO分析过程,从头到尾都离不开数据的支撑。

4,了解你要排名的那个搜索引擎:不管你怎么努力,还是会有一些数据上和理论上都无法理解的问题。每个搜索引擎就像和人一样,是有一定的秉性的。可以通过你对这个搜索引擎的了解来得到答案。同时了解这个搜索引擎,也能让你获得更多的可以分析的因素。

最后说一下,这种从常识出发来科学系统的进行SEO分析的方法比了解部分搜索引擎的算法还更能控制SEO流量。

可能很多人会反驳这个观点,比如前段时间我朋友就和我说某外贸B2C网站的创始人是从谷歌出来的,那他们一定能做好SEO,我说那是不可能的。只有 那些自己做过搜索引擎的人才会理解为什么。比如:alibaba的B2B网站也算是一个搜索引擎,我是知道其中的排序规则的,但是如果给我一个商家的网 站,要我在alibaba上获得流量,在没有一套科学系统的方法之前,我是肯定做不好的。因为搜索引擎的算法不是加减乘除,不是这个因素加那个因素做好了 就可以获得好流量的。搜索引擎的设计者,知道这个或者那个因素的权重大小,以及可能产生的大致结果,但是具体的结果是自己也不能控制的。要不然百度的人, 不会每天搜索上千个词语来查看搜索结果的准确度了。而google的成功,也有一部分原因是当初yahoo采用了它的搜索技术,google借此积累了大量数据,实践并改进了算法。

而且,在搜索引擎内部,只有极少数的人知道各个因素的权重大小,绝大部分设计搜索引擎的工程师,都是负责某个具体的任务,优化和解决某个具体的问 题,如负责爬虫的工程师解决提高爬虫效率这一块的工作,负责内容消重的工程师就去减少索引重复内容。 连设计这个搜索引擎的工程师都如此,更别提一个远在其他国家的分公司的人员了。要不然,百度和google这么多离职的工程师不早就把算法泄漏了。

如果能自己用开源的程序做一个小规模的搜索引擎,就更能理解这个问题。即使这个搜索引擎的算法都是你自己调配的,你都不能预料到后来的搜索结果。而 且做搜索引擎是一回事,在搜索引擎上拉流量又是另一回事了。不然google不会后知后觉的知道原来网页加载速度影响SEO流量。

来源:国平 http://www.semyj.com/archives/1032

福布斯:网络营销中SEO、PPC和email效果最佳

网络营销的最佳方式一直以来都是一个争论不休的话题。不管是在线广告、视频广告、电子邮件直销、搜索引擎优化还是搜索引擎广告都有其自身的优点,唯一的争 论点在于哪个才具备最佳的投资回报率。电子邮件直销商一个亘古不变的话题,搜索引擎优化以其自然排名优势颇受青睐,搜索引擎广告以其品牌展示和最捷径的广 告投放也占据了一席之地。

日前来自福布斯的一份研究报告认为,搜索引擎优化、搜索引擎广告和电子邮件直销是网络营销中

最具投资价值的广告营销方式。

Christopher Hosford 在文章中表示,在网络广告的五大营销方式当中,在线广告和视频广告的投资回报率是最差。

该研究报告还显示,付费搜索广告和赞助商链接对品牌展示最具价值。

其实对于广告主来说,投资最少的钱得到最大的投资回报率,是他们进行广告投放的最终选择。每一种广告方式似乎都存在他们的优缺点,因此你很难一下子评判好哪个才是最佳的方式。
搜索引擎优化,还是搜索引擎广告?真是一个难题(赢时代配图)

小编认为,电子邮件营销作为历久弥新的一种推广方式,在垃圾邮件泛滥的现在,先前摧枯拉朽的广告效应气势已经基本不存在,取而代之的是它成为一种被厌恶的 营销手段,但是作为注册用户来说,因为有比较好的针对性在效果上可能会有所区别,比如招商银行信用卡的用户往往会接收到来自银行信用卡部门的旅游推介广 告,这种方式可能比较会被认可。

而在搜索引擎优化项目上,目前来说各大搜索引擎优化公司并不能对客户作出排名和优化具体效果的保证,在这一点上不管搜索引擎优化在自然排名上有多大的诱惑 力,也很难在效果上说服广告主投入更多的经费,因为广告主他们需要预先见识到广告投放产出的蓝图,如果没有可能也只是一次冒险行动而已,再加上搜索引擎排 名算法的频繁更改,事情会更加扑朔迷离的。


不管怎样,最佳投资回报率才是决定的关键(赢时代配图)

http://www.timev.com/sem/ppc/2009/0603/953.html

至于搜索引擎广告,小编认为是未来营销中最好的方式,他们能够根据网站推广的需要选定适合的关键词,并且在这些关键词的搜索上在搜索引擎中能够排名靠前, 达到最直接的广告展示和品牌展示。有人认为搜索引擎广告是按照点击付费的,因此在广告预算上可能是一个无底洞,再加上一些点击欺诈的存在,会导致广告主在 广告投放上心有余悸。其实这样的问题并不是真正的问题,在点击欺诈上,按照最新的研究因为关键词的匹配越来越精确,点击欺诈已经下降到10%左右,这样的 比例相对于其他广告投放样式的浪费来说已经算是一个低级的数值了。而在广告投放额度上,相比较于在线广告一次数万数十万的支出,这样的广告经费已经可以在 搜索引擎中导入无数的高价值流量了。

社会化媒体理性评估

像我们知道的一样,不少企业已经感受到社会化媒体的力量,但却并没有很快的投入Social Media Marketing。他们主要会有两种顾虑:第一是可控性的不确定,这里主要是对于可能出现的负面舆论的控制;第二是没有合适的效果评估体系,从而没有办 法有效的对最后效果进行评估。

很多时候,第二种顾虑是更要命的,因为对于负面舆论,企业虽然害怕,但多少还是有一些应付的经验。可是要说服企业去尝试一种无法评估效果的营销方式,难度非常大。MarketingSherpa的调研数据也说明了这点。

http://www.yunkeji.com/wp-content/uploads/2009/10/social-media-platforms.jpg

一些方法可以减少这种顾虑:

  • 只作为公关或者市场策略中的补充;
  • 相关的成功案例分析;
  • 零成本或者极低成本的测试;
  • 感性理解社会化媒体;
  • ……

但是这些方法多少都有些隔靴搔痒的味道。真正能打动企业进行社会化媒体营销的,还是一个行之有效的评估体系和看得见摸得着的ROI。国外在这个方 面,其实已经有了不少实质性的进展。像Radian6这样专业的社会化媒体测量服务已经得到了很多企业的认可,而Nielsen这样老牌的数据分析服务供 应商也推出了BuzzMetrics这样的服务为其客户提供社会化媒体方面的分析。

国外绝大部分主流的社会化媒体工具都开放了应用接口界面(API)方便第三方获取数据,而国外的企业客户对社会化媒体也有更深入的认知,这都为这些 收费高 昂的社会化媒体测量服务的发展提供了空间。在国内,我们面临不同的环境:最大的BSP是新浪博客、最热门的SNS是开心网、用户最多的 Microblogging工具是腾信滔滔,它们有很高的市场占有率和代表性。但同时它们都非常封闭,第三方很难从它们那里获得较多有价值的数据。

其实,一些国内的公司也推出了叫做“舆情监测系统”或者是其它名字的类似产品,但主要是针对国内论坛的数据监测,其全面性、公正性和真实性都很难保 证。在 这样的环境下,另一种可行性更高的办法是结合企业其它市场营销的评估体系、并利用一些可以得到的数据在社会化媒体营销前后的对比进行评估。这比建立一个独 立的、数理化的第三方评估工具要容易实现得多。

结合网站评估。对企业官方网站、品牌网站、产品网站、企业Blog以及其它的活动网站的测量:来自社会化媒体工具的流量、回复数量、跳出率变化等等。AWstats这样的本地日志分析工具或者Google Analytics这样的第三方分析服务都可以很好的完成这项任务。

结合搜索引擎。社会化媒体工具一般都对搜索引擎比较友好。一般来说,企业通过社会化媒体可以更容易的在搜索引擎中获得有利地位。相关关键词的搜索 量、SERP排名、相关网站的收录数、反向链接等等。这个时候,可以用Google Search Insights以及其它一些搜索引擎分析工具。另外,一些专门搜索Blog和BBS的搜索引擎也可以作为辅助。

结合传统营销KPI。品牌认知度提升、产品销量增加、客户满意度提高,对企业来说这些才是所有营销的根本目的、社会化媒体营销也不外乎如此。所以对这些数据的变化分析也能体现出社会化媒体对企业营销作出的贡献。

另外,像StartPR、SocialMention这类免费的工具虽然相对简单,但却也有很高的实用性。希望更多的国内网站能开放其数据,让我们看到更适合中国市场的类似工具出现

Amazon的客户图片分享对比京东的晒单功能

1. 前言

顾客在网站购物后,对于商品会有一种和别人分享的渴望,无论是展示商品、分享快乐、倾述不满均可,这些都
有助于其他未购买的顾客了解该商品。

早在2005年,Amazon就开始提供客户图片分享功能,并不断改良。最近国内的一些网站,也做了类似的功能,但有所不同,
本文将对比Amazon和京东的功能进行说明。

2. 什么是客户图片分享?

在Amazon中,全称是:Customer Images for : [Product Name],意思是你可以将他的商品的收货、商品特点、
商品使用(如如何安装、基本用法)、商品功能性能表现(如对于相机,拍摄效果)以及其它你可以拍摄下来作为
帮助其它购物者了解和学习关于该产品的一切。

3. 为什么需要分享

因为很多时候,网站对于产品的描述和产品的图片并不是很足够(这需要更多的人力和费用),鼓励已购买的顾客
上传分享图片,能够对后来的未购买顾客提供更多的产品信息、图片等。而对于网站管理者而言,如果您对你的网站
的产品质量和服务有信心,您应该有把握顾客分享的大多是快乐而不是不满,所以这些分享对商品的销售肯定有帮助。

4. Amazon的客户图片分享(Customer Images for:)

Amazon 的产品详细页面中增加了Customer Images for Product(客户图片展示)的功能,入口是:

点击后弹出新页面,如下图,这就是客户图片分享页面了。

  1. 产品名称链接:该页面是从产品详细页面的左侧“See all [XX] customer images”链接过来的,所以在页面的顶部,
    提供了产品名称的链接,点击可以返回产品详细页面。
  2. 顶端图片缩略图条:提供了分页、排序(2个方式)、并且在最后一个图片显示了“Add an Image here”(上传图片的
    快捷入口),很吸引人。
  3. 图片和描述:点击了一个缩略图后,下面左侧图片框会显示该图片,图片下面显示上传者对该图片的描述。
  4. 图片评分:“This Image”栏,提供了一个简约的图片左右切换功能,旁边是对该图片的评分(Like it?),
    哇,当前这张图片很受欢迎啊,我想上传者看到一定觉得很满足,很有上传的动力。
  5. 上传者:评分下面就是“Uploaded by“ ,上传者了。鼠标移上去会显示该上传者信息,点击链接会去到该
    上传者的简介页(Customer profile)。
  6. Mini Product栏:显示该产品名称、价格、库存、评价,最重要的是显示”Add to Shopping cart“和”Add to Wish list“两个按钮。
    这个功能最重要的目的就是吸引更多的顾客购买吧。
  7. Share your images:分享图片入口和上面第2点的”Add an image here“一致,但是表现方式不同。这个是必须的,
    上面那个是优化的。

Amazon的客户图片分享对比京东的晒单功能

5. 京东(360buy.com)

入口在产品详细页面的最下面,如下图,感觉太隐蔽了,可见京东并不是十分重视这个功能,这和Amazon放在
显著位置就有明显的不同了。

点击”晒单贴“下面的任一个主题,进入晒单显示页面。

  1. Mini Product:左侧是Mini Product页面,名称、价格、评价、评论数,最主要的也是”添加到购物车“。
  2. 下面是其它讨论话题。
  3. 晒单贴及回复:右侧主体部分是该晒单贴及该贴的回复。图片直接显示出来,类似于论坛的文章。
  4. 上传者信息:显示名称、会员等级和等级勋章、地区、注册日期。

6 对比和总结

  1. 展示方式:Amazon是图片集中式展示,对浏览者友好;京东是帖子式,对上传者友好。但仔细分析一下这个
    功能的目的,这个目的是让浏览者更容易的看到所有的分享图片,激发起浏览者的购买冲动。京东帖子式过分
    偏向上传者,上传者容易得到满足,但是浏览者则比较不便。所以展示方式方式我建议采用Amazon的形式。
  2. 上传者信息:Amazon显示上传者图片,京东显示等级勋章。这两者的不同在于京东突出用户的会员等级,买得
    多的顾客会因为勋章而得到满足,但Amazon更加注重顾客的个性化。
    即使是社区网站,也是主要显示顾客上传的个性化图片,而不是将勋章作为显示主体,那样不就是千人一面了吗?
    这并不合适。
  3. 上传入口:Amazon在客户图片分享页面提供了两个入口,但是京东没有在这里提供入口(而是在我的账号里面的
    订单提供入口),固然在订单那里需要提供入口,但是在这里不提供入口,我觉得不太好,因为1来订单入口比较
    隐蔽,2来对购物者而言,也有查看其他的分享的喜好,当看到别人分享时,会激起自己分享的冲动——毕竟分享
    也得花费时间拍摄、上传、写文字等。

http://www.2ecommerce.cn/archives/2009/12/19/catalog/616

“云”监测:垂直型的网站分析

【导言】我的这个博客中关注的都是普通意义上的网站分析。不过,网站分析应用需求的领域如此之广,必然对网站分析的解决方案提出各种不同的要求。有需求就有市场,本文探讨这个已经出现在我们身边的新兴市场。

【正文】

大家有没有在淘宝上开过店?我相信有。那么,一个问题是,你的店铺的流量、流量质量以及转化情况如何?你知道什么样的店铺设计和产品宣传更能打动潜在消费者吗?

紧接着的一个问题是:你的竞争对手的流量、流量质量和转化情况又如何?

我相信,这两个问题开始变得不那么好回答了。

我再问,你知道用什么样的方式进行推广(旺旺广告、商城、关键词、群发邮件等等)哪一种方式能够给你带来更好的ROI?

更难回答,肯定的。

那么,如果我们想要了解这些情况,我们需要怎么做呢?

用我们最喜欢的工具Google Analytics?不行,淘宝系统不允许你加入额外的javascript代码。Omniture,Webtrends都不行。分析网站日志,Alexa和Compete.com?这个更加不可能了。

所以,这个时候,我们得用专门监测淘宝店铺的针对性工具,这种工具被我们称为垂直型的网站分析工具。

现在你大概明白了什么是垂直型的网站分析。没错,我们普通的网站分析,针对的是我们“拥有”的网站,但那些我们只能用却不能有的网站,就需要用垂直型的网站分析工具了。

这些网站包括:C2C电子商务平台、公共博客平台、典型的SNS网站(例如Facebook)、非典型的SNS网站(例如 Linkedin,Digg)以及微博(例如Twitter)等等。这些网站都有一个共同的特点,它们都是“云”或者又被称为web2.0,它们在远端提 供服务,我们只需要用就行了。

“云”膨胀了对垂直网站分析的需求

“云”——过去这个曾被称为SAP(Service Application Provider),后来又被称为SaaS(Software as a Service)的事物,让客户端的软件服务向服务器转移,从而减轻了客户端的压力,减少了安装软件的烦恼,也让软件商拥有了一个真正可以收费(反击盗 版)的商业模式。

但什么是“云”,还有点儿说不清:

1. “云”服务非常细分,虽服从于基本的互联网协议,但其应用和实现方式并没有通用的标准;

2. 大多数“云”服务都是可定制化的,极具灵活性。

所以人们甚至很难给“云”下一个统一的定义,致使云成为一个外延很广的事物,谁都说不清,谁又都想挤进去,或是拿云说事儿;另一方面,对于云的用户而言,利用我们常规的方法和通行的工具,很难做好对个领域的监测,因为“云”的用户无法嵌入代码,也无法查看日志。

所以,我们需要专门的解决方案,而且这个解决方案不再可能是“放之四海而皆准”了。

垂直型网站分析工具的特征

有需求就有市场,有问题就有办法,而且办法总比问题多。

如果能够满足三个特征:针对性细分、即插即用、定制化,那么“云”监测的问题并不难。

针对性细分,是指针对不同的“云”应用,提供不同的监测方案和工具,甚至在必要时定义不同的监测度量;

即插即用,是指监测工具依附于“云”应用产品,成为“云”的一个功能组件;当需要使用这个功能的时候,把组件激活(如同激活Wordpress的插件)。我们称这种即插即用的操作为“打开自来水龙头”;

定制化,这是由于“云”应用本身具有定制化特性而延伸出来的需求。垂直型网站分析工具也应该是定制化的,以应对不同的定制化“云”应用。

image

图1:垂直型网站分析的特征

业界有谁?

如果大家看过Avinash的这篇文章:Social Media Analytics: Twitter: Quantitative & Qualitative Metrics,那么大家一定会跟我一样印象深刻——原来光是监测Twitter的第三方工具就有这么多!

这些工具都是典型的垂直型的网站分析工具。它们的功能非常针对性的细分,而且即插即用,大多数也能够实现功能模组的定制化。

但是在国内,垂直型的网站分析不大可能在这些SNS类网站上出现,个中原因嘛,相信不说大家也都能知道。但是,国内的垂直型网站分析工具早已有之,因为中国的电子商务网站在世界上还是名列前茅的。这样,针对不同电子商务平台的垂直型网站分析工具其实早已经大行其道。

例如,在淘宝平台上的小艾分析,是目前快速成长的一款统计工具,界面很不错(与GA类似),而功能上更强调针对淘宝平台的推广、流量、用户行为以及端到端的ROI进行分析,以帮助淘宝店主进行网络营销、店内装修以及商品管理的优化。

image

图2:小艾分析的dashboard

例如,用了一个比较直观的雷达图来显示店铺的“健康状况”,哪些不错,哪些需要加强。

image

图3:Map Overlay功能

也能够显示访问者的地理位置,以及访问了一些什么商品。不过,这个也许可以采用Google Analytics的大样本量地理分布的报告(Map Overlay)。

image

图4:热图功能

也同样提供热图功能,很有意思。

image

图5:零点击商品报警

对于完全没有人光顾的产品,提供一个零点几商品的列表,向店主说明:你的这个商品该下架了。

是不是很有趣?同样基于淘宝平台的店铺监测工具还有量子统计。

另外,如果你也跟我一样有自己的博客,那么你可能也使用了feedsky来帮助你管理你的RSS订阅。而feedsky同时也是一个垂直型的网站分析工具,专门用来统计和分析你的订阅情况。

image

图6:feedsky的dashboard,看起来我的读者很多都用Google Reader进行订阅

Feedsky的数据主要集中在订阅量的趋势、RSS上文章被点击的量和RSS工具的分类上。是一个非常简单,但很实用的小工具。

image

图7:可以查看一年甚至更久的订阅的增长情况,这是我用的最多的,也是唯一的功能

看起来我的博客的增长很不错,最近增速在提升。:) 我的目标,过年后达到3,000个订阅! 所以要写更多有水准的文章。不过,这个工具在提供更多维度的数据上,还很弱,毕竟目的只是让你看个大概。

网站分析的发展并不是单线递进的

image

图:网站分析的演进

Web2.0(或者说云,当然二者不能划等号,不过我想我这里的意思大家都明白)的出现对网站分析提出了新的要求, 因为Web2.0是定制化的、细分的、非标准化,且异常灵活的。老牌的网站分析工具其实老早就看到这种趋势,因此,类似Omniture,Google Analytics乃至Webtrends等,都在对Web2.0类型的监测上进行了功能模块的开发和扩展。例如Omniture有专门的SNS的监测工 具,并且和Twitter有合作,也有Mobile的监测工具;而Google Analytics也开发了Event Tracking功能;Webtrends也有相应的模块,同样也有很不错的Mobile监测工具。因此,它们的产品结构形成了以强大的Web1.0为基 础的,响应了更多数字化营销演进中所新出现的监测需求。

但是,当然,这些老牌的监测工具肯定不可能覆盖所有的Web2.0需求,这也是网站分析的另一条演进路线,垂直型的 网站分析工具能够有生存空间的重要原因——市场很大,很蓝海,而且每个细分领域都有足够的空间。这些工具,类似于小艾分析的发展脉络,直接针对具体的 Web2.0网站的监测需求进行开发,一个Web2.0网站开发成功且用户量积累后,可以继续为其他Web2.0网站进行另一些针对性的开发,以保证工具 能够完全匹配和响应不同Web2.0应用的需求。

所以,可以肯定的是,网站分析这个产业在国内这几年的发展将会进一步加速,并且会出现普适工具和垂直工具争相惊艳的格局。很微妙,很有趣的市场,我们在见证中国网站分析的发展和未来。

[版权归Sidney Song(宋星)所有,欢迎转载,但请事先告知作者并注明出处]

不一样的交互组件(下)

四、翻页的创新 【替代法】

传统的翻页方式是“上一页+页码+下一页”,大家最熟悉的设计。

Bing图片搜索

Google reader

看图购

而近年兴起的这种“无尽滚动翻页”的翻页方式,即滚动条拖动到最底部后开始加载后面的内容,而不再有“上一页+页码+下一页”这样的链接。

相对而言twitter、Iphone app store这样的“递进式翻页”则没那么激进,保留了一个翻页按钮,是介于传统翻页与无尽滚动翻页的一种折中方式。

上图是Google book search一个巧妙的翻页设计,鼠标悬停在文档底部一个局部区域(高度约50px)时,出现一个半透明的层,点击这个层开始翻页。这个巨大的辅助翻页按钮,大大提升了翻页的便利性,且对界面影响很小。

这里讲到的翻页组件创新,是用新的翻页方式替代传统翻页组件。从信息的结构来看,传统翻页是将信息分段,而“无尽滚动翻页”属于信息滚动。这两种方式对应现实生活中的原型是:书籍和电影胶片,书籍把信息拆分到每页里去翻动,电影胶片的信息则一帧帧的滚动而过。

从信息流动速度和翻页便利性来看,“信息滚动”远远大于“信息分段”。这两种翻页方式应该如何选择?我想这应该取决于用户对后面内容的需求强度,像 google搜索结果页这种越往后信息质量越低的场景,用户对翻页需求并不那么强烈。Google reader这样不是按信息质量排序的场景,提供高速的翻页方式是个相对必要的做法。需要注意的是,滚动翻页不利于内容准确定位和信息回溯。

信息流动速度对信息接受者心态有很大影响,流动速度越快信息吸收量相对越小,所以阅读pdf文档比阅读纸质书籍心情急躁,忍不住去翻页,是在“扫描”而不是“阅读”(个人主观感受,如有雷同纯属必然)

由此也延伸出一点,交互设计师的工作职责除了架构信息,还应该控制信息的流动速度和供给量。

总结

最后,以一张图片总结交互组件创新的四种方式,一家之言希望对大家有所启发。

不一样的交互组件(上)

不一样的交互组件(中)

来源:http://ued.taobao.com/blog