再说微信KOL评估

经历了史称“9.28自媒体事变”,对话框被关于阅读数造假的文章刷屏了。我忍不住翻出来了去年12月写的文章《微信KOL效果监测》,再补几句。

1.这是行业的耻辱。

2​.微信阅读数如何甄别真伪?

上周在第一届计算传播学论坛上,来自北邮的吴晔老师完美地回答了这个问题。

首先从实证来看,根据每4分钟阅读数的曲线图,会发现几乎100%可以被幂函数拟合。再从计算仿生学角度,也可佐证以上观点。

762891530588174230

所以要解决阅读数造假难题,第一要获得分钟级阅读曲线图,第二做幂函数拟合、看是否吻合。

我们来看一个今天被扒皮的帐号——格调。《当了老板,生活和工作就别想……平衡!?》这篇文章的阅读增长曲线如下,立马可以看出来有异常爬坡。

%e5%be%ae%e4%bf%a1%e6%88%aa%e5%9b%be_20160929231103

这样是不是意味着不能造假呢?依然可以。1.迅速刷到10万+,不留机会做阅读曲线图。2.有没有可能机器刷成一个幂函数?对于几乎没有真实阅读数的帐号,可以;对于采用众包行为刷量的,困难。

如何才能获得分钟级阅读曲线图?参看参考文献3;当然你也可以选择新榜,如果你还依然信它的话。

3.大号和广告主的关系是否应该回到良性状态?

微信在去年开了数据授权API接口,坦率来说,我觉得是参考了Klout的思路的。

作为一个大号,你既然已经选择出来卖了,那么数据就应该坦然接受放到太阳底下,让大家都看看。数据授权API接口即是为此准备,将帐号数据授权到第三方平台,可以更加全面地查看大号的数据。

比如说查看阅读来源,刷量的阅读数大多显示来自“未知来源”或“历史消息”。

然而,在“9.28事件”之前,又有几个大号肯做这样的授权。肯给一张后台截图就千恩万谢了,是否PS过又有谁会多问呢。期待此次事件以后,行业态势会有变化。

4.微信此举意欲何为?

姜茶茶(微信公共号:jiangchacha0314)今天的推文道出了真相——为了呼吁广告主投腾讯的朋友圈信息流、广点通等广告。

微信此举吃相比微博好很多,微博直接上微任务,30%保护费在手。

5.皇帝的新装

在Social月费被压价到底的情况下,行业也就靠着KOL的利润生存。再多的数据来说明KOL质量,也是徒劳,毕竟都要生存、都要升职。

所以另外一个好玩的事,大家都在对话框里转相关文章,很少人转到朋友圈。

参考文献:

[1]微信KOL效果监测,http://alexwu.biz/2015/12/08/how-to-measure-wechat-kol/

[2]计算传播网,http://computational-communication.com/

[3]简直数据,http://jianzhi.im/data/

[4]Klout,https://klout.com/home

[5]微果酱,http://data.wpweixin.com/

如何选择微博KOL?

第0步:平台选择

考虑到品牌大小、预算多少、发展阶段等因素,其实不是所有的品牌都适合一上来就双微运营、编纂头部内容(最近不说这个词,感觉落后了时代)。起码苹果Apple就没有选择这样,Twitter帐号几起几落。以至于姗姗来迟的Apple Support Twitter帐号到来时,还一度成了新闻。

坦率来说,除了选择微博、微信等主流平台,也还是可以选择QQ空间、知乎、Lofter、QQ群等相对不常见的社交平台。特别对于新品牌,相对小众但是活跃度高、信任度高的社交平台,是发展种子用户的绝佳起点。

第1步:数据准备

微博可以公开售卖/爬取的数据集有:账户UID、微博内容、发帖时间、转发评论赞数量、转发评论内容(被微博去除水军后的)。

需要补充的数据集是——微博的相互关注关系数据,这部分数据可以通过购买获取。奈何这个数据集所费不菲、更新慢、数据性质为灰色,所以拥有这个数据不容易。以数据堂为例,截止到2014年2月3.5亿用户的关注数据售价为20万。

第2步:帐号质量度和影响力

有了第1步的数据准备,接下来重要的一个环节就是做帐号质量度的评估。

问题一:针对普通账户,如何区分出水军、僵尸粉,给到账户相应的质量度评分?

感谢林天逸(现在UC Berkeley 读数学PhD)不吝赐教,无须复杂的算法,而是兼顾运算量,通过普通的特征模型解决这个问题。稍做论文检索,就找到不错的解决方案。数学工程与先进计算国家重点实验室的解决方案参见参考文献2。在文章中里,通过以下21个维度来描绘了一个帐号的质量:

1.账户状态属性:粉丝数;关注数;互粉数;微博数;账户年龄;账户等级;声望值;互粉率;

2.历史微博属性:发布微博频率;原创微博比例;垃圾转发比例;微博平均被转发数;微博平均被评论数;

3.账户邻居属性:粉丝的平均粉丝数;粉丝的平均关注数;粉丝的平均互粉数;粉丝的平均声望值;关注好友的平均粉丝数;关注好友的平均关注数;关注好友的平均互粉数;关注好友的平均声望值。

这个解决方案的计算量也不小,不过相对是一个比较好的解决办法。有了这个办法,我们就获取到了每个帐号的质量度。

问题二:为什么不做活跃度?

因为社交媒体化,很多人只看不发、或者不互动。以目前可以获取到公开信息,做的活跃度评估更多是发帖行为表现;而炒作账户往往发布微博的频率高于正常账户。所以这个指标在现阶段,感觉参考价值有限。

问题三:如何衡量KOL?

依然刚才的质量度主要针对普通账户。针对KOL账户,首先第一步是定型,归属于联系员、内行、销售员三者之一;其次才是定量。

可以额外做的定量分析有:粉丝数*粉丝质量的加权、商业发帖的转评粉丝*质量加权/原始转发评论数、非商业发帖的转评粉丝*质量加权/原始转发评论数。

第3步:帐号内容

刚才分析的数据都是结构化数据,而帐号内容是一个宝库,奈何是非结构化数据,涉及到自然语言处理(中文NLP,多么蛋碎的话题)。

依然是北美好公司PeerIndex(目前已经被BrandWatch收购,关于BrandWatch,我们值得专门写一篇文章来描述这是一家多么好的公司),他们在处理帐号内容,做了以下一个很简单的产品。Topic fingerprint,简单直接,方便在找KOL时,大规模检索合适的KOL。

第4步:利用帐号连接关系挖掘社群和KOL

基于帐号内容、关注行为、互动行为,可以挖掘出在线群落以及群落里的意见领袖。

这部分参考文献5给了一个解决办法,受限制于数据量和数据集,目前的结果还需要更多数据来做支撑。但是这一定是一个寻找微博KOL的好办法。

番外:微博vs微信

在去年初,我会收到很多反馈——大致“微博已死、微信永生”这类腔调。作为一个因为不用微博、被老板怀疑脱离群众以至于1 on 1谈话过的吃瓜群众,却选择了坚定地支持微博。

彼时我不用微博,因为习惯了RSS订阅的我,清楚哪里才是互联网世界的优质内容聚集地。而去年我又开始拾起微博,原因是社交关系分成了弱关系和强关系。微信解决了强关系,而微博才是弱关系的主战场。

当然也感谢渣浪没有持续作死,从前年Q4开始做平台净化、去僵尸粉取水军,微博的重新活跃自然而然。当然加之直播的东风,一路把微博的股价炒到了百亿市值,几乎是新浪的两倍。

而接下来微博会怎样?

社交电商的故事还没有讲完,期待除了“网红女装股份注入”以外更多的玩法。

信息流广告产品距离Facebook还有鸿沟、阿里的DMP数据目测还没有注入(不过看阿里新的持股动作,可能有变),移动端广告还有很多想象空间。

 

参考文献:

【1】关于苹果Twitter帐号,可以参看

《Why isn't @Apple on Twitter?》http://www.cnbc.com/2014/02/21/why-isnt-apple-on-twitter.html

《You Can Now Get Apple Support Through Twitterhttp://fortune.com/2016/03/03/apple-twitter-customer-service/

【2】张进,刘琰,罗军勇,等. 基于特征分析的微博炒作账户识别方法[J]. 计算机工程, 2015,41(4):48-54,59.

【3】KOL效果评估四宗罪,http://alexwu.biz/2016/09/11/4-wrong-ways-of-kol-evaluation/

【4】PeerIndex,目前已被BrandWatch收购https://www.brandwatch.com/peerindex-and-brandwatch/

【5】曹玖新,陈高君,吴江林,刘波,周涛,胥帅,朱子青. 基于多维特征分析的社交网络意见领袖挖掘[J]. 电子学报, 2016(04).

KOL效果评估四宗罪

好吧,4不是个质数,然而我也没法再加一条。先写着吧。

KOL全称Key Opinion Leader意见领袖,国内俗称红人大号。一波社交媒体营销,主要预算都在采买KOL。难道不是创意?主要预算在创意的概率等于0。(好负面的回答,说好的岁月让我们从批判走向了建设呢?!)

如何采购与评估KOL?几乎是一个拍脑袋的好问题。当然大多数情况,答案是这样子的:

%e5%be%ae%e4%bf%a1%e6%88%aa%e5%9b%be_20160911195040

 

说好的走向建设呢?好吧接下来开始建设部分。纵观那么多广告主的KOL采购,大致会遇到以下几个问题:

1.使用前不评估、求数不求质的评估

设定好预算、选定好大致的KOL方向,接下来就进入KOL筛选过程。一般是一张Excel,罗列好历史数据(粉丝数、阅读数等)和价格,接着就是拍脑袋阶段。拍脑袋阶段主要是做定性分析,看看这个KOL历史发帖是否与品牌匹配。如何加强对质量的评估呢?

对于微博,对粉丝数、互动数都可以做更加深入的分析。

以粉丝数为例,虽然微博断了全量粉丝数据接口,但是依然有一些渠道可以获取到KOL的粉丝列表信息,进而通过对粉丝质量的判断,获得对该帐号质量更深入的认识。(这部分国内有很不错的研究成果,我们另起一篇文章专门说。)

粉丝数据不容易获取,但互动数据是公开的。可以获取KOL历史发帖的互动数据,新浪微博自身对垃圾互动做了清理。(比如明明显示有100个转发,但是点击转发列表,却发现只有30条,其中70条被新浪微博自己清理掉了。)

对于微信,虽然微信做了一件很赞的事情——数据接口,可以方便第三方平台在账户授权的前提下,拿到账户后台数据而不参与账户操作。(类似的操作,参看国外顶级的KOL评估平台Klout。)然后目前处于KOL强势品牌弱势的博弈环境,所以即使有了这个接口,也没有KOL愿意授权,KOL只愿意提供一张后台截图(真假就看大家对PS甄别的能力了)。

那还有其他办法来加强对KOL质量的评估?有!图文消息的阅读数/点赞数趋势图(按分钟级别)。这个的缺点是不能回溯历史数据,但是不失为目前最好的解决办法。

2.评估只看与媒介匹配的数据

伴随着媒介采购部的介入,很容易地就把KOL采买与媒介采购划了等号。于是阅读数至上、TA至上。奈何在目前没有很好的办法解决阅读数去水、TA人群识别的场景下,完全把两者划等号,只会导致机构营销号甚嚣尘上,然而用过的人都知道这些号的质量究竟几何。

但这条路是不是就错了呢?显然不是,具体我们在下一条来阐述。

3.用统一标准衡量不同属性KOL

说社交媒体营销,就不得不提《引爆点》,书中把一件事的传播归因于三个模式,其中第一个模式是个别人物法则。该法则把传播渠道归因于三类人——联系员、内行、销售员。

  1. 联系员:就是那种“认识了很多人的人”,这类人把朋友当作邮票一样地搜集,随时与人保持联系。这个角色可以把信息快速的散布出去。
  1. 内行:就是那种“什么都懂的人”他对某一种知识可以说是“达人”,不厌其烦地把相关的知识与朋友分享,但是却没有很好的说服力。这个角色对某件事情的狂热,使他所发掘出来的事情成为有价值的。
  1. 推销员:就是那种“什么人都能够说服的人”这种人没有很深的知识,但是有特殊的能力让见到面的人在短暂的时间就交付信任。这个角色能够把内行发现的东西与人们以简易的语言沟通

那么KOL显然也需要(我甚至固执地认为必须)做这样的分类,然后再同一分类下、用相同指标来进行评估衡量。先说问题二,问题二把KOL当成媒介,其实就是联系员属性。那么在这个属性下,用媒介CPM那一套评估体系是可以参考的。但是对于内行、推销员显然不能来这一套。

依然是北美好企业Klout,他们甚至把KOL从四个维度分成了16个大类。原图如下,供大家参考。

klout-influence-matrix

 

4.使用后不评估

终于谨慎地选择好了KOL,但是不要忽视使用后的评估。行百里者半九十,曾经服务某个项目的使用后评估,约10%的阅读数是个位数(是的,你没有看错)。

对于使用后评估,有了前面三点做支撑,相信都会做得不错。可能需要多讲一点的就是,对页面内点击链接落地页的监测。往往内容里都包含了点击链接,去到某个活动页面。利用广告监测的技术,可以实现对不同KOL带来的流量质量监测。如果是微信端,结合微信的JSSDK,甚至可以实现对粉丝传播行为监测。

 

好的,写了这么多,只是想说,AdMaster正式上线了KOL监测服务。在评估KOL有了6年项目经验后,我们终于把它系统化了。(猛戳https://kol.tuice.io/)肯定还有很多不足之处,欢迎多多贡献意见。

 

参考文献:

【1】北冥乘海生的知乎回答,https://www.zhihu.com/question/20199160/answer/118323151

【2】Klout官网:https://klout.com/home

【3】引爆点https://book.douban.com/subject/3900987/

【4】利用微信JSSDK做的一个免费监测工具,http://www.h5mo.com/, 当然你也可以选择付费的https://kol.tuice.io/

【5】我司郝老师做的一个很赞的微信数据平台,微信公共号jianzhi_im

Staypressed theme by Themocracy