理财 消费

显示 收起

马蜂窝捅了“马蜂窝” 数据造假是有意为之还是被坑

说实在上个周末,马蜂窝过的真不容易,这个中国出行领域的重要参与者,在这个周末因为一篇网文被推上了风口浪尖,近日,一篇题为《估值175亿的马蜂窝竟是一座僵尸和水军构成的鬼城?》的文章在网络上刷屏,一时间可谓一石激起千层浪,让马蜂窝陷入到了让人纠结的麻烦当中,那么马蜂窝到底是真的有意为之还是被坑躺枪呢?

马蜂窝数据造假

10月20日,微信公众号上发布了一篇题为《估值175亿的旅游独角兽,是一座僵尸和水军构成的鬼城?》的文章,直指旅游社交分享网站马蜂窝上的2100万条“真实点评”中,有1800万条都是“通过机器人和从点评和携程等竞争对手那里抄袭过来的”。

一、谁真的捅了马蜂窝?

作者在文中表示,马蜂窝点评的增长趋势在某段时间里非常诡异。比如,点评的数量,会在特定时间节点呈“指数级上升,随后断崖式回落”。并且出现了很多点评账号自我身份矛盾、时间错位的现象。

作者抓取了马蜂窝上116万家餐厅,并抽取了其中三分之一作为样本,同时又抓取了大众点评、艺龙、携程等其竞品网站的内容进行对比,同时强调,自己定的“抄袭标准”为“一字不差”,也就是说,和来自其他网站的内容一字不差的点评才会被定性为抄袭,“哪怕十句话中有一句不同,就不算抄袭”。

在餐饮方面,发现了7454个抄袭账号,平均每个人从携程、艺龙、美团、Agoda、Yelp上,抄袭搬运了数千条点评,合计抄袭572万条餐饮点评,1221万条酒店点评,占到他们官网声称总点评数的85%。

10月21日中午,马蜂窝一位市场经理表示,“我们现在正在核实相关情况。我们正在等结果,然后将对媒体反馈。”她表示,暂时不知道具体什么时候出结果,不过今天应该是可以的,具体发布渠道在讨论中。不过截至笔者撰稿的10月21日晚间,马蜂窝还没有给出回复。

二、马蜂窝造假到底该怎么看?

成立于2007年的马蜂窝是中国旅游出行领域的一个异类,相比于携程、去哪儿、同程这样的公司来说,马蜂窝采用的是个人旅游攻略社区起家,用户会在社区里分享旅游贴士,并购买定制的旅游产品,注册用户已超过1.3亿,提供覆盖全球6万多个目的地的旅游攻略及产品预订服务。

借用电子商务领域的说法来看,马蜂窝有点类似于电子商务领域的小红书主打的是社交旅游,旅行者通过马蜂窝上的旅游贴士以及别人分享的旅游攻略来制定自己的旅游行程,这种模式在某种程度上深的旅游消费者特别是自助游消费者的内心。

因此,相比于各种跟团游来说,马蜂窝的这种自由行攻略为广大的消费者提供了一种自己DIY出行方式的可能性,很多消费者在旅行的时候都习惯在马蜂窝上查攻略,再从携程、去哪儿、飞猪等平台订机票酒店,当然马蜂窝也像大部分的社交电商一样,在出产内容的同时也在提供自己的服务,比如说已经可以用马蜂窝预定旅行的酒店了等等。

这次的造假事件虽然马蜂窝官方没有给出明确的答复,不过我们也可以根据市场上所公开的材料进行一些可能性分析,供读者自行进行判断:

一是马蜂窝造假是自己所为。根据那篇微信文章的判断,马蜂窝的造假是马蜂窝自己所为,其采用的技术就是数据爬虫,网络爬虫,又被称为网页蜘蛛、网络机器人,是按照一定的规则,自动地抓取网络信息的程序或者脚本。只要互联网上有这个公开数据,那么网络爬虫就可以看到并且可以进行复制黏贴,于是即使是一个初创的公司和网站,就可以通过网络爬虫很快地充实自己的内容,迅速形成内容优势(如果内容原创作者也没有进行法律维权的话,现在内容维权非常困难。)

那么,可不可以认为,马蜂窝在做自己的点评内容的时候,为了填充自己的内容,所以做了网络爬虫,当然也不排除是马蜂窝的某些工作人员为了完成自己的拓展指标,私下进行了这样的操作,这种几乎没有技术含量低成本操作,的确是个业务拓展的好方法。

二是马蜂窝数据造假是被做号所害。做号是互联网内容产业中的一种常见领域,无论是微信公众号,还是大多数平台号,由于平台需要内容,于是就产生了大量的内容搬运工,因为内容原创是一种非常劳累的工作,一般的内容原创作者只会在几个平台上注册,很多平台受限于精力往往都不会去打理,这个时候造号者就开始了自己的乾坤大挪移,将某个平台的内容原封不动地照搬照抄到别的平台,从而获取别的平台的补贴与收益。

我们看到马蜂窝之前曾经对点评有过非常高额的补贴,甚至有高奖励的比赛,根据内容平台的常规经验,这些往往会疯狂地吸引做号者,所以只要是内容平台被搬运的现象可谓是非常常见,甚至有不少平台的大部分内容都是被搬运的情况出现。由于这种盗版现象盛行,很多原创内容创作者迫不得已开了很多个平台,只要自己一有原创内容,就赶快多平台发布,避免被搬运者所抄袭,这是原创者的被迫所为。原创作者和搬运者的战争自从互联网内容创作产业出现开始就从来没有停止过,那么马蜂窝这次事件有可能就是搬运者和原创作者自己博弈的一个全平台竞争的结果。

三是马蜂窝数据造假也有可能是竞争对手所为。马蜂窝作为一个出行旅游产业的从业者,自然有着这样或者那样的竞争对手,那么攻击对手最好的办法是什么呢?自然就是制造对手的黑材料了,马蜂窝这种开放式的内容平台,又没有足够完善的平台原创保护和认证制度,那么通过网络爬虫来大量充斥马蜂窝的平台,然后等到需要的时候再引爆出来,无疑将会有非常好的效果。

这次马蜂窝的造假事件,正是马蜂窝新一轮融资的最关键时刻,今年8月17日,外媒报道称,淡马锡投资的中国旅游网站马蜂窝希望在新一轮融资中筹集至多3亿美元,此轮融资对该公司的估值定为20亿至25亿美元。这个时间节点,出这样的事情,只要事情实锤,那么对于马蜂窝的融资来说不啻为灭顶之灾。

四是马蜂窝数据造假也有可能是行业惯例。当然,还有一种可能性就是数据造假可以说是旅行产业的一个惯例了,因为每天互联网上能原创生产出来的内容都是有限的,那么这些有限的内容的确太为稀缺了,那么各家都有可能存在相互的抄袭和爬虫的可能性,特别是如果能够弄出点好看的数据,那么一方面可以帮助用户,让用户不用去翻多家就可以在一家上浏览多家的内容,那么消费者也不会说这是坏事,另一方面给投资者看,数据往往是最容易说服投资者的东西,那么再赚点投资者的钱,何乐而不为呢?

上述四种可能性有可能单一的都是马蜂窝这次事件的可能原因,也有可能是多重原因的共同结果,只是数据的事情往往是个“罗生门”,真假对错其实谁都说不清楚,那么马蜂窝的事情就变得会更加扑朔迷离了。

点击展开全文
↓ 往下拉,下面的文章更精彩 ↓