“旅行之前,先上馬蜂窩。”2018年世界杯期間一則廣告席卷網(wǎng)絡(luò ),在北京馬蜂窩網(wǎng)絡(luò )科技有限公司(以下簡(jiǎn)稱(chēng)馬蜂窩)收獲大波流量的3個(gè)月后,這個(gè)憑借用戶(hù)原創(chuàng )內容(UGC)逐步壯大的在線(xiàn)旅游平臺,被一個(gè)叫乎睿數據的團隊(深圳乎睿數據有限公司)揭開(kāi)了疑似數據造假的一角。
10月21日晚間,自媒體“小聲比比”在已發(fā)布《估值175億的馬蜂窩竟是一座僵尸和水軍構成的鬼城?》一文后,如約發(fā)布了第二篇指馬蜂窩充斥僵尸和水軍的報告文章。隨著(zhù)輿論發(fā)酵,馬蜂窩于22日上午發(fā)布公開(kāi)聲明表示,針對該文中歪曲事實(shí)的言論,和已被查證的有組織攻擊行為,馬蜂窩將采取法律手段維護自身權益。10月22日晚間,馬蜂窩起訴深圳乎睿數據有限公司、丁子奎名譽(yù)侵權案獲立案。
值得關(guān)注的是,馬蜂窩“數據造假”風(fēng)波有了新進(jìn)展。10月22日晚6點(diǎn)49分左右,馬蜂窩“數據造假”爆料人、自媒體“小聲比比”公眾號作者“梓泉”發(fā)布朋友圈,貼上一封訴訟服務(wù)告知書(shū),并配文稱(chēng)“開(kāi)戰今晚第三篇”。
2014年4月,馬蜂窩CEO陳罡曾經(jīng)在微博公開(kāi)炮轟去哪兒網(wǎng)通過(guò)虛假評論造假,稱(chēng)去哪兒網(wǎng)的刷點(diǎn)評行為已經(jīng)動(dòng)搖到了行業(yè)誠信的根基。如今,馬蜂窩“被捅”,有何說(shuō)法?
馬蜂窩陷“抄襲門(mén)”
10月21日,一篇由自媒體“小聲比比”發(fā)布的《估值175億的馬蜂窩竟是一座僵尸和水軍構成的鬼城?》的文章在網(wǎng)絡(luò )刷屏,作者梓泉根據乎睿數據團隊提供的數據報告在文中表示,馬蜂窩2100萬(wàn)“真實(shí)點(diǎn)評”中有1800萬(wàn)條是通過(guò)機器人從競爭對手平臺上抄襲而來(lái)。
文章一經(jīng)發(fā)布,公眾號便收到了馬蜂窩“損害商業(yè)信譽(yù)”的投訴,梓泉在次日的推文中稱(chēng),不僅如此,“在文章發(fā)出來(lái)8個(gè)小時(shí)以后提及的賬號從搜索欄屏蔽,點(diǎn)評內容也在個(gè)人頁(yè)被刪除了。”
10月22日,乎睿數據團隊以郵件形式向記者發(fā)送了一份關(guān)于馬蜂窩的25頁(yè)數據報告,該報告顯示馬蜂窩疑似存在評論搬運、游記摻水、問(wèn)答抄襲的現象。
乎睿數據團隊在報告中表示,經(jīng)初步探索馬蜂窩UGC和用戶(hù)數據并與競品比照,結果發(fā)現,包括官方賬號在內的許多螞蜂窩用戶(hù),人均抄襲了數百名大眾點(diǎn)評網(wǎng)用戶(hù)的評論以及大量來(lái)自攜程、藝龍、Agoda、Yelp等知名網(wǎng)站的用戶(hù)內容,甚至還屢次在官方有獎活動(dòng)中拔得頭籌。
10月22日下午,記者通過(guò)“小聲比比”公眾號聯(lián)系上該自媒體作者梓泉,其向記者透露,文章的素材來(lái)自于乎睿數據對馬蜂窩用戶(hù)點(diǎn)評等數據的分析報告。談及撰寫(xiě)并發(fā)布馬蜂窩一文的原因,“梓泉”向記者透露,一開(kāi)始是乎睿數據通過(guò)公眾號聯(lián)系上他,“先確定興趣,然后簽保密協(xié)議,然后再看報告。”“梓泉”說(shuō)。當日,馬蜂窩相關(guān)負責人則告訴記者,“目前正在走法律程序。”對此,“梓泉”表示,截至當時(shí)只看到馬蜂窩對公眾號兩篇文章的投訴,沒(méi)有公司聯(lián)系到他本人。
10月22日晚間消息,針對自媒體報道的馬蜂窩數據造假一事,馬蜂窩已向北京市朝陽(yáng)區人民法院提起訴訟,稱(chēng)乎睿數據侵犯名譽(yù)權,目前已獲立案。
馬蜂窩否認85%點(diǎn)評造假
上述報告顯示,乎睿數據團隊經(jīng)過(guò)數據分析發(fā)現,馬蜂窩上有7454個(gè)抄襲賬號,合計從競品網(wǎng)站上抄襲搬運了572萬(wàn)條餐飲點(diǎn)評與1221萬(wàn)條酒店點(diǎn)評,占到官網(wǎng)聲稱(chēng)總點(diǎn)評數的85%。
乎睿數據團隊剔除“抄襲賬號”后,在余下的所有賬號中選擇了15000個(gè)最活躍的賬號,發(fā)現用戶(hù)在答題、點(diǎn)評等行為時(shí)間上高度一致,且與其他同類(lèi)型評論網(wǎng)站發(fā)布時(shí)間差異較大,大多是工作時(shí)間(周一至周五10時(shí)至12時(shí)、14時(shí)至17時(shí))更為活躍。
乎睿數據團隊還發(fā)現,一批在游記攻略中植入廣告的商家通過(guò)抄襲、拼接等“做號”、“洗稿”手段批量炮制出含有廣告內容的游記、問(wèn)答、回復,再由大量的小號、馬甲進(jìn)行人工置頂,達到以低成本對平臺上億用戶(hù)打廣告的目的。
乎睿數據團隊“捅了”馬蜂窩,一時(shí)間輿論如潮。馬蜂窩于22日上午7點(diǎn)45分在微博發(fā)布聲明稱(chēng),馬蜂窩的UGC內容數據中,游記和攻略占比78.91%,嗡嗡(旅行故事)占比7.92%,問(wèn)答占比10.26%。這些數據背后是用戶(hù)真實(shí)的情感與回憶,也是馬蜂窩內容的真正價(jià)值。
馬蜂窩進(jìn)一步表示,點(diǎn)評內容在馬蜂窩整體數據量中僅占比2.91%,涉嫌虛假點(diǎn)評的賬號數量在整體用戶(hù)中的占比更是微乎其微,馬蜂窩已對這部分賬號進(jìn)行清理,其認為“自媒體文章所述的馬蜂窩用戶(hù)數量與事實(shí)和第三方機構數據都嚴重不符”。與此同時(shí),一直以來(lái),馬蜂窩嚴厲打擊游記和問(wèn)答中違規廣告的行為,平均每周處理26000條違規廣告信息、查封15000個(gè)違規賬號。
對于報告數據挖掘選用的工具與分析的科學(xué)性與準確性等問(wèn)題,記者22日通過(guò)郵件向乎睿數據團隊提問(wèn),但截至發(fā)稿尚未收到回復。
數據爬蟲(chóng)業(yè)內屢見(jiàn)不鮮?
2018年10月21日,馬蜂窩旅游網(wǎng)對全站游記、攻略、嗡嗡(旅行故事)問(wèn)答、點(diǎn)評等數據進(jìn)行了核查,并對涉嫌虛假的信息展開(kāi)查處。
馬蜂窩在公開(kāi)聲明中表示,餐飲點(diǎn)評不是馬蜂窩的內容核心,且部分點(diǎn)評來(lái)自于游記、問(wèn)答的內容的提取,自媒體將馬蜂窩用戶(hù)內容生產(chǎn)的活躍周期,與餐飲等本地生活服務(wù)類(lèi)APP相對比,并解讀為馬蜂窩員工有組織地抄襲,存在明顯的誤導傾向。
實(shí)際上,就此事業(yè)內也有不同的觀(guān)點(diǎn)。
“馬蜂窩承認部分點(diǎn)評來(lái)自?xún)热萏崛?,讓UGC行業(yè)或多或少地暴露出原創(chuàng )內容端的不足、不同端口資源共用等問(wèn)題。”業(yè)內人士分析認為,馬蜂窩被疑抄襲的內容存在一定的被“反爬”跡象,比如點(diǎn)評中出現翻譯提供方的字樣等恰恰說(shuō)明這是行業(yè)比較常見(jiàn)的操作。
電子商務(wù)研究中心生活服務(wù)電商分析師陳禮騰認為,有些平臺從其他平臺抓數據的目的是為了制造流量很大的假象,既給用戶(hù)看、商家看,更是給投資人看。由于不涉及到數據庫門(mén)檻,在技術(shù)上沒(méi)有難度,任何一個(gè)爬蟲(chóng)工程師就可以做到,也可以批量處理,通常是“機器抓取+人工編輯”。
“互聯(lián)網(wǎng)公司利用爬蟲(chóng)技術(shù),從其他平臺抓取數據的行為應該說(shuō)較為常見(jiàn)。”陳禮騰表示。
此外,從事旅游平臺管理的技術(shù)員小王告訴記者,討論行業(yè)共性問(wèn)題時(shí)首先要清楚這次報告顯示的數據抓取和分析是否存在系統性偏差或者內定指標。他建議,可以同樣抓取相關(guān)平臺數據做行業(yè)對比分析才有說(shuō)服力,除此之外應把平臺系統性造假和用戶(hù)自身一稿多投的問(wèn)題區分開(kāi)。“前者是蓄意欺騙,后者算是監管不嚴。”
爬蟲(chóng)抓取、抄襲和造假在互聯(lián)網(wǎng)行業(yè)并不少見(jiàn),陳禮騰表示,甚至已經(jīng)成為很多平臺屢試不爽的一大“捷徑”,但對于像馬蜂窩這樣的企業(yè)而言,或許入駐馬蜂窩平臺的商家為吸引人氣和流量所為的可能性更大。
究其原因,業(yè)內人士認為,正是因為用戶(hù)原創(chuàng )內容愈發(fā)趨于商業(yè)化,在此情況下想要獲取帶有流量的原創(chuàng )內容的成本變得越來(lái)越高。“在用戶(hù)從確定旅游目的地到購買(mǎi)旅游產(chǎn)品的場(chǎng)景中,企業(yè)僅僅依賴(lài)UGC基礎上的廣告營(yíng)收是遠遠不夠的,變現、盈利成為生存難題,而反過(guò)來(lái)這些客源也勢必會(huì )成為企業(yè)間爭奪的核心資源。”
平臺形象遭遇危機
電子商務(wù)研究中心特約研究員、北京志霖律師事務(wù)所趙占領(lǐng)律師指出,用戶(hù)點(diǎn)評版權存爭議的核心問(wèn)題是存在法律“空白”,任何一家平臺未經(jīng)允許擅自抓取其他平臺上用戶(hù)所發(fā)布的信息的行為如果屬實(shí),就涉嫌不正當競爭。
陳禮騰進(jìn)一步指出,如該事件屬實(shí),消費者對于平臺的信任度將大打折扣,造成用戶(hù)流失,品牌形象、未來(lái)經(jīng)營(yíng)都將受到一定影響。
從旅游社區起步的馬蜂窩誕生于2006年,在2011年10月及2013年4月,分別獲得A、B兩輪融資。2015年1月獲得高瓴資本等投資的8500萬(wàn)美元C輪融資,同年發(fā)布自由行戰略后探索出了一條從內容到數據再到交易的商業(yè)模式,目前已在2017年完成1.33億美元的D輪融資。
彼時(shí),馬蜂窩CEO陳罡在D輪融資的內部信里表示,每月有1億活躍用戶(hù),其中85%來(lái)自移動(dòng)應用程序,“三年后,螞蜂窩將成為中國最大的旅游流量平臺”。馬蜂窩曾公開(kāi)表示該網(wǎng)站的用戶(hù)每月發(fā)布超過(guò)13.5萬(wàn)篇旅游文章,當時(shí)預計2017年個(gè)人旅游產(chǎn)品的銷(xiāo)售額會(huì )超過(guò)90億元人民幣。
目前,無(wú)論馬蜂窩平臺背后的真實(shí)數據占比多少,其核心價(jià)值勢必受到投資者的關(guān)注與考量。但從估值影響上看,陳禮騰認為,對于投資者言這些數據僅僅是一些參考指標,并非其核心內容,最終還是要看馬蜂窩的轉化率及盈利能力如何。如此看來(lái),該事件對于馬蜂窩的投資人信任與核心估值是否會(huì )產(chǎn)生較大影響尚難定論。
馬蜂窩在此次的聲明中表示,2016年以前,馬蜂窩曾激勵用戶(hù)發(fā)表點(diǎn)評,點(diǎn)評數據出現快速增長(cháng)。但隨著(zhù)馬蜂窩全方位移動(dòng)互聯(lián)網(wǎng)化及用戶(hù)量級的增長(cháng),以游記、攻略為代表的長(cháng)內容,以嗡嗡(旅行故事)、問(wèn)答為代表的短內容產(chǎn)品成為運營(yíng)重心,它們共同構成馬蜂窩的核心競爭力。
根據消費者權益保護法和新出臺的電商法等相關(guān)法律,陳禮騰說(shuō),若上述自媒體曝光信息屬實(shí),馬蜂窩的做法或已涉嫌違法;若只是平臺上商家所為,馬蜂窩作為平臺享有“避風(fēng)港原則”規定的一定的免責權利,具體是否該承擔責任,則要看平臺有沒(méi)有盡到應盡的商家管理、平臺治理、信息審查這方面的義務(wù)。(記者 張韻 實(shí)習記者 趙雯琪 劉洋)
轉自:每日經(jīng)濟新聞
【版權及免責聲明】凡本網(wǎng)所屬版權作品,轉載時(shí)須獲得授權并注明來(lái)源“中國產(chǎn)業(yè)經(jīng)濟信息網(wǎng)”,違者本網(wǎng)將保留追究其相關(guān)法律責任的權力。凡轉載文章及企業(yè)宣傳資訊,僅代表作者個(gè)人觀(guān)點(diǎn),不代表本網(wǎng)觀(guān)點(diǎn)和立場(chǎng)。版權事宜請聯(lián)系:010-65367254。
延伸閱讀