周杰伦VS蔡徐坤,人气需要数据证明吗?

 

一场周杰伦的“中老年粉丝”与蔡徐坤铁军的16小时打榜战役以周董登顶告终,在朋友圈围观的80后老阿姨看得几乎要老泪纵横:即便是散兵游勇的夕阳红粉丝团,也能在流量时代拼杀一把,证明就算周董发福、中年、已婚,偶像仍是偶像,“你大爷还是你大爷”。此情此景,激动万分的老阿姨都想去给李宗盛刷榜了;于此同时,也生了一个疑惑:蔡徐坤是谁?这个问题一经在朋友圈抛出,瞬间跟了一串同龄人的留言——“同问”。

也许我们真是老了,不能理解互联网时代的小鲜肉在没有广为传唱的好歌、没有广受好评的影视作品竟可以成为坐拥千万粉丝的爱豆;不过,互联网时代的粉丝也质疑我们的偶像如何在微博超话排不上名、转评赞不过万的情况下开演唱会还能出现一票难求的盛况。

诚然,一个人是喜欢周杰伦还是蔡徐坤,不过是青菜萝卜各有所爱, 但若论及哪位艺人更有影响力、更受认可,这就是一个可以测量的经验问题。 在此次打榜战役中,有人总结道,“数据就真的只是数据而已”,想想也是,“周杰伦又不是流量明星,做什么数据啊?“不过,调侃归调侃,这并不等于说,数据不能反映或测量艺人的影响力或受认可度,而是要看什么样的数据才能更好地反映艺人(也可以是其他领域的公众人物)的影响力或受认可度,或者更广义的一个问题是,什么样的数据才能更好地反映出人们对事物真正的态度?

流量时代塑造了这样一个逻辑:偶像的数据=流量=影响力=商业价值,而此次事件恰恰对这个逻辑扇了一记响亮的耳光 :微博的粉丝数据并不能如实地估计粉丝群体的规模及其对偶像的支持度。但为何数以千万计的微博关注量、转评赞、排行榜仍不能如实反映公众人物的影响力呢?“做数据”或人为造假(如批量购买)是一个方面,但即便没有造假的水分,粉丝在互联网上留下的大数据也存在系统性偏差。

什么是系统性偏差?顾名思义,“偏差”就是偏离真实情况(值)的误差,所谓“系统性”是相对于非系统性(或随机性)而言的,指的是误差的来源不是随机产生,而是由某个(些)结构性原因造成。系统性偏差的来源很多,在此次事件中,一个最重要的系统性偏差就是活跃于微博的粉丝用户来源。

让我们换一种非娱乐的语言来回顾此次事件。我们可以将其等同于一起投票事件,大家需要把自己手中的票投给自己的爱豆。在最开始我们看到的情况是蔡徐坤的票数遥遥领先,这是大数据展示给我们的内容,如果以此下结论,就是蔡徐坤的人气或者受认可度高于周杰伦。然而,大家都知道,投票重在公平。在蔡徐坤高票数的背后,是不是人人都有平等的投票机会?对这个问题我们需要打一个大大的问号。

首先,是不是人人都能参与投票? 以我为例,不是老阿姨我不喜欢周杰伦,而是我白天上班,晚上带娃,周末家务,不刷微博久矣,更别提去关注娱乐资讯。如果周杰伦当年的粉丝都已到了如我这般在生活和工作之间疲于奔命的年纪,远离了社交媒体,也没时间精力为他去(学习)打榜,他的数据不好看也是理所当然——因为这种数据就算再大,也没有很好地囊括我们这些“夕阳红”粉丝。也就是说,周杰伦的粉丝群体的特征决定了他们没有和蔡徐坤的粉丝群体平等的投票机会,他们中很多人因为人生阶段、时间、精力等原因,不关注微博,或者不关注娱乐,或者不会打榜,因而不可能上微博追星。

第二,是不是每位投票者机会均等? 从事后的发酵新闻来看,蔡徐坤的铁军长期训练有素,他们不仅自己投票,还各自注册了很多小号,每一个小号相当于额外的一票。周杰伦的粉丝在找到超级话题的入口都不容易的情况下,更别提注册小号。也就是说,蔡徐坤的粉丝每个人可以投很多次票,而周杰伦的粉丝在奋起反击之前,大多数人可能最多只投了一票,结果可想而知。

从以上两个角度来看,数据量大未必能解决系统性的偏差。换言之,大数据也可能是没有代表性的,因而它所反映出的这种“事实”可能并非真正的事实。

那么,怎样的数据才具有代表性?

这要从总体开始说起。总体是指一定时空范围内所有个体的总和。

在很多情况下,我们提出的问题都与总体的特征有关,比如, 此次事件的一个核心问题是: 如今中国人口中有多少周杰伦或者蔡徐坤的粉丝? 人们对周杰伦或者蔡徐坤的喜爱程度有多高?(当然,这里的周杰伦和蔡徐坤还可以换成其他人)。所以,此次的总体是全中国的人口。通常我们没法(包括没钱)对中国人口中所有的男女老少都问一遍他们认不认识周杰伦/蔡徐坤、有多喜欢周杰伦/蔡徐坤、是不是周杰伦/蔡徐坤的粉丝,诸如此类云云。

这种情况下我们可以选择一部分人来了解他们对周杰伦/蔡徐坤的看法或态度,前提是这一部分人能够代表整个总体人群的态度。

这一部分人就是“样本”,即总体的一个子集。要想这一部分人能够代表总体人群的态度,意味着不能随便从总体中抓一些人构成一个样本,恰当的样本不仅仅应该是总体的子集,同时还必须与总体同构——在基本特征的构成上与总体一致,或者可以理解为一个缩微版的总体。据此,样本量即使很小,我们也能见微知著,通过样本的特征来推知总体的特征。

由于我们的样本在基本特征的构成上与总体一致——即能够代表总体(有代表性),我们基于样本对总体的猜测相对来说会比较准确。而之前提到的微博大数据,虽然也是总体中的一部分,但忽略了老阿姨这样的群体,因此即便数据量再大,也不能认为是与总体同构或对总体有代表性。而且,更要命的是,现阶段真正有购买能力的人群,恰恰是老阿姨这一类被忽略的人群——花自己挣的钱,不仅买得起演唱会的票,还买得起两张。如果仅仅基于流量数据来评估一位明星的商业价值,很可能做出错误的商业决定。

接下来的问题是,如何得到有代表性的样本呢? 总体特征通常是未知的,大多数情况下我们没有太多参考标准去匹配出与一个总体特征一致的样本,统计学提供给我们的办法是概率抽样。在概率抽样的条件下,总体中每个个体有同等的机会被抽中,成为样本的一员。在此次打榜事件中,即体现为上文所说的人人都有平等的投票的机会。由于被抽中的机会相等,理论上意味着不会对哪个群体有偏倚,即便难免会抽到一些奇葩特例,但这都是个别的、随机的,而且在样本量增加的情况下,不同类型的奇葩案例的特殊取值会被平均掉,因此能得到对总体特征取值较好的估计。从这点来讲,一个有代表性的概率样本规模即便不大,也会比有系统性偏差的大数据能更好地解答有关总体的问题。

话说回来,这场大戏妙在局中局的设计:表面看起来是两路粉丝团争夺超级话题榜首,而这场竞争本身也制造了一个“超级话题”,获得了极高的社会关注度。如果其背后真有人在设计的话,运作者是真正玩弄数据的高手,他(们)精准地选出了周杰伦作为代表,酝酿了这么一出好戏。每个盲目崇拜数据却不求甚解的人是否应该反思,在数据(流量)为王的时代,到底是你在玩弄数据,还是你被数据所玩弄?

所以,数据如何产生比产生多少数据更重要。如果你想知道周杰伦和蔡徐坤谁更有影响力,与其“做”数据,不如用概率样本做调查。冷静思索,理智分析,是我们对待和使用数据的基本态度。

  • 鍛ㄦ澃浼S钄″緪鍧,浜烘皵闇瑕佹暟鎹璇佹槑鍚?
    绛旓細鍦ㄦ渶寮濮嬫垜浠湅鍒扮殑鎯呭喌鏄钄″緪鍧鐨勭エ鏁伴仴閬ラ鍏,杩欐槸澶鏁版嵁灞曠ず缁欐垜浠殑鍐呭,濡傛灉浠ユ涓嬬粨璁,灏辨槸钄″緪鍧ょ殑浜烘皵鎴栬呭彈璁ゅ彲搴﹂珮浜鍛ㄦ澃浼銆傜劧鑰,澶у閮界煡閬,鎶曠エ閲嶅湪鍏钩銆傚湪钄″緪鍧ら珮绁ㄦ暟鐨勮儗鍚,鏄笉鏄汉浜洪兘鏈夊钩绛夌殑鎶曠エ鏈轰細?瀵硅繖涓棶棰樻垜浠闇瑕鎵撲竴涓ぇ澶х殑闂彿銆 棣栧厛,鏄笉鏄汉浜洪兘鑳藉弬涓庢姇绁? 浠ユ垜涓轰緥,涓嶆槸鑰侀樋...
  • 钄″緪鍧鍜鍛ㄦ澃浼姣旀嫾,鍚屾牱閮芥槸瓒浜烘皵宸ㄦ槦,涓轰粈涔堣敗寰愬潳鏇磋儨涓绛...
    绛旓細瑕姣旇祫鍘嗗拰鎵嶅崕锛岃敗寰愬潳纭疄姣斾笉涓鍛ㄦ澃浼︼紝浣嗘槸浠栫殑鍚嶆皵鍜鏁版嵁鍗村缁堜繚鎸佸湪楂樹綅锛屽緢闀夸竴娈垫椂闂翠箣涓敗寰愬潳鐨勯煶涔愭暟鎹兘杩滆秴鍏朵粬姝屾墜锛岃屼笖涓嶄粎浠呮槸涓浗鐨勬瓕杩蜂滑鍠滄浠栵紝灏辫繛鍥藉鐨勫緢澶氫汉涔熷钄″緪鍧ゆ姳鏈夊緢濂界殑鎬佸害銆傚浠婄殑钄″緪鍧ょ浉姣旇緝涔嬪墠鏇村姞浣庤皟浜嗕竴浜涳紝姣曠珶绔欏湪楂樺鐨勪汉涓嶄粎瑕佸彈鍒拌嚜宸辩矇涓濅滑鐨勪话鎱曪紝涔熶細...
  • 鍛ㄦ澃浼﹁敗寰愬潳,鍛ㄦ澃浼缁堜簬鍑昏触浜嗚敗寰愬潳
    绛旓細鍓嶉潰鍑犺疆锛屼笉绠℃澃杩蜂滑鎬庝箞鎷煎敖鍏ㄥ姏锛鍛ㄦ澃浼濮嬬粓杩借刀涓嶄笂钄″緪鍧わ紝鏇村悐杞ㄧ殑鏄繕鎬诲樊鍗佷竾宸﹀彸銆傛墍鏈変汉閮芥ヤ簡锛岀悍绾峰枈鐫瑕佹尯浣忥紝涓嶈兘涓簡鑰佽劯鍟娿傜粓浜庯紝鍦7鏈21鏃ュ噷鏅紝鍛ㄦ澃浼﹀井鍗氳秴璇濈櫥椤舵垚浜嗙涓鍚嶃傛暣涓綉缁滅偢寮浜嗛攨锛岃繖鏄懆鏉颁鸡绮変笣鐨勪竴灏忔锛屽嵈鏄楗湀鎴樹簤鐨勪竴澶ф銆備粠鏉拌糠浠紑濮嬭杩惀涓氾紝鍒扮櫥椤...
  • 钄″緪鍧鍜鍛ㄦ澃浼绮変笣澶ф垬,鎶樺皠鍑轰粈涔堥棶棰?
    绛旓細钄″緪鍧ゅ拰鍛ㄦ澃浼︽暟鎹澶ф垬锛岃繖琛ㄦ槑浜浜烘皵楂橈紝骞朵笉浠h〃鐫鍙椾紬灏卞锛屽懆鏉颁鸡鐨勪汉姘斿姏鍘嬭敗鏃潳锛岃〃杈句簡寰堝浜虹殑蹇冨0锛屻
  • 鍛ㄦ澃浼鐢ㄢ鏁版嵁鈥濆畬鑳钄″緪鍧,鏉颁鸡鐨勭矇涓濅滑鍋氫簡鍝簺鎿嶄綔?
    绛旓細钄″緪鍧鐨勭矇涓濆氨瑕佸嚭鍗佷釜浜烘潵寮ヨˉ銆備袱鏂圭殑绮変笣鍩烘暟鍙堝樊涓嶅浜嗗灏戯紝鍍垫寔涔嬩笅锛屽懆鏉颁鸡鐨鏁版嵁寰堝揩灏变細鍑虹幇鍙嶈秴锛屽洜涓哄鍛ㄦ澃浼︾殑绮変笣鏉ヨ锛岃兘鐢ㄩ挶瑙e喅鐨勯棶棰橈紝鏄渶绠鍗曠殑闂锛岃繖姣斾竴鑵旂儹琛濂界敤鐨勫锛屽厜鏄彛鍙峰枈寰楅渿澶╁搷锛屼笉濡傚厖閽辨墦鎵撴锛屾墍浠ヨ敗寰愬潳鐨勭矇涓濊触鐨勪竴濉屾秱鍦帮紝杩欎篃鏄湪鎯呯悊涔嬩腑鐨勩傝繖浠朵簨缁...
  • 鍛ㄦ澃浼瓒呰瘽褰卞搷鍔涜繃浜,钄″緪鍧杈撶粰鍛ㄦ澃浼﹁佸勾绮,鐪熸鍘熷洜鏄粈涔?_鐧惧害...
    绛旓細瀵鍛ㄦ澃浼鏉ヨ锛岃鐭ラ亾锛屽嵆浣跨幇鍦ㄥ敱鐗囧凡缁忎笉鍊奸挶浜嗭紝浣嗕粬杩樻槸鏇剧粡鐨勫崕璇ぉ鐜嬶紝鍙栧緱涓浜涙垚灏辨槸寰堝浜洪毦浠ヤ紒鍙婄殑銆傝繖鍙畻鏄崕璇祦琛屾瓕鏇茬殑涓涓唬琛ㄦ椂鏈熴钄″緪鍧铏界劧涔熸湁涓嶅皯娴侀噺锛屼笉鐭ラ亾鏈夋病鏈浜烘皵锛浣嗙浉瀵规潵璇村彇寰楃殑鎴愮哗鏄拰鍛ㄨ懀娌℃湁浠讳綍鍙瘮鎬х殑銆傜粨鏉熻缃戠粶涓婁篃鏈変笉灏戜汉鐪嬩笉鎯粬鐨勮〃婕旈鏍硷紝鍥犱负浠栫殑涓...
  • 鍛ㄦ澃浼瓒呰瘽褰卞搷鍔涜繃浜,钄″緪鍧杈撶粰鍛ㄦ澃浼﹁佸勾绮,鐪熸鍘熷洜鏄粈涔?_鐧惧害...
    绛旓細1. 鍛ㄦ澃浼鐨勮秴璇濆奖鍝嶅姏鏈鍒濆苟鏈秴杩钄″緪鍧わ紝浣嗛殢鐫绮変笣鐨勫姫鍔涳紝浠栫殑鎸囨暟鏈缁堢獊鐮翠簡1浜匡紝鎴愪负浜嗛涓秴璇濆奖鍝嶅姏杩囦嚎鐨勬槑鏄熴2. 鍛ㄦ澃浼﹀拰钄″緪鍧ゅ湪瓒呰瘽鎺掕姒滀笂鐨勭珵浜夊紩璧蜂簡骞挎硾鍏虫敞銆傝敗寰愬潳铏界劧涓搴﹂鍏堬紝浣嗛殢鐫鍛ㄦ澃浼︾殑鏀寔搴︿笂鍗囷紝浠栨垚鍔熻秴瓒婁簡钄″緪鍧わ紝鎴愪负浜嗛浣嶈秴璇濈牬浜跨殑鏄庢槦銆3. 钄″緪鍧ょ殑绮変笣鍦ㄧ綉缁滀笂...
  • 涓轰綍鍛ㄦ澃浼PK钄″緪鍧鎯婂姩浜嗕汉姘戞棩鎶?
    绛旓細鍗庤涔愬潧澶╃帇鍛ㄦ澃浼鍜屽綋绾㈡柊鐢熶唬鍋跺儚钄″緪鍧涔嬮棿鐨浜烘皵PK鎯婂姩浜嗕汉姘戞棩鎶ワ紝鍥犱负涔嬩笉浠呬粎鏄竴鍦虹畝鍗曠殑鏁版嵁姣旀嫾锛屾洿鏄袱浠d汉涔嬮棿鐨勫缇庡彇鍚戝拰鏂囧寲宸紓銆傚懆鏉颁鸡PK钄″緪鍧よ繖浠朵簨鎯呯殑璧峰洜鍏跺疄灏辨槸涓鏉¤川鐤戝ぉ鐜嬪懆鏉颁鸡鐜板湪鐨勪汉姘旂殑鏂囩珷琚埆鐨勭矇涓濈柉鐙傜殑浼犳挱鍚庯紝璁╁懆鏉颁鸡鐨勭矇涓濅滑浜х敓浜嗗己鐑堢殑涓嶆弧銆備袱浠e伓鍍忎箣闂寸殑鏁版嵁姣旀嫾...
  • ...浠昏搐榻愯浜嗕粈涔,鐩存帴璇村嚭浜钄″緪鍧鍜鍛ㄦ澃浼鐨勫樊璺?
    绛旓細鑰岃敗寰愬潳鍜屽懆鏉颁鸡鏈澶х殑鍖哄埆灏卞拰浠昏搐榻愯鐨勯偅鏍凤細鍛ㄦ澃浼︿笉闇瑕佹暟鎹紝鑰钄″緪鍧ら渶瑕佹暟鎹銆傚懆鏉颁鸡鏈夊緢澶氭嬁鐨勫嚭鎵嬬殑浣滃搧锛岃岃敗寰愬潳鐨勪綔鍝佹樉鐒舵病鏈夊懆鏉颁鸡鐨勫銆傚湪杩欓噷鎴戜繚鎸佷腑绔嬬殑鐪嬫硶锛屽懆鏉颁鸡浣滀负钄″緪鍧ょ殑鍓嶈緢锛屾湁璁稿鍊煎緱钄″緪鍧ゅ幓瀛︿範鐨勫湴鏂癸紝鍗曠函鐨勬瘮杈冩槸娌℃湁鎰忔濈殑銆傝岃敗寰愬潳瑕佹兂涓嶈闈炶锛屽氨蹇呴』鎷垮嚭鏇村鏇村姞浼樼...
  • 鈥滄柊鏅嬮《娴佲钄″緪鍧涓轰綍鑳戒笌鍛ㄦ澃浼鈥滅浉鎻愬苟浼︹?浠栨槸鍚︾湡鏈夎繖涓疄鍔...
    绛旓細濡傛灉娌℃湁寮曡捣瀵规柟绮変笣鐨勫弽鎶楃殑璇濓紝閭d箞钄″緪鍧纭疄鑳藉琚О涔嬩负濞变箰鍦堥噷闈㈢殑椤舵祦锛屼絾鏄彧瑕鍛ㄦ澃浼鐨勭矇涓濆叏閮ㄩ兘寮濮嬪仛鏁版嵁鐨勮瘽锛岄偅涔堣敗寰愬潳鐨勭矇涓濇暟閲忓氨鏄笉澶熺湅鐨勩備袱涓汉涔嬮棿涔嬫墍浠ヤ細鍑虹幇浜夎锛屼富瑕佸氨鏄洜涓鸿敗寰愬潳鐨勭矇涓濇浘鍏劧琛ㄧず杩瑕璁╁懆鏉颁鸡鐪嬩竴鐪嬩粈涔堝彨鍋氬ū涔愬湀閲岄潰鐨勯《娴併傝繖鍙ヨ瘽褰诲簳鎯规伡浜嗗懆鏉颁鸡鐨勭矇涓濓紝...
  • 扩展阅读:蔡徐坤近况 ... 央视点名批评蔡徐坤 ... 蔡徐坤高考考了多少分 ... 卸妆后的蔡徐坤 ... 蔡徐坤上半年最佳歌手 ... 蔡徐坤上半年最佳表现歌手 ... 蔡徐坤差点把宋雨琦吓哭 ... 蔡徐坤节目恢复正常 ... 蔡徐坤回应c女士事件 ...

    本站交流只代表网友个人观点,与本站立场无关
    欢迎反馈与建议,请联系电邮
    2024© 车视网