比分網(wǎng)站的錯誤播報,到底是怎么形成的?
微信朋友非常多,不少人加微信后,似乎很理解我平時雜事多,較少打攪,以至于互加好友好多年,對話其實不多。
但最近全球賽事停擺,這些朋友跟我聊天的時間增加了。
亦有一些朋友加微信后,給我發(fā)了信息耽誤回復,有所怠慢,覺得我不尊重他,直接把我刪掉。
不同朋友的生活價值觀,決定了他對待事情的看法。
對我佛系聊天已習慣的一些人,似乎不介意這些問題了。
例如我認識的一個從事汽車行業(yè)的天津朋友,我們的聊天幾乎都是跨時空的。他每次給我留言,等我看到估計都有幾天耽擱了,我倆經常是錯峰交流。其感覺有點類似于80年代的筆友寫信,往往一封信郵寄到我這兒,等我在基于這封信的內容給他回復,一個月時間就沒了。
最近,這位朋友給我留言,讓我突然發(fā)現(xiàn)了一些很值得科普的事情,和各位展開聊聊,也分享到公眾號和大家聊聊數(shù)據(jù)比分類的那些事情。
坦白說,中國目前的數(shù)據(jù)類公司不少于10幾家,真正能達到體育迷和重度彩民喜歡范圍的不過兩、三家。而恰恰就是這兩三家公司,他們代表著一種主流思想,也就是說,這些數(shù)據(jù)公司在行業(yè)有已經非常強烈的公信力,很多人以他們數(shù)據(jù)馬首是瞻,所以他們錯誤的數(shù)據(jù)也會認為是正確的,誤導多年,卻也沒造成太多的麻煩。
這家數(shù)據(jù)公司也是我常用的,但遇到這些問題總是不爽,卻苦于行業(yè)的數(shù)據(jù)SOP(標準作業(yè)程序)始終沒有統(tǒng)一,所以這家數(shù)據(jù)公司的誤讀已經感染了所有的同行。因大家都在沿用這個數(shù)據(jù)的基礎框架進行融合,那么只要一家錯,家家都會跟著錯。
這讓我不由想起來2000年前后,體壇周報作為行業(yè)最權威的體育媒體機構,其翻譯SOP代表著行業(yè)頂級,甚至連各個電視臺都會以體壇周報的翻譯作為標準。
時值2000歐洲杯期間,時任報紙國際部主任駱明(同時后來也是金球獎中國區(qū)媒體投票人)因為出差采訪影響,對于羅馬尼亞球星CHIVU的譯名沒有時間檢查,其團隊同事因工作緊張草率的使用了“齊沃”的翻譯命名。
2000年,Chivu還是一個名不見經傳的20歲毛頭小伙,在羅馬尼亞被認為是未來可以承擔羅馬尼亞后防線脊梁的“新波佩斯庫”。換句話說,這樣的球星,日后必然頻繁曝光于各媒體平臺。初期譯名陋習一旦養(yǎng)成,以后更改標準譯名非常困難,久而久之,積重難改。
果不其然,CHIVU的譯名因體壇周報命名“齊沃”的叫法被央視等主持人傳播開來,后來這一直被駱總懊惱,只因他極為介意對于譯名的SOP,而幾乎更加正確的譯名“基伏”反而沒有普及
再后來,雖體壇周報努力嘗試把CHIVU命名為基伏,無奈齊沃已經橫行數(shù)月,尤其是一個2000年歐洲杯一戰(zhàn)而紅,習慣成為自然后,更改非常困難。
為此事,大家也可以發(fā)現(xiàn)即便是20年后的今天,互聯(lián)網(wǎng)上依然有大量的球迷將目前身為國際米蘭青年隊教練的CHIVU稱為“齊沃”。事實上如果沒有當年草率的命名,齊沃這個名字壓根就不會出現(xiàn)。而如果早期做好標準譯名“基伏”,哪里有齊沃的存在?
這樣的例子事實上在比分數(shù)據(jù)領域比比皆是。很多人,即便是一些資深懂球帝,當然知道德甲,德乙,德丙之后,但到了德地區(qū),對德西、德北、德巴伐利亞、德西北、德西南等賽事傻傻分不清。
但這些賽事卻都是一個獨立體系的平行賽事。很多時候這些平行賽事因為球隊的數(shù)量,地區(qū)的特點沒有分開,最終進入決賽的模型也不一樣。問題就在這兒,數(shù)據(jù)公司由于在10多年前建立賽事列表的時候,沒有意識到中國彩民對于賽事顆粒度的覆蓋會達到如今的規(guī)模,以至于從10多年前導致的錯誤體系,籠統(tǒng)將這些比賽全部歸咎為“德地區(qū)”的一概而論的做法,讓很多彩民每逢德國聯(lián)賽的賽季末弄的頭昏眼花。因為德地區(qū)下面的這些細分賽事沒有做列表拆分,導致彩民的預測方面面臨巨大的問題。
從方法論上,彩民一頭霧水,不明就里,從源頭上,很可能就是這個數(shù)據(jù)的始作俑者當時的一個開小差或者不當回事,結果導致了現(xiàn)在的問題。
大部分公司事實上還遠沒有意思到這個問題的殺傷力有多大,而真正懂行了解這個問題的人事實上估計整個中國也能掰著手指頭數(shù)的出來的那么幾個人。結果成了以錯傳錯的老大難問題。因為這牽涉到整個歷史數(shù)據(jù)的徹底修改,者一旦修改,對于數(shù)據(jù)的源提供者帶來的壓力非常大。
同樣的類型的問題還包括巴西種類繁多的那些賽事,在數(shù)據(jù)庫根本無法理解之后,這些基礎的數(shù)據(jù)問題統(tǒng)一歸咎于巴西的“友誼賽”。我為此發(fā)現(xiàn),當這類問題不從源頭作為解決方案,很可能會導致用戶在建立自己的數(shù)據(jù)模型,預測球隊是勝負方面都產生千差萬別的誤導。
當然,這個事情著實不算大事兒,尤其是當歐洲五大聯(lián)賽橫行的時候,實際上這樣的錯誤已經不值一提了。但偏偏最近趕上了歐洲主流足球強國的疫情干擾,大家看著大面積的全屏幕比賽延期的時候,往往會盯著那些僅存的比賽進行研究。
正如我在之前的一篇文章所提到的,白俄羅斯足球賽什么時候能有如今這樣的被高度關注。
延伸閱讀:《歐洲賽事停擺?這個國家卻開啟了新賽季首輪聯(lián)賽》
而隨著連白俄羅斯這樣的戰(zhàn)斗的民族都宣布聯(lián)賽停擺的時候,那些顆粒度更低的細分聯(lián)賽進入了體育迷的視線里。于是有了本文開頭的一幕,這位天津的彩民日前給我發(fā)來的信息,和各位截圖展示。
乍一看,是對一款叫V站APP的產品尋找到了bug,因這個產品的易進球模型非常好用,但如果比分播報是錯誤的話,那么這帶來的問題非常嚴重,甚至南轅北轍。
于是我將其截圖中的問題放大處理,讓大家來仔細看看出錯的BUG在哪里?
大家注意看,上圖的比分2比1的時間顯示是21分鐘,這個比賽是18點30進行的,而同時里外一場18點30的比賽已經65分鐘了,顯然同樣是18點30進行的比賽,為什么一個進行到65分鐘,另外一場為21分鐘?
于是看他提供的另外一張細節(jié)顆粒圖,看下圖。
注意,這張圖片更加清晰無誤的顯示了比賽的確是21分鐘,而不是65分鐘。
我的這位朋友很糾結此時是否啟動“易進球”的觸發(fā)功能,萬一這個是真是的,那么觸發(fā)效果就能有價值,但如果這個是謊報軍情,甚至這個是幽靈比賽,那么這個就是純粹的子虛烏有。
延伸閱讀:《幽靈比賽比假球更無恥》
沒有對比就沒有傷害,全中國,目前的體育比分類APP多達數(shù)千款,其使用的數(shù)據(jù)源公司接近10家公司,每家公司都有自己的標榜的最快,最準,最權威。
但事實上我們必須正確的理解比分數(shù)據(jù)行業(yè)最大的頑疾,且這個頑疾即便是全世界最大的上市數(shù)據(jù)公司也沒法解決,那就是:最快的比分網(wǎng)站一定不是最準的比分網(wǎng)站。而如果你是最準的比分網(wǎng)站,就必然不可能成為最快的比分網(wǎng)站。
道理為何?
答案就在于如果你要追求最快,其必然喪失了準確度。尤其是隨著VAR事件的越來越頻繁的出現(xiàn),很多進球在射門得分后,比分網(wǎng)站會為了一味的追求快,而將進球的提示 彈出來。
但大概過了幾分鐘后,VAR事件證明此球無效,于是比分網(wǎng)站又會將這個進球的記錄給取消。
整個來回的過程,給閱讀這個比分事件的彩民帶來巨大的狐疑,尤其是一些沒有 辦法看到的視頻直播的小型賽事,進球取消的問題屢見不鮮,那么,如果要追求最快的比分,必然損失了準確性。
而我們看到,歐美很多優(yōu)質的比分網(wǎng)站,在這方面做出了和亞洲人完全不同的思考模式,寧愿以準確取勝,去回避頻繁的誤報。
至于到底是準好還是快好,對于歐美和亞洲人的思考角度截然不同,必然各有優(yōu)劣,但從我的角度來說,最理想的融合,就是盡可能快的情況下解決準確度的問題。
于是有了我為這個天津朋友詢問問題的反饋思考。
為什么這么說呢?
當這位天津的朋友告訴我在18時30分進行的比賽出現(xiàn)了不同的時間進度的時候,我第一時間走訪了國內我最喜歡的4個APP比分站。很不可思議的,我發(fā)現(xiàn),另外三家公司的時間的確都是65分鐘,而不是21分鐘。
我百思不得其解,為此我和V站的歐洲數(shù)據(jù)公司的數(shù)據(jù)源進行了交流,交流的結果讓我極為震驚,原來這場比賽本應該在18時30分進行,但因為賽前球場進行了消毒衛(wèi)生的審核處理(我簡直不敢相信這場垃圾比賽盡然有如此的規(guī)格),居然最終比賽開始的時間延遲到了19時才開始。
但因為是一場友誼賽,國內的大部分數(shù)據(jù)公司都不會遷就這個顆粒度很小的變動,繼續(xù)用既定的18時30的時間在進行所謂的賽事啟動(事實上比賽根本就沒開始,但數(shù)據(jù)提供默認源就是18時30,所以其比賽就以莫須有的方法在進行著)。
而V站使用的這家數(shù)據(jù)公司偏偏是那天唯一提供正確數(shù)據(jù)的提供方,但由于整個行業(yè)都用錯誤的比分播報,導致彩民反而認為是V站提供了錯誤的數(shù)據(jù)源。
我們仔細等待這比賽結束的時間,果然,按照18時30分進行的話,其實這場比賽在各大比分站早已經宣布比賽結束了。沒曾想,各個比分網(wǎng)站都沒有結束本場比賽,而是在90分鐘的時候,一直閃爍,讓很多彩民非常焦慮,心中咒罵“尼瑪這友誼賽是不是有鬼啊,都90分鐘了半個小時了,咋還不結束呢?”
反之在看V站的這家比分站的顆粒度卻很清晰的按照正常的比賽時間在有條不紊的進行,最終驗證了賽前的因為消毒球場耽擱的無效時間匹配,準確的讓比賽按照既定的正確時間結束的全過程。
換句話說,這場比賽的確是18時30分鐘開始,但真正踢球的時間卻是在19點,這也導致很多比分站在90分鐘的時候閃爍了足足30分鐘沒有結束,讓喜歡陰謀論的亞洲彩民又胡亂費心這比賽到底有什么“陽謀”?
事實上,關于V站這個數(shù)據(jù)提供商,我最近搜集國內外已經不少于200多家公司在使用了,從央視網(wǎng)站到一些初創(chuàng)公司,我都看到他們數(shù)據(jù)的提供的軌跡,雖然我無法得知這家歐洲公司到底和多少數(shù)據(jù)公司合作,不過從其提供的動畫顆粒度匹配的公司規(guī)模而言,可能遠不至于我統(tǒng)計的200多家公司。
而我為此曾看到國外一篇報道恰恰是驗證這家數(shù)據(jù)公司追逐顆粒度的細節(jié)的案例。那是中國CBA的某只球隊,當這個球隊只要被央視進行直播比賽的時候,其比賽的時間就會安排在20時進行,而如果當這只球隊的比賽不被央視直播的時候,其比賽時間就會安排在19時30分進行。
這樣的個性化的細分,我走訪了很多CBA的球迷,他們壓根沒有留意過這個細節(jié),但這個細節(jié)因為太難以判斷規(guī)律,所以大部分的比分網(wǎng)站從來不會為這一個球隊遷就比分的變化,反而是我們看到的全世界只有這一家數(shù)據(jù)公司能夠精準的基于央視直播和不直播來拆分比賽的時間。
注意,很多CBA的球迷有時候會不分青紅皂白,想當然的認為你們V站的比分播報怎么有問題啊,別人CBA的這場比賽都開始了,為啥你們家卻在20時才開始?
事實上的問題,不言而喻,正確的數(shù)據(jù)的確沒有開始,反而是 錯誤的數(shù)據(jù)因為整個行業(yè)都在“開始”,導致正確的呈現(xiàn)數(shù)據(jù)的時候,得到了球迷的錯誤誤讀。
關于類似的數(shù)據(jù)細分的顆粒度的比對,真的是一個慢工出細活的工作。說實話,大部分彩民和球迷,壓根不會 關注這些幾位細節(jié)的東西。但面臨當先沒有比賽的時候,那些全世界幾乎從來不被人關注的垃圾比賽突然進入眾人的視野之后,真金不怕火煉的數(shù)據(jù)行業(yè)的領跑者,慢慢的呈現(xiàn)在大家面前。
為這家歐洲數(shù)據(jù)站點個贊。我的一個朋友不久前說,以后的數(shù)據(jù)公司服務,無非就是最全的賽事,最豐富的的動畫顆粒度細節(jié)圖,最快的比分,最準的賽事直播,最詳細的數(shù)據(jù)軸,最深度的球員細節(jié)。
但說起來容易,做起來難,購買這樣完善的數(shù)據(jù)公司服務,成本和消化都是一個巨大的功夫。我認識的一個初創(chuàng)公司,兩年前買了一家公司的體育數(shù)據(jù),至今在融合消化方面都只用了不足1/3的成果,由此不難發(fā)現(xiàn),即便真的給你上述所有的數(shù)據(jù)提供,你沒有一個好的產研團隊對接,都沒法將其更好的呈現(xiàn)在用戶面前。
而目前,我不得不說,能夠讓我這樣的體育迷點贊的數(shù)據(jù)公司,放眼中國,也不過那么兩三家而已。
數(shù)據(jù)的進階,對于不同的公司來說,還有非常漫長的路要走。因為我們看到全世界最好的數(shù)據(jù)網(wǎng)站,雖然已經達到幾十億美元的估值,但其賽事依然存在諸多不足,其他的公司,可以挖掘探索的空間,還很多很多!
隨著足球領域的拓展啟動后,誰能在籃球,網(wǎng)球,電競、棒球、排球、斯諾克……等全領域做足功夫的那些公司,才是大眾的最愛。
延伸閱讀
》
》
想聯(lián)系我,請加我微信
推薦一款我一直在用的比分網(wǎng)站,掃下方二維碼共同學習,共同思考!為中國的體育比分數(shù)據(jù)深度學習盡一份力!
掃描二維碼推送至手機訪問。
版權聲明:本文由財神資訊-領先的體育資訊互動媒體轉載發(fā)布,如需刪除請聯(lián)系。