刷量、播放量造假似乎已經成為影視行業的潛規則,有影視行業媒體曝出,電視劇行業每年花40億購買收視率,造假早已成灰色產業鏈。
今年兩會,著名主持人、全國人大代表曹可凡也發聲痛批收視造假行為,“虛假的票房、虛假的點擊率、虛假的收視率等,這些建立在造假基礎上的大數據,嚴重影響人們對一部好作品的評判。”
收視造假的背后,對于制片方來說,意味著影視劇品牌的提升和商業利益的增加,但這會誤導投資人和廣告商的判斷。
在這場博弈的棋局中,云合數據的CEO李雪琳選擇了后者。
通過機器學習計算“有效播放量”
云合數據是一家專注于影視娛樂行業的大數據公司,它的一個最大的特點就是能根據視頻網站和社交媒體等渠道呈現的信息算出一部影視劇的“有效播放量”。
云合數據CTO劉浩告訴創業邦,有效播放量的計算方法是:
第一,把播放量中的花序、預告片、剪輯等等都去掉;
第二,通過播放量曲線對比,機器自動通過異常識別技術,把異常量去掉;
第三,通過機器學習,把每一部劇的評論、點贊、彈幕以及在微博,微信,豆瓣等社媒平臺的數據表現發給機器,同時把前臺播放發給機器,機器自己建立這二者之間的關系,預估一部影視劇的播放量,篩除掉高出的異常部分。
但揭露播放量造假并不是李雪琳創業的目的。“通過有效播放,我們以它為標尺,能夠準確地評估出參與每部影視作品的全部行業元素的歷史價值,我們要做的是預測”,李雪琳告訴創業邦。
告訴制片方選誰、如何宣傳效果最好
一個完整的影視制作周期包括如下的環節: IP的選擇、購買、改編到影視作品,再到選導演、選演員、選編劇,拍攝剪輯;上線前進行宣傳,運營粉絲,上線后看播放情況,來收集收視反饋,包括收視率、彈幕、評論等。
而云合數據主要參與到影視劇的生產和營銷環節。
在生產環節,從前期購買IP,云合數據通過網絡數據監測幫制片方規避抄襲的風險;在IP改編環節,云合數據通過機器讀原文和機器搜集粉絲在網絡上產生的一切反饋做匯總,來分析哪個人物,哪些情節,哪些對白最受粉絲的關注。從編劇的角度來說,也會幫助確定應該砍掉哪些人物,確定戲份該如何分布。
在選角過程中,云合數據能夠通過影視圈明星個人大數據檢索分析,給予導演一定的參考建議。在后期剪輯時,云合數據的分析模型對于剪成多少集,如何更新播放也會提供參考建議。
在這些方面,云合數據和《幻城》、《帝凰之神醫棄妃》等IP劇集制作方都有過合作。
而在宣傳推廣環節,在劇集上線后,云合數據能夠搜集各大影視網站的彈幕,用機器學習的算法分析出受眾反饋的最熱在哪里,最熱的內容是什么,幫助宣發人員確定宣傳的方向,匹配受眾的反饋。
此外,云合數據通過對網絡視頻“有效播放”的分析,預測影視影視項目播放表現,為演員選擇,投資,廣告植入等早期決策提供支撐。
全平臺的數據挖掘和分析能力是核心
云合數據CTO劉浩告訴創業邦,云合數據的技術核心是全平臺、全量的數據采集能力,而市面上沒有看到其他家在做,有一定的技術門檻,每天需要處理3T的數據規模;此外,云合數據在數據的采集與數據挖掘、機器學習方面是有比較強的技術優勢。
云合科技CEO李雪琳是美國俄克拉荷馬大學工學碩士,曾就職于愛立信售后,研發,售前部門;任東北亞區技術咨詢高級方案架構師,中、美、歐十年工作經驗;云合科技CTO劉浩,畢業于清華大學,曾任思科公司數據科學家、清華大學-思科聯合實驗室技術指導委員會成員。
2016年年初,云合數據曾獲得永安基金千萬元Pre-A輪融資。