中文字幕免费精品_亚洲视频自拍_亚洲综合国产激情另类一区_色综合咪咪久久

解析優(yōu)酷土豆在大數(shù)據(jù)方面的管理與運(yùn)用
來源:易賢網(wǎng) 閱讀:2807 次 日期:2016-07-14 11:24:58
溫馨提示:易賢網(wǎng)小編為您整理了“解析優(yōu)酷土豆在大數(shù)據(jù)方面的管理與運(yùn)用”,方便廣大網(wǎng)友查閱!

這篇文章主要介紹了優(yōu)酷土豆在大數(shù)據(jù)方面的管理與運(yùn)用,優(yōu)酷著手Hadoop集群應(yīng)用的起步較早,在相關(guān)大數(shù)據(jù)管理的方面也較有經(jīng)驗(yàn),需要的朋友可以參考下

姚鍵是優(yōu)酷土豆集團(tuán)CTO,據(jù)他介紹,優(yōu)酷新上線的首頁頁面上,光是導(dǎo)航欄上的視頻分類就有21個,21個不同類型的內(nèi)容,這意味著會有各種不同的用戶來優(yōu)酷看視頻,要想給不同的用戶推薦他們喜歡的視頻,這靠的是一個叫做“協(xié)同過濾推薦”的技術(shù)。

百度百科上這樣介紹協(xié)同過濾推薦(Collaborative Filtering recommendation):“是在信息過濾和信息系統(tǒng)中正迅速成為一項很受歡迎的技術(shù)。與傳統(tǒng)的基于內(nèi)容過濾直接分析內(nèi)容進(jìn)行推薦不同,協(xié)同過濾分析用戶興趣,在用戶群中找到指定用戶的相似(興趣)用戶,綜合這些相似用戶對某一信息的評價,形成系統(tǒng)對該指定用戶對此信息的喜好程度預(yù)測。”

這是亞馬遜、谷歌等互聯(lián)網(wǎng)巨頭都在使用的技術(shù)。亞馬遜會告訴你“買了A商品的顧客也同時購買了B商品”,Youtube上,一個視頻播放結(jié)束,馬上就會出現(xiàn)相關(guān)推薦視頻。

看上去簡單的相關(guān)推薦,其實(shí)在優(yōu)酷的視頻推薦中涉及上百個參數(shù),每次要調(diào)整參數(shù),都要手動調(diào)整十幾甚至幾十個參數(shù),每天推薦視頻的數(shù)據(jù)模型中要涉及的數(shù)據(jù)高達(dá)幾十億。

一次小小的參數(shù)調(diào)整,帶來的后果,可能是當(dāng)天視頻觀看帶來幾百萬的增長,也可能是在算法穩(wěn)定后的未來幾周,甚至幾個月帶來視頻觀看量的曲線變化。

當(dāng)然,數(shù)字證實(shí),通過這種協(xié)同過濾推薦給用戶的視頻是靠譜的,因?yàn)樵诤A康囊曨l中尋找自己喜歡的視頻成本是很高的,推薦視頻的打開率也令人滿意。

優(yōu)酷土豆心中的“大數(shù)據(jù)”

數(shù)據(jù)的挖掘、分析,用在推薦視頻上,還只是個小意思。優(yōu)酷在2010年推出的“優(yōu)酷指數(shù)”把大數(shù)據(jù)精神進(jìn)一步強(qiáng)化,把視頻播放周期、用戶核心特征、用戶播放行為、視頻熱度排行等數(shù)據(jù)進(jìn)行展示。

姚鍵這樣介紹優(yōu)酷指數(shù)誕生的背景:“2010年的時候,優(yōu)酷在PC互聯(lián)網(wǎng)時代已經(jīng)成為最有影響力的視頻網(wǎng)站,優(yōu)酷希望能夠在行業(yè)內(nèi)樹立一個標(biāo)桿,在強(qiáng)化優(yōu)酷品牌的同時,也打造優(yōu)酷指數(shù)這樣一個概念。”

今年,優(yōu)酷指數(shù)進(jìn)而演變成“中國網(wǎng)絡(luò)視頻指數(shù)”,加入了土豆網(wǎng)以及移動客戶端的視頻數(shù)據(jù),對數(shù)字感興趣的用戶,可以從這個指數(shù)里讀出很多內(nèi)容。

作為一款平臺化的產(chǎn)品,“中國網(wǎng)絡(luò)視頻指數(shù)”在優(yōu)酷土豆集團(tuán)中的參考價值無處不在,從廣告售賣,到版權(quán)購買,再到播放器產(chǎn)品的優(yōu)化,等等,處處都能夠作為指導(dǎo)依據(jù)。

據(jù)姚鍵透露,優(yōu)酷土豆集團(tuán)推出的數(shù)據(jù)報告給節(jié)目制作方、影視劇公司、第三方分析機(jī)構(gòu)等了解視頻節(jié)目的播放信息,以及觀眾人群的分析提供了依據(jù);在廣告銷售方面,能夠?yàn)閺V告主呈現(xiàn)出用戶行為特征,提供廣告投放價值的分析;在進(jìn)行版權(quán)購買的時候,可以根據(jù)指數(shù)的走向來幫助決策;公司內(nèi)部,哪怕是播放器產(chǎn)品的用戶體驗(yàn)優(yōu)化,都可以查看數(shù)據(jù)分析結(jié)果,查看按鈕的擺放和使用頻率等。

這些價值都是顯而易見的,還有我們在表面看不到的,通過數(shù)據(jù)分析的結(jié)果來指導(dǎo)優(yōu)酷土豆集團(tuán)的自制內(nèi)容。

“比如說優(yōu)酷有很多自制的內(nèi)容,有很多的微電影、綜藝節(jié)目等等,這些播放數(shù)據(jù)可以顯示出哪些題材是用戶喜歡的,用戶看到哪里就看不下去了,在哪里是拖放觀看的,一系列的用戶行為可以清晰地告訴內(nèi)容制作人員,應(yīng)該怎么去剪輯視頻,怎么去選擇內(nèi)容題材。”姚鍵說。

其實(shí)這個過程也是對視頻質(zhì)量進(jìn)行分析的過程,在優(yōu)酷土豆的搜索、推薦中按照視頻質(zhì)量進(jìn)行排序,反過來也提高了推薦成功率。

然而,大數(shù)據(jù)讀出的數(shù)據(jù),其指導(dǎo)意義還遠(yuǎn)不止此。

每部電影、電視劇在播出后都會有對應(yīng)的數(shù)據(jù),哪些演員受歡迎,哪些題材受追捧,通過分析數(shù)據(jù)就可以慢慢發(fā)現(xiàn)背后的原因,把這個受歡迎的故事講出來,這就是可見的未來。

敢為人先 優(yōu)酷土豆用Spark完善大數(shù)據(jù)分析

大數(shù)據(jù),一個似乎已經(jīng)被媒體傳播的過于泛濫的詞匯,的的確確又在逐漸影響和改變著我們的生活。也許有人認(rèn)為大數(shù)據(jù)在中國仍然只是噱頭,但在當(dāng)前中國互聯(lián)網(wǎng)領(lǐng)域,大數(shù)據(jù)以及大數(shù)據(jù)所催生出來的生產(chǎn)力正在潛移默化地推動業(yè)務(wù)發(fā)展,并為廣大中國網(wǎng)民提供更加優(yōu)秀的服務(wù)。優(yōu)酷土豆作為國內(nèi)最大的視頻網(wǎng)站,和國內(nèi)其他互聯(lián)網(wǎng)巨頭一樣,率先看到大數(shù)據(jù)對公司業(yè)務(wù)的價值,早在2009年就開始使用Hadoop集群,隨著這些年業(yè)務(wù)迅猛發(fā)展,優(yōu)酷土豆又率先嘗試了仍處于大數(shù)據(jù)前沿領(lǐng)域的Spark/Shark 內(nèi)存計算框架,很好地解決了機(jī)器學(xué)習(xí)和圖計算多次迭代的瓶頸問題,使得公司大數(shù)據(jù)分析更加完善。

MapReduce之痛

提到大數(shù)據(jù),自然不能不提Hadoop。HDFS已然成為大數(shù)據(jù)公認(rèn)的存儲,而MapReduce作為其搭配的數(shù)據(jù)處理框架在大數(shù)據(jù)發(fā)展的早期表現(xiàn)出了重大的價值。可由于其設(shè)計上的約束MapReduce只適合處理離線計算,其在實(shí)時性上仍有較大的不足,隨著業(yè)務(wù)的發(fā)展,業(yè)界對實(shí)時性和準(zhǔn)確性有更多的需求,很明顯單純依靠MapReduce框架已經(jīng)不能滿足業(yè)務(wù)的需求了。

優(yōu)酷土豆集團(tuán)大數(shù)據(jù)團(tuán)隊技術(shù)總監(jiān)盧學(xué)裕就表示:“現(xiàn)在我們使用Hadoop處理一些問題諸如迭代式計算,每次對磁盤和網(wǎng)絡(luò)的開銷相當(dāng)大。尤其每一次迭代計算都將結(jié)果要寫到磁盤再讀回來,另外計算的中間結(jié)果還需要三個備份,這其實(shí)是浪費(fèi)。”

據(jù)悉,優(yōu)酷土豆的Hadoop大數(shù)據(jù)平臺是從2009年開始采用,最初只有10多個節(jié)點(diǎn),2012年集群節(jié)點(diǎn)達(dá)到150個,2013年更是達(dá)到300個,每天處理數(shù)據(jù)量達(dá)到200TB。優(yōu)酷土豆鑒于Hadoop集群已經(jīng)逐漸勝任不了一些應(yīng)用,于是決定引入Spark/Shark內(nèi)存計算框架,以此來滿足圖計算迭代等的需求。

Spark是一個通用的并行計算框架,由伯克利大學(xué)的AMP實(shí)驗(yàn)室開發(fā),Spark已經(jīng)成為繼Hadoop之后又一大熱門開源項目,目前已經(jīng)有英特爾等企業(yè)加入到該開源項目。

“我們大數(shù)據(jù)平臺對快速需求的響應(yīng)延時,尤其是在商業(yè)智能BI以及產(chǎn)品研究分析等需要多次對大數(shù)據(jù)做Drill Down與Drill Up時,等待成了效率殺手。” 優(yōu)酷土豆集團(tuán)大數(shù)據(jù)團(tuán)隊技術(shù)總監(jiān)盧學(xué)裕表示。

用Spark/Shark完善大數(shù)據(jù)分析

目前大數(shù)據(jù)在互聯(lián)網(wǎng)公司主要應(yīng)用在廣告、報表、推薦系統(tǒng)等業(yè)務(wù)上。在廣告業(yè)務(wù)方面需要大數(shù)據(jù)做應(yīng)用分析、效果分析、定向優(yōu)化等,在推薦系統(tǒng)方面則需要大數(shù)據(jù)優(yōu)化相關(guān)排名、個性化推薦以及熱點(diǎn)點(diǎn)擊分析等。優(yōu)酷土豆屬于典型的互聯(lián)網(wǎng)公司,目前運(yùn)用大數(shù)據(jù)分析平臺的主要工作是運(yùn)營分析、機(jī)器學(xué)習(xí)、廣告定向優(yōu)化、搜索優(yōu)化等方面。

優(yōu)酷土豆集團(tuán)大數(shù)據(jù)團(tuán)隊技術(shù)總監(jiān)盧學(xué)裕表示:“優(yōu)酷土豆的大數(shù)據(jù)平臺已經(jīng)用了很多年,突出問題主要包括:第一是商業(yè)智能BI方面,公司的分析師提交任務(wù)之后需要等待很久才得到結(jié)果;第二就是大數(shù)據(jù)量計算,比如進(jìn)行一些模擬廣告投放之時,計算量非常大的同時對效率要求也比較高,用Hadoop消耗資源非常大而且響應(yīng)比較慢;最后就是機(jī)器學(xué)習(xí)和圖計算的迭代運(yùn)算也是需要耗費(fèi)大量資源且速度很慢。”

因此,面對復(fù)雜任務(wù)、交互式查詢以及流在線處理時,Hadoop與MapReduce并不適用。Spark/Shark這種內(nèi)存型計算框架則比較適合各種迭代算法和交互式數(shù)據(jù)分析,可每次將彈性分布式數(shù)據(jù)集(RDD)操作之后的結(jié)果存入內(nèi)存中,下次操作可直接從內(nèi)存中讀取,省去了大量的磁盤IO,效率也隨之大幅提升。優(yōu)酷土豆集團(tuán)大數(shù)據(jù)團(tuán)隊大數(shù)據(jù)平臺架構(gòu)師傅杰表示:“一些應(yīng)用場景并不適合在MapReduce里面去處理。通過對比,我們發(fā)現(xiàn)Spark性能比MapReduce提升很多。”

“比如在圖計算方面,視頻與視頻之間存在的相似關(guān)系,這就構(gòu)成了一個圖譜,通過圖譜來做聚類,再給用戶做視頻推薦。” 優(yōu)酷土豆集團(tuán)大數(shù)據(jù)團(tuán)隊技術(shù)總監(jiān)盧學(xué)裕表示。

優(yōu)酷土豆集團(tuán)大數(shù)據(jù)團(tuán)隊技術(shù)總監(jiān)盧學(xué)裕表示:“我們進(jìn)行過圖計算方面的測試,在4臺節(jié)點(diǎn)的Spark集群上用時只有5.6分鐘,而同規(guī)模的數(shù)據(jù)量,單機(jī)實(shí)現(xiàn)需要80多分鐘,并且內(nèi)存吃滿,單機(jī)無法實(shí)現(xiàn)Scale-Out,不能計算更大規(guī)模數(shù)據(jù)。”

“在今天,數(shù)據(jù)處理要求非常快。比如優(yōu)酷土豆的一些客戶、廣告商往往臨時就需要看一下投放效果。所以在前端應(yīng)用不變的情況下,如果能更快的響應(yīng)市場的需要就變得很有競爭力。市場是瞬息萬變的,有一些分析結(jié)果也需要快速響應(yīng)成一個產(chǎn)品,Spark集成到數(shù)據(jù)平臺正能發(fā)揮這樣的效果。” 優(yōu)酷土豆集團(tuán)大數(shù)據(jù)團(tuán)隊大數(shù)據(jù)平臺架構(gòu)師傅杰補(bǔ)充道。

據(jù)了解,優(yōu)酷土豆采用Spark/Shark大數(shù)據(jù)計算框架得到了英特爾公司的幫助,起初優(yōu)酷土豆并不熟悉Spark以及Scala語言,英特爾幫助優(yōu)酷土豆設(shè)計出具體符合業(yè)務(wù)需求的解決方案,并協(xié)助優(yōu)酷土豆實(shí)現(xiàn)了該方案。此外,英特爾還給優(yōu)酷土豆的大數(shù)據(jù)團(tuán)隊進(jìn)行了Scala語言、Spark的培訓(xùn)等。

“優(yōu)酷土豆作為國內(nèi)視頻行業(yè)第一家商用部署Spark/Shark方案的公司,從視頻行業(yè)的多樣化分析角度來看是個非常好的方案。未來,英特爾將會繼續(xù)與優(yōu)酷土豆在Spark/Shark進(jìn)行合作,包括硬件配置的優(yōu)化以及整體方案的優(yōu)化等”英特爾(中國)有限公司銷售市場部互聯(lián)網(wǎng)及媒體行業(yè)企業(yè)客戶經(jīng)理李志輝介紹道。

未來:將Spark/Shark融入到Hadoop 2.0

對于大數(shù)據(jù)而言,Hadoop已經(jīng)構(gòu)建完成了較為完善的生態(tài)系統(tǒng),特別是Hadoop 2.0版本在推出之后,改善了諸多缺點(diǎn)。而Spark/Shark計算框架其實(shí)與Hadoop并不沖突,Spark現(xiàn)在已經(jīng)可以直接運(yùn)行在Yarn的框架之上,成為Hadoop生態(tài)系統(tǒng)之中不可或缺的成員。

優(yōu)酷土豆集團(tuán)大數(shù)據(jù)團(tuán)隊大數(shù)據(jù)平臺架構(gòu)師傅杰表示:“目前Hadoop 2.0已經(jīng)發(fā)布了release版本,我們已經(jīng)啟動了對Hadoop 2.0的升級預(yù)演。這中間還涉及到我們在1.0版本上修改的一些特性需要遷移和驗(yàn)證,我們希望做到在不影響業(yè)務(wù)的情況下實(shí)現(xiàn)平滑升級,預(yù)計在明年Q1完成升級。Hadoop 2.0將會是非常強(qiáng)大的,不再僅僅是MapReduce,還能融入Spark,能夠讓用戶可以根據(jù)數(shù)據(jù)處理應(yīng)用需求的不同來選擇合適的計算框架。”

更多信息請查看網(wǎng)站運(yùn)營
由于各方面情況的不斷調(diào)整與變化,易賢網(wǎng)提供的所有考試信息和咨詢回復(fù)僅供參考,敬請考生以權(quán)威部門公布的正式信息和咨詢?yōu)闇?zhǔn)!
相關(guān)閱讀網(wǎng)站運(yùn)營

2026上岸·考公考編培訓(xùn)報班

  • 報班類型
  • 姓名
  • 手機(jī)號
  • 驗(yàn)證碼
關(guān)于我們 | 聯(lián)系我們 | 人才招聘 | 網(wǎng)站聲明 | 網(wǎng)站幫助 | 非正式的簡要咨詢 | 簡要咨詢須知 | 新媒體/短視頻平臺 | 手機(jī)站點(diǎn) | 投訴建議
工業(yè)和信息化部備案號:滇ICP備2023014141號-1 云南省教育廳備案號:云教ICP備0901021 滇公網(wǎng)安備53010202001879號 人力資源服務(wù)許可證:(云)人服證字(2023)第0102001523號
云南網(wǎng)警備案專用圖標(biāo)
聯(lián)系電話:0871-65099533/13759567129 獲取招聘考試信息及咨詢關(guān)注公眾號:hfpxwx
咨詢QQ:1093837350(9:00—18:00)版權(quán)所有:易賢網(wǎng)
云南網(wǎng)警報警專用圖標(biāo)
中文字幕免费精品_亚洲视频自拍_亚洲综合国产激情另类一区_色综合咪咪久久
欧美精品系列| 黄色在线一区| 欧美ab在线视频| 在线视频精品一区| 伊人狠狠色j香婷婷综合| 国产伦精品一区二区三| 欧美日韩国产大片| 免费不卡亚洲欧美| 久久激情中文| 亚洲欧美国产毛片在线| 亚洲日本在线视频观看| 欧美日韩天堂| 国内精品写真在线观看| 国产精品久久久| 欧美日韩精品一区| 亚洲网址在线| 久久国产欧美| 久久成人亚洲| 韩国一区电影| 精品福利免费观看| 亚洲欧美一区二区三区极速播放| 国产精品区一区二区三| 国产欧美一区二区三区在线看蜜臀 | 久久精品视频在线| 美女福利精品视频| 欧美日韩亚洲一区| 欧美精品三级在线观看| 久久久久国产一区二区三区四区| 欧美视频日韩视频| 另类国产ts人妖高潮视频| 午夜天堂精品久久久久| 欧美成人一区二区三区| 久久精品五月婷婷| 精品福利电影| 久久久久久久久岛国免费| 在线观看三级视频欧美| 国产欧美日韩综合精品二区| 国外成人网址| 亚洲一区制服诱惑| 亚洲人成毛片在线播放女女| 依依成人综合视频| 欧美成人一区二区三区| 夜夜嗨av色一区二区不卡| 黄色日韩网站视频| 国产美女一区| 欧美激情国产高清| 一本色道88久久加勒比精品| 99精品视频免费观看| 亚洲精品一级| 亚洲国产成人av在线| 欧美视频精品在线| 亚洲与欧洲av电影| 国内综合精品午夜久久资源| 国产一区欧美日韩| 亚洲人成7777| 欧美网站在线| 麻豆av一区二区三区久久| 午夜欧美大尺度福利影院在线看| 亚洲欧洲一区二区在线播放| 国产欧美日韩一区二区三区| 国产精品免费视频xxxx| 亚洲小说欧美另类婷婷| 久久精品国产99国产精品澳门| 女人天堂亚洲aⅴ在线观看| 欧美激情一区二区三区蜜桃视频| 国产农村妇女精品一二区| 国产偷久久久精品专区| av成人免费| 亚洲欧美网站| 国产精品家教| 亚洲国产aⅴ天堂久久| 久久久夜夜夜| 99在线精品视频| 国产精品午夜久久| 久久综合色综合88| 亚洲电影天堂av| 欧美日韩一区二区三区高清| 久久成人精品视频| 99re6这里只有精品| 国产亚洲精品aa| 国产精品v日韩精品| 久久精品国产第一区二区三区| 亚洲国内精品在线| 国产精品日韩欧美一区| 欧美激情综合色综合啪啪| 亚洲在线第一页| 亚洲国产一成人久久精品| 欧美日韩一区二区欧美激情| 久久久精品2019中文字幕神马| 99xxxx成人网| 亚洲二区视频在线| 激情成人综合| 国产九九精品视频| 欧美三级午夜理伦三级中文幕| 久久视频在线免费观看| 午夜天堂精品久久久久| 99热在线精品观看| 国产资源精品在线观看| 国产精品精品视频| 欧美日韩国产在线播放| 久久久久www| 欧美一级在线视频| 午夜久久99| 亚洲私人影吧| 在线亚洲精品| 亚洲伦理精品| 精品成人在线观看| 国产女人水真多18毛片18精品视频| 美女在线一区二区| 久久蜜桃资源一区二区老牛| 亚洲天堂免费观看| 夜久久久久久| 亚洲乱码一区二区| 亚洲国产精品免费| 一区二区三区在线免费视频| 国产欧美一区二区三区在线看蜜臀| 欧美乱人伦中文字幕在线| 久久香蕉精品| 久久免费视频网| 欧美v亚洲v综合ⅴ国产v| 久久综合电影一区| 免费在线看成人av| 久久手机免费观看| 欧美国产大片| 欧美日韩中文在线观看| 国产精品啊v在线| 国产一区二区三区不卡在线观看| 国产精品私拍pans大尺度在线 | 亚洲一区二区成人| 一本一本久久a久久精品牛牛影视| 亚洲精品综合| 午夜精品福利一区二区蜜股av| 亚洲在线中文字幕| 久久av资源网站| 欧美va亚洲va日韩∨a综合色| 久久综合伊人77777| 欧美日本免费一区二区三区| 欧美精品一区二区视频| 国产精品视频福利| 在线成人激情黄色| 一区二区欧美视频| 久久狠狠婷婷| 欧美日韩精品系列| 国产一区二区三区电影在线观看| 狠狠久久婷婷| 在线亚洲免费视频| 久久久噜噜噜久久中文字免 | 亚洲国产日韩在线一区模特| 亚洲精品久久久久久久久久久久| 亚洲精品视频啊美女在线直播| 一区二区欧美在线| 久久精品在这里| 欧美精品一区二区在线观看| 洋洋av久久久久久久一区| 一区二区三区高清不卡| 欧美影院成人| 久久久久成人精品免费播放动漫| 免费亚洲电影在线| 欧美日韩国产一级| 亚洲国产精品www| 欧美亚洲综合另类| 欧美日韩精品一区二区在线播放 | 欧美日韩蜜桃| 国产日产高清欧美一区二区三区| 亚洲精品国产品国语在线app | 国产欧美欧美| 亚洲精品视频在线| 久久久久国产成人精品亚洲午夜| 国产精品成人一区| 99精品国产一区二区青青牛奶| 久久亚洲色图| 国产亚洲精品bv在线观看| 一本色道久久综合精品竹菊| 免费成人毛片| 国产自产精品| 久久青草欧美一区二区三区| 国产精品视频久久| 亚洲天堂成人| 欧美日韩妖精视频| 一本色道久久88精品综合| 欧美极品一区| 亚洲精品视频一区二区三区| 欧美精品亚洲精品| 日韩视频精品在线| 欧美精品在线免费| 日韩视频免费| 欧美日韩一卡| 亚洲一级在线| 国产亚洲精品v| 久久久91精品| 亚洲高清在线观看一区| 欧美精品1区2区3区| 99这里只有精品| 国产精品盗摄一区二区三区| 99re8这里有精品热视频免费| 欧美日韩一区三区| 亚洲视频欧洲视频| 国产主播一区二区| 久久精品日产第一区二区三区| 红桃视频成人|