熱點聚集

4416個單詞,閱讀大約需要6分鐘 微博是一個傳播社會互動的互聯網平臺,通過利益機制分享短期新聞。微博客戶關注訂閱短信。在這種情況下,推薦系統可以很好地與訂閱系統集成,相互促進。微博有兩個關鍵基礎:一是建立客戶關系;第二,文本信息表達微博致力于優化這兩點,促進微博的快速發展。 微博推薦開發流程改變了系統方向,業務不斷變化,目標重置,產品理念、架構、算法都發生了變化。本白皮書首先描述了推薦架構在這一過程中的演變,希望借此機會探討業務與技術的關系,從產品目標、算法需求、技術開發等方面為網友提供一個完善的開發環境。 通常,架構是在團隊和業務環境中創建的,并努力基于環境因素處理環境問題。該結構由強大的功能組成,同時創建面向實現的效果。本白皮書詳細介紹了微博提案的三個階段,包括環境因素、架構配置和特點、實施影響。 1獨立1.0 1.1環境 影響結構形成的環境因素可分為內部環境因素和外部環境因素。內部因素主要與團隊和成員有關,外部因素主要與外部部門、整個企業或整個領域有關。 這個項目有很多項目。當時每個團隊平均有5個并行開發項目。當然最重要的因素是微博產品是快速發電機,微博很多地方需要提供支持。而且由于項目周期短,進度緊迫,不容易有時間清理和抽象。典型產品有微棒、微群、微分布、微結構、客戶、文字對齊。 基于以上原因,當我們面對一個單一的項目時,我們通過構建自己的理解,使用熟悉的技術棧來一個一個地構建我們的流程。 雖然在開發過程中有很多不足,但是我們已經為后續的架構優化打下了基礎。結果如下。 微博在快速發展的過程中,滿足了推薦服務支持的要求,完成了20多個獨立項目。 吳的框架誕生了,內部高效計算框架也誕生在這里。 總結web應用層的持續訴求,推薦通用應用框架配置2/F 2.0 我們引入了一個獨立的1.0。按照建筑發展的方法,我們走了一條支路,一條是流行的燈式建筑,一條是與廣告、搜索相匹配的單元式建筑。lamp架構的數據策略是獨立的,腳本語言是業務開發的主要語言。這個項目是快速開發和迭代的首選。單元架構強調本地流程解決方案、數據和業務組合、自開發服務和適用于高性能應用的數據庫。畢竟我們選擇兩者兼容,傾向于業務架構。為什么會這樣?我們來看看當時的環境。 2.1環境 微博2.0的推薦周期是2013年3月到2014年底。這一時期的內部環境因素有: 今天,團隊成員長期合作,在技術選擇上達成共識。 團隊產品側重于文本/客戶/垂直課程推薦,場景分為源主頁、文本頁面和個人電腦主頁。這種專注不僅有助于統一建筑,也有助于獲得技能。 外部因素包括: 企業確定定位建議,提高關系績效和文本信息表達效率,為推薦廣告的技術探索、場景介入和客戶體驗提供依據。 在推薦領域,每個企業都有自己的架構輸出,這是微博建議的重要指南。 2.2架構配置和功能 隨著團隊對核心業務的實施,工具和框架發展迅速,2.0部署的目標正在成為現實。 1.技術目標 與1.0不同,2.0的技術目標不再僅僅是實現業務需求。要獲得完整的推薦流程,您需要: 第一步是實施完善的推薦流程,包括候選人選擇、調整、策略、論證、反饋和判斷。 數據是提取數據模式的第一個數據。為了實現數據對比,效果是基于數據,實現數據通道,反映反饋,實現數據落地,實現領域事務需求。 它提供了一種方便的方法來干預算法。 這不僅可以保證快速迭代和業務開發,還可以支持高效計算。 2.體系結構 微博推薦2.0的架構如圖5所示。它不再是一個獨立的系統,開發者不能使用類似的技術來處理類似的問題。體系結構圖主要包括以下幾個部分: 應用層:主要負責推薦策略和演示,其優點是充分利用腳本語言的特點來響應重復的需求。對齊后,您可以顯示大多數推薦文本,但這一io密集型層必須在技術層面完成,因為您需要合并、刪除和重新定位前端產品策略。在技術選擇的框架下,開發最初基于apache+mod_python,創建了common _ recon _ frame。該框架面向能夠成功實現推薦業務流程的二級開發人員。該框架的核心思想是提取項目、任務和數據三層接口。本項目適用于各種推薦項目,每個推薦項目的推薦任務不同,是一種管理訪問方式。兩種規格和設置。一是集成推薦的接口,不考慮客戶、上下文或域,二是通過保護不同協議數據庫的訪問實踐,顯著提高開發效率。common _ recon _ frame框架的出現,基本上是處理產品的各種推薦策略的需求,走在產品的前面。圖5微博推薦2.0架構示意圖 計算層:cpu是主要消耗。該層為算法提供干預措施,并執行支持算法模型迭代的推薦排序計算。在這個技術選擇層,我們繼承了原有的woo協議框架,這是一個基于c/c ++開發的內部高效通信框架。當然,我做過很多擴展。同時,我借用了上面提到的common _ recom _ frame思想,實現了基于woo框架的項目/實踐/數據管理,為二次開發人員提供了更高效的開發工具。將此工具包含在您團隊的開源項目中 數據層:主要負責推薦的數據流和存儲。數據層的首要任務是處理數據的入/出/存儲問題。數據輸入到系統中,輸出是一種數據訪問方法,存儲是一種數據存儲方法。規劃數據層時,分析微博推薦的數據特征,分為靜態和動態兩類。靜態數據定義如下:更新需要的數據量大,頻率低,并發性低,動態數據定義為增量數據,動態更新頻率高。正因為如此,在靜態和動態數據的生成過程中,rin/r9接口、radial/lumen、tmproxy/呼吸機或工具框架是唯一的輸入/輸出/軟件的一般方向。先說擴展:rin數據訪問動態數據,支持通過web服務接收數據,管理后端隊列。客戶集群由多服務框架ckestrel補充,客戶需要執行自己的業務開發。可以在線快速采用動態數據。r9接口求解器訪問靜態數據的推薦行為對比r9接口框架下hadoop集群的靜態計算【mr hive sql和spark行為】,通知管理和數據加載,處理很多靜態數據。多個redis集群用于動態數據,廬山集群用于靜態數據來存儲推薦數據。對于魯山來說,這個工具也包含在團隊開源項目中:github/WB建議/魯山。為了處理出數據的問題,tmproxy/通風結合通風訪問中間件代理來解決靜態和動態數據的推薦請求,減少業務變化的影響。基礎服務:推薦系統的基礎服務主要包括監控、報警和判斷系統。數據監控系統分為性能監控和影響監控,判斷系統主要用于下屬判斷。去之前有一定的期待和影響。 3.優勢 優點是: 數據集成實踐提供完善的推薦流程支持 在快速實現業務功能的過程中,效果技術不斷深化。 該算法得到了很好的支持。 第一次采納你的數據的想法,有助于你全面比較自己的影響力,繼續提升推薦效果。 密封系統易于放置,測試中包含質量保證。 缺陷如下。 離推薦核心有一定距離,與推薦不完全一致。 推薦的策略算法完全傳播給開發者,不適合普遍采用。 算法培訓不包括在內,只有在線投放系統,因為這個完善的推薦系統是不夠的。 2.3結果 微博推薦2.0的誕生,產生了不錯的效果。 微博的核心業務是通過組織推薦、趨勢客戶推薦、趨勢文本推薦、各種場景下的客戶推薦、粉絲經濟學、賬號推薦等系統來完成的。 為lab_common_so創建一個基本框架并實現開源 一個靜態存儲集群處理方案,廬山,誕生了。 聯陣框架的誕生大大提高了該公司的生產效率,并為開放社區作出了貢獻。 3平臺類型3.0 前一節2.0描述中提到的第一個缺點是,與推薦的核心有一定的距離,與推薦不完全一致。我們希望在建議3.0中修復它。為什么推薦的架構在滿足業務需求的同時繼續快速發展?我們會給大家展示微博推薦的平臺風格3.0設計。我們來看看環境。 3.1環境 目前2014年底至今的內部環境因素如下,微博推薦3.0。 推薦的產品不延伸,但更重要。同時,關鍵工作開發和迭代轉向性能比較的技術迭代。 如果您以迭代的方式提出一個新的項目或業務,將會有多個重復的任務,這些重復的任務是因為模式沒有被處理。 外部因素包括: 該企業還擴大了工作范圍,優先考慮效率,以改善客戶體驗和文本質量。 微博建議推薦技術鏈接的距離區有一定距離,有追趕的情況。 3.2架構配置和功能 目前的環境也能體現3.0的技術目標。 1.技術目標 與2.0不同,全面的推薦過程不是3.0的目標。目標是總結推薦過程中候選人/協調/培訓/反饋的常見做法。 推薦算法需要建立推薦系統算法的位置數據問題,并探討算法策略 2.體系結構 如圖7所示,建議在這個開發2.0的基礎上尋找微博3.0的架構,因為運行目前的架構體系,我們維護的是一個大規模的分層體系和框架2.0中實際采用的工具。以下是一個關鍵點: 兩個標準:應用層的一個整體輸出框架,都是一個應用層包含標準輸入輸出參數的接口規范,同時關聯動態輸入lean和離線計算,可以理清我們的結構。因此,輸入層工具r9的接口規范是相互依賴的。* * *分區級別的標準設置不需要設置行字符串,比如數據/記錄。 通過生成候選項的標準方法添加計算層:artemis候選文本模塊、項目候選客戶模塊、...應該只選擇這種方法來生成項目開發的候選項。 增加了一個戰術平臺eros來處理算法模型問題。eros的主要優點是1)訓練模型2)特征選擇3)在線比較測試。 r9接口層和用于在線和離線生成精益增長候選的數據推薦了產生結果的通用策略。 圖7微博推薦3.0示意圖 3.優勢 它首先解釋了它的優點: 它繼承了2.0的原有特性,保持了它的優勢。深入理解這些建議,結合推薦候選/對齊/訓練算法最重要的處理方案 3.3結果 微博推薦3.0誕生,結果如下: 微博推薦的核心業務逐漸向系統遷移,算法數據是提高效率的驅動因素。 技術來源于業務,促進業務的快速發展。業務的快速發展是技術快速發展和相互影響的背后動力。隨著商業的快速發展,技術仍然存在。 技術架構選擇的建議是找到最短路徑,然后迭代優化。把一切都放在一起是不現實的,也是不合理的。 宣傳框架和工具的最好方式不是行政命令或處理,而是每個人都是參與者。和開源項目一樣,每個人都是所有者,因為每個人都是被維護和采納的。

上一篇:「推廣心得」互聯網軟性廣告對營銷有什么不一樣的錯誤思想呢

下一篇:「推廣心得」關于2019年微信公眾平臺服務宣傳最新解讀


標題:「推廣心得」關于新浪微博推薦系統架構演進過程? ??

地址:http://www.good-jn.cn/a/rwfb/2567.html


注明“來源:文芳閣”的所有作品,版權均屬于文芳閣軟文推廣平臺,未經本網授權不得轉載、摘編或利用其它方式使用上述作品,如有對內有異議請及時聯系btr2030@163.com,本人將予以刪除。