Netflix 已全面遷移至 Amazon Aurora 資料庫架構,帶來約 75% 效能提升與 28% 成本降低,全面轉向擁抱雲端原生託管服務。
Netflix在雲端架構的佈局一向是業界指標,而InfoQ網站報導指稱,Netflix已經完成將其關聯式資料庫基礎設施大規模遷移至Amazon Aurora,將使整體資料存取效能提升75%,同時營運成本更降低28%。
這不僅僅是一次技術升級,更代表Netflix從過去在Amazon EC2上「自建」資料庫的作法,全面轉向擁抱雲端原生 (Cloud-Native) 的託管服務,將繁雜的維運工作交給AWS。
痛點:自建PostgreSQL的維護運作黑洞
在遷移之前,Netflix的線上資料儲存 (ODS) 團隊面臨著嚴峻的挑戰。當時的架構依賴於在Amazon EC2實例上「自主管理」的分散式資料庫PostgreSQL。
雖然這給予Netflix極高控制權,但也帶來了龐大的維運負擔 (Operational Burden)。團隊必須處理碎片化的資料庫環境、佈署自定義的二進位檔案、手動升級修補程式,以及應對複雜的擴展需求。一旦發生故障,恢復流程往往既複雜又耗時,直接導致延遲不穩定。
為了統一技術策略並減輕負擔,Netflix決定轉向Amazon Aurora PostgreSQL相容版,既保留了開發人員熟悉的PostgreSQL特性,同時也能享有託管服務的便利性。
成效:延遲腰斬,效能飛天
遷移後的數據證明了這項決策的正確性。
• Spinnaker (持續交付平台):平均延遲降低了50%,反應延遲表現更從67.57毫秒降至41.70毫秒。
• 策略引擎服務 (Policy Engine):關鍵端點的延遲更是大幅下降75%,從26.72毫秒縮短至僅6.51毫秒。
為什麼Amazon Aurora能快這麼多?關鍵在於其「計算與儲存分離」的架構設計,以及基於日誌 (Log-based) 的寫入機制,使得Netflix能將高達75%的實例記憶體分配給共享緩衝區,遠高於標準PostgreSQL通常僅能分配的25-40%。
Netflix資深軟體工程師Ammar Khaku直言:「我們不再需要在Amazon EC2上構建和佈署帶有內部修補程式的自定義檔案,轉向現成的Amazon Aurora,讓我們能專注於業務發展,而不是基礎設施。」
業界趨勢:不只Netflix,大家都在搬
Netflix並非個案,包括三星已將11億名用戶從傳統甲骨文資料庫遷移至Amazon Aurora,而Panasonic Avionics遷移後更節省高達80%營運成本,顯示出大型企業正積極消除昂貴的授權費用與管理開銷。
但Amazon Aurora並非萬靈丹
不過,報導中也客觀指出,工程師在評估時仍需保持理性。Aurora 雖然強大,但並非適合所有場景:
• 時間序列 (Time-series):針對密集型工作負載,像Timescale這樣的專用擴展可能提供更快資料存取速率與更低成本。
• 全局寫入 (Global Writes):Amazon Aurora存在單一寫入 (Single-writer) 的限制,對於需要全球多點寫入的應用,如CockroachDB或TiDB這類分散式 SQL方案可能是更好的選擇。
儘管如此,對於Netflix而言,Amazon Aurora提供的快速故障轉移 (讀取副本可在100毫秒內升級為寫入副本)顯著提升系統可用性,這才是串流服務最看重的核心價值。


