分散式儲存系統STF

Kenneth Mak's 的頭像
Printer-friendly versionSend by emailPDF version

如果大家對日本IT界有一定認識的話,大概都會聽過livedoor這家老牌企業。它營運的livedoor Blog服務在日本的地位,就如我們的Yahoo和新浪。Google和Facebook等企業一直都有把自家技術開源化的取向,livedoor也不例外,最近它就把自家的儲存系統開源化。

livedoor Blog的服務需要保存和管理大量的圖片和數據,而且因為成本效益的關係,使用底價儲存系統的同時,也必須達到安全和高速存取的成效,因此內部已經採用開源技術多年。這次公開的STF正是由livedoor改良後的產物,賣點是在生產環境下有曾經保存4億個檔案、約70TB數據的實績,採用的是Artistic License 2.0用戶授權。

livedoor Blog從前使的是每年成本達千萬日元的儲存系統,但隨著數據增長速度越來越快,原本系統的擴展能力已經追不上,要長遠發展就必須開發看家專用的系統。最初他們使用的分散式儲存系統是DAVStorage,成本的確較低但擴充性仍不足夠,最後使用的便是這個自家開發的STF。STF可用檔案為單位進行分散處理,而且可以用最普通的硬碟架設出並列處理的系統。

技術上STF採用了Apache、MySQL、Q4M、memcached和Perl等開源技術,數據會被保存多個複本,故障時可以自動修復,而且無需停機也可隨時追加和卸載儲存媒體,客戶端方面使用的是最普通的HTTP。熟悉儲存技術的朋友可能會問,它和MogileFS有合分別?STF的好處在相容PSGI,而且使用的通訊協定是老到不可再老的HTTP,有問題時進行疑難排解也較為容易,而且員工不需要因此學習新技術。有興趣的朋不妨下載回來試試。本篇已被納入「徵文」範圍,歡迎各位投稿撰寫更多關於本軟體更深入的教學,一經刊登將獲薄酬,詳情請參考此處