分析 最新研究顯示,客戶對超大型云服務(wù)商PostgreSQL實例的正常運行時間可靠性表示擔(dān)憂,這為規(guī)模較小的替代供應(yīng)商提供了填補市場空白的機會。
研究公司Foundry發(fā)現(xiàn),在PostgreSQL常見云服務(wù)用戶中,82%的用戶擔(dān)心云區(qū)域故障,21%的用戶在過去一年中經(jīng)歷過此類故障。
在2025年前六個月,數(shù)據(jù)庫流行度排名服務(wù)DB-Engines發(fā)現(xiàn)PostgreSQL是增長最快的數(shù)據(jù)庫,排名上升超過13個點。它總體排名第四,僅次于Oracle、MySQL和微軟SQL Server。2023年,這個開源數(shù)據(jù)庫成為最受開發(fā)者歡迎的數(shù)據(jù)庫,這很可能是因為三大領(lǐng)先云服務(wù)商的服務(wù)使開發(fā)者能夠輕松使用它。
但上周Foundry對212名來自企業(yè)和SaaS業(yè)務(wù)的IT決策者進行的調(diào)查發(fā)現(xiàn),91%當(dāng)前使用PostgreSQL的組織要求每月停機時間不超過四分鐘,即約99.99%的正常運行時間,而24%的組織目標(biāo)是少于30秒的停機時間。
這項研究由分布式PostgreSQL供應(yīng)商pgEdge委托進行。Gartner副總裁兼分析師Adam Ronthal表示,目前尚不清楚PostgreSQL服務(wù)可靠性SLA是否真的存在問題。"當(dāng)然,致電Gartner咨詢服務(wù)的客戶目前并沒有明確將此認(rèn)定為問題。"
然而,他呼吁云服務(wù)提供商跟蹤和記錄正常運行時間和可靠性,以消除"傳言"并確定特定服務(wù)是否確實存在問題。
微軟提供Azure Database for PostgreSQL作為完全托管的服務(wù),包括單服務(wù)器、靈活服務(wù)器和超大規(guī)模選項。AWS和谷歌都提供基本的PostgreSQL服務(wù),以及Aurora和AlloyDB等與底層云基礎(chǔ)設(shè)施更緊密集成的選項。
替代方案的興起
任何發(fā)現(xiàn)這些服務(wù)無法滿足其正常運行時間需求的用戶都有一系列PostgreSQL和PostgreSQL兼容服務(wù)可供選擇,這些服務(wù)具有分布式后端以增強可靠性。例如CockroachDB和YugabyteDB。
與此同時,以基于YouTube開發(fā)的分布式關(guān)系數(shù)據(jù)庫Vitess的分布式MySQL服務(wù)而聞名的PlanetScale,在本月早些時候推出了PostgreSQL服務(wù)。
CEO Sam Lambert在接受The Register采訪時表示,PlanetScale服務(wù)建立在開源PostgreSQL之上,而不是妥協(xié)兼容性,并使用該公司為MySQL/Vitess開發(fā)的專有操作器。
"操作器是確保PlanetScale具有如此強大的正常運行時間和可靠性的神奇組件:它管理所有節(jié)點、狀態(tài)和拓撲。實際上就是讓PostgreSQL適應(yīng)這個系統(tǒng),"他說。
Lambert表示,當(dāng)前服務(wù)沒有分片,但正在與客戶開發(fā)分片服務(wù)。他說這將是PostgreSQL的"測試等效",但不是100%兼容。"如果有人想使用它,他們應(yīng)該遷移到非分片服務(wù),我們將努力幫助人們從那里轉(zhuǎn)到分片版本。"
他說YugabyteDB和CockroachDB是"令人印象深刻的"分布式數(shù)據(jù)庫服務(wù),但聲稱它們沒有提供相同程度的PostgreSQL兼容性。"它們甚至沒有那么兼容,"他說。
例如,PostgreSQL兼容性指數(shù)顯示CockroachDB約為40%,而Yugabyte約為85%的兼容性。
Lambert表示,PlanetScale當(dāng)前的PostgreSQL服務(wù)是100%兼容的,而分片服務(wù)到達時可能是99%兼容的。
為Web應(yīng)用開發(fā)者提供開源反應(yīng)式數(shù)據(jù)庫的Convex已經(jīng)開始從AWS Aurora遷移到PlanetScale。該公司在博客文章中說:"多年來,我們在AWS Aurora之上運行Convex。體驗還算可以。Aurora確實做到了宣傳的內(nèi)容:它可靠,擴展性相當(dāng)好,與AWS其他部分集成得很好。但'可以'不是我們想要停留的地方。"
該公司表示,在已經(jīng)使用新服務(wù)的精選項目上,"性能提升令人難以置信"。
另一家希望利用超大型云服務(wù)商PostgreSQL服務(wù)可靠性問題和分布式系統(tǒng)兼容性問題的公司是pgEdge,它承諾提供基于開源PostgreSQL構(gòu)建的多主分布式數(shù)據(jù)庫,允許用戶在不同位置擁有多個主數(shù)據(jù)庫。
聯(lián)合創(chuàng)始人兼CEO Phillip Merrick在接受El Reg采訪時表示,這個完全兼容PostgreSQL的服務(wù)提供"相當(dāng)極端水平的高可用性"。
作為副產(chǎn)品,該服務(wù)還有助于解決需要從世界不同地區(qū)數(shù)據(jù)庫獲取數(shù)據(jù)的應(yīng)用用戶的延遲問題。"對于全球使用的應(yīng)用程序,當(dāng)你從英國和歐洲訪問完全托管在美國的網(wǎng)站或應(yīng)用程序時,你會看到一些延遲,這僅僅是因為光速是存在的,這些比特在海洋間往返需要一段時間。"
他說,典型客戶是大型組織,其中許多在金融服務(wù)領(lǐng)域。"我們的大多數(shù)客戶都是金融服務(wù)、政府和其他大型企業(yè),這些應(yīng)用程序根本不能停機,因此幾乎零容忍任何停機時間,結(jié)果是他們需要極端水平的高可用性,加上需要能夠從一個地理區(qū)域故障轉(zhuǎn)移到另一個地理區(qū)域以進行災(zāi)難恢復(fù)保護,"他說。
Gartner的Ronthal表示,分布式PostgreSQL服務(wù)可以避免單個云區(qū)域的故障。"需要這種程度容錯能力的組織在市場中代表相對較小的細分市場。權(quán)衡通常圍繞核心功能。你獲得了內(nèi)置的分布式處理和事務(wù)一致性,但可能放棄了一些其他高級數(shù)據(jù)庫管理系統(tǒng)功能,"他說。
Ronthal表示,如果這些分布式服務(wù)實現(xiàn)相同的SQL API,可能是超大型云服務(wù)商PostgreSQL服務(wù)用戶的選擇。"真正的問題是這些產(chǎn)品是否提供令人信服的性價比,以及RDS用戶是否需要那種程度的高可用性。一些用例需要,一些不需要。RDS是向更強大服務(wù)的過渡墊腳石——無論它們是與底層云基礎(chǔ)設(shè)施緊密集成的服務(wù),如Aurora或AlloyDB,還是提供不同功能的第三方,如分布式SQL數(shù)據(jù)庫供應(yīng)商。"
針對調(diào)查和PostgreSQL服務(wù)可靠性的未決問題,AWS表示其PostgreSQL兼容的Amazon Aurora DSQL設(shè)計為高達99.999%的可用性,而Amazon Aurora for PostgreSQL提供99.99%的正常運行時間SLA和全球復(fù)制,具有不到1分鐘的跨區(qū)域災(zāi)難恢復(fù)。發(fā)言人表示,AWS提供文檔來解釋客戶在升級期間應(yīng)該預(yù)期的停機時間。
谷歌和微軟也就本文提出的問題接受了聯(lián)系。