9月12日,分布式關系型數據庫公司PingCAP宣布獲得C輪5000萬美元融資,據悉這是目前新型分布式關系型數據庫領域的最大筆融資。本輪融資由復星、晨興資本領投,華創資本、云啟資本、經緯中國等多家投資機構跟投,融資將主要用于技術研發和全球化生態建設。

PingCAP成立于2015年,成立3年來相繼獲得經緯天使輪融資,A輪獲得云啟資本的數百萬美元融資,B輪獲得華創資本等機構1500萬美元融資。在C輪融資公布前PingCAP創始人劉奇接受了億歐專訪,揭秘今日頭條、餓了么、摩拜等知名企業背后的數據庫服務提供商,為何不是Oracle、微軟等世界知名企業的產品,而是選擇了國內一家創新型企業——PingCAP。
早年劉奇在京東任職的時候,就被數據存儲行業兩個難題困擾:一個是當時的緩存服務數據庫不支持水平線性擴展;另一個是數據量越來越大,讀寫速度和吞吐受到很大挑戰,沒有一款數據庫提供足夠彈性的業務支撐能力。在劉奇加入豌豆莢之后,在分布式緩存方面,劉奇寫出了Codis,并把它開源了出來,解決了第一個問題。第二個挑戰是實現理想的分布式數據庫,這件事是向數據庫的最高峰發起挑戰,很具有想象力。
那時心懷“Hacker”精神的劉奇決定出來創業,盡管這是一件Oracle、Google也正在探索的事業,劉奇同樣意識到了這件事的難度。“其實初心也很簡單,最開始只不過是幾個不愿妥協的分布式系統工程師對心目中'完美'的數據庫的探索?!眲⑵孢@樣輕描淡寫當時的“野心”。
在分布式關系型數據庫領域,目前市場上還沒有一個公認的事實標準產品,給了PingCAP充分的發展空間。要知道Google其實是最大的數據庫用戶,一直在探索實現新型的分布式關系型(NewSQL)數據庫。Google在2012、2013年分別發表了Spanner及F1的論文,F1在Google內部正是用來替換MySQL Sharding 方案的;到了2014年Diego關于Raft的博士論文發表,社區第一次可以繞開Paxos實現等價的工業級別的分布式一致性協議。兩個重要事件為PingCAP的創造性發展打下了理論基礎。
劉奇向億歐介紹道,TiDB作為新一代開源分布式關系型數據庫實現了在線彈性伸縮,強一致性的分布式事務,以及基于 Raft 算法的多副本復制等重要特性。TiDB是將HTAP這個概念從實驗室和論文里帶到現實的產品之一?!霸谖覀冎?,很多人認為分布式OLTP和OLAP融合幾乎是不可能的事情,” 但是科技的進步讓不可能成為可能,PingCAP抓住了技術領域的正確方向,得以完善地解決了這個問題。
值得一提的是,TiDB還具有區別國外同類型項目的優勢。在全球分布式關系型數據庫潮流中,TiDB比如并不像CockroachDB那樣選擇將SQL和KV融合,而是像Spanner和F1一樣選擇分離。這樣分層的思想也是貫穿整個TiDB項目始終,這個架構對于項目測試、滾動升級以及各層的復雜度控制會比較方便。
新型分布式關系型數據庫,相比傳統SQL和NoSQL一大特點是把ACID事務和擴展性相融合,適合數據大規模增長的科技創新型企業?!白?TiDB 的初衷并不是想要在小數據量下取代MySQL,而是嘗試去解決基于單機數據庫解決不了的一些問題。 ”因此PingCAP天生適合業務快速增長的公司,摩拜、騰訊、轉轉、美團、今日頭條、餓了么、去哪兒、同程旅游、秒拍、美圖、VIPKID 等都已經在使用TiDB。
在2017年的時候,TiDB在數據庫行業發展的如火如荼。恰逢餓了么的歸檔環境存在前述問題,自然而然的就注意到了TiDB。TiDB可以簡單地添加節點,提高集群整體的計算和存儲能力。目前,TiDB 產品 的應用會影響餓了么全平臺 80% 的流量,包括從用戶選餐下單到訂單配送整個餓了么流程。這半年的穩定運行,餓了么取得了非常良好的應用效果。
另一家應用TiDB的企業是摩拜,摩拜每天產生的騎行數據數十TB,飛速增長的業務使摩拜面臨數據庫擴展與運維的挑戰。摩拜應用TiDB來解決海量數據的在線存儲、大規模實時數據分析和處理。比如摩拜僅開關鎖業務一年的量在數百億,使用單機的 MySQL庫處理這個業務需要頻繁的進行歸檔,在有限人力下會變成IT災難。TiDB可以靈活增減節點,保證不管摩拜業務量如何激增,業務需求如何變化,都可以很方便地升級支持。
TiDB在餓了么、摩拜等企業中處理相關數據方面的良好變現,促使PingCAP獲得了很多客戶的親睞。截止目前 TiDB 已有準生產測試(POC)用戶 1400 余家,其中 300 余家企業已經將其應用在實際生產環境中,涉及互聯網、游戲、銀行、證券、保險、第三方支付、政府、電信、航空、制造業、新零售、快消等多個領域。
不論從產品技術、業務模式還是資本層面,PingCAP都已經獲得充分認可。應該說PingCAP正在成為數據庫,甚至B端項目中的黑馬,要知道過去國內數據庫領域,鮮有能以此姿態出現的創業公司。劉奇總結PingCAP的發展,認為兩個選擇對PingCAP來說至關重要:
第一是選擇開源
在劉奇看來,單純依靠一個團隊開發力量并不能創造出完美的解決方案,開源的精神就是依靠社區的力量不斷完善產品,而不是閉門造車。 ”開源社區可以吸引來自各行各業的測試用戶,帶來豐富的測試場景,便于產品的品質保證和快速迭代;同時,開源社區為了保證產品的完整性,各個不同廠商或者個人開發者在開源軟件上開發的新的功能,都會積極提交給原廠的主干分支,相當于開源在利用整個社區和生態的力量來加速產品的完善和成熟。
除了研發支持外,PingCAP早期用戶也都天然的來源于社區,早期的鐵桿用戶作為中立的成功案例非常具有說服力,很多技術負責人就是在社區了解到TiDB,使得PingCAP在早期只有一個銷售的情況下,依舊獲得了足夠多企業負責人或是CTO的關注,這對沒有銷售基因的PingCAP創始團隊來說,簡直是個福音。
第二是選擇擁抱MySQL的生態
劉奇談到選擇擁抱 MySQL 的生態,對PingCAP來說是最貼近用戶實際場景的選擇。TiDB選擇了兼容MySQL的協議和語法,那么MySQL社區的ORM 框架、運維工具,直接可以應用在TiDB 上。
“現在回過頭看來,兼容MySQL協議這件事可以說是團隊做的非常慎重的一個判斷”,劉奇認為這是PingCAP做的最重要的商業抉擇之一。因為一個新型數據庫項目冷啟動,讓企業放心把核心業務數據存在你的產品上,十分不容易?,F實是已經有大量企業的業務正在使用 MySQL,這些企業熟悉MySQL的語法、測試工具,兼容MySQL有助于企業業務數據平滑遷移到TiDB上,從而降低用戶的遷移成本以及PingCAP的推廣成本。
數據庫一直被譽為數據處理皇冠上的明珠,尤其在1990年之后出現的開源數據庫MySQL和 PostgreSQL等產品,支撐起了Oracle、IBM等企業巨頭的主要營收。如今情況正在悄悄改變,Google、AWS等新型技術企業正在對傳統數據庫軟件發起猛烈攻擊,AWS在2014年推出Aurora關系型數據庫,Google則開發出了Cloud Spanner等數據庫。
國內除了早期阿里的Cobar、TDDL、360 開源的Atlas等數據庫中間件產品引起過關注外,數據庫市場一直波瀾不興。然而隨著云計算、大數據時代的來臨,傳統關系型數據庫與NoSQL數據庫在業務數據量激增的情況下,水平擴展、復雜業務邏輯的處理都不夠好,國內迫切需要新型數據庫滿足他們的需求。分布式關系型數據庫公司 PingCAP適時出現,正在滿足這些企業的需求。
能夠滿足市場廣泛的痛點需求,也是很多知名資本多輪融資中持續跟進PingCAP的原因。復星新技術與新經濟產業集團副總裁叢永罡說:“在 PingCAP 持續3年的產品打磨和不斷實踐驗證后,TiDB成為早期將 HTAP 這個概念從實驗室帶到現實的產品之一。其 TiDB 開源項目獲得業內認可,并已將國內大多數互聯網獨角獸企業攬為用戶,也是業內高度認可的體現?!?/p>
晨興資本副總裁劉凱表示:“一直以來,數據庫領域都是產品研發能力和商業運營能力的最高級競技場,PingCAP 持續深耕互聯網領域客戶,已成為規?;ヂ摼W企業和金融企業的主流選擇,晨興愿與PingCAP共同打造開源軟件生態?!?/p>
基于PingCAP是獨立第三方開源數據庫的屬性,騰訊云、UCloud、京東云等云計算企業紛紛和PingCAP展開云數據庫合作。據悉PingCAP在海外的公有云布局也在逐步落地當中。
從服務客戶和合作企業的質量和數據來看,PingCAP在短短3年時間發展確實足夠快。未來深入垂直行業、傳統企業提供數據庫服務,將是PingCAP面臨的重要考驗。另外PingCAP也已經在硅谷設立了辦公室,回到數據庫的起源地競爭,也是PingCAP未來具有想象空間的挑戰。