ChatGPT引爆「向量數據庫」賽道!兩家公司共獲10億元融資-世界觀焦點
2023-05-03 14:34:18 來源:雪球網 小 中
ChatGPT引爆「向量數據庫」賽道!兩家公司共獲10億元融資
原創 AIGC開放社區 2023-05-01 07:48
4月22日,向量數據庫平臺(vector database)Weaviate宣布獲得5000萬美元(約3.5億元)B輪融資,由Index Ventures領投,Battery Ventures等跟投。
(資料圖)
4月28日,向量數據庫平臺Pinecone宣布獲得1億美元(約7億元)B輪融資,由Andreessen Horowitz領投,ICONIQ Growth等跟投。
最近,為ChatGPT等生成式AI應用提供向量搜索、向量數據存儲、向量嵌入等功能的向量數據庫賽道突然走紅,兩家初創公司Pinecone和Weaviate的融資時間僅間隔6天,其火爆程度可見一斑。
Pinecone聯合創始人兼首席執行官Edo Liberty則直言,如果沒有ChatGPT的出現,我們根本不可能獲得巨額融資。
事實上,在ChatGPT火爆出圈之前向量數據庫非常小眾,而Pinecone和Weaviate皆創立于2019年無論是融資還是營收并不如意,因為,大型科技巨頭具備自研能力無需使用第三方產品,例如,微軟將向量搜索技術應用在Bing中。
現在,大量開發者涌向生成式AI應用開發領域,這使得蟄伏4年的兩家向量數據庫廠商終于迎來了曙光,其用戶數量呈指數級增長,也是獲得巨額投資的重要原因之一。
Pinecone融資信息
當創業者的目光聚焦在類ChatGPT大語言模型、應用、衍生產品時,為其提供“后勤服務”的向量數據庫拓寬了生成式AI細分創業賽道,并成為下一代生成式AI應用的主要數據庫存儲。
不過,目前向量數據庫存儲只有大型科技巨頭才能使用,而Pinecone和Weaviate希望簡化使用流程降低成本,使得中小型企業、個人開發者也能使用向量數據庫。
,時長02:37
微軟專家介紹向量搜索此外,根據 IDC調查數據顯示,全球在AI技術和服務上的支出2023年將達到1540億美元,到2026年將超過3000億美元。其中,向量數據庫為AI的開發、增強內容生成的準確性提供了重要技術支撐。
下面「AIGC開放社區」將為大家介紹向量數據庫技術概念、與ChatGPT等大語言模型的關系、技術特征、場景化落地以及Pinecone和Weaviate這兩家典型廠商的介紹。
Weaviate融資信息
什么是向量數據庫
筆者查詢了國外大量權威的論文、專業技術網站,甚至詢問了ChatGPT,它們對向量數據庫的技術概念解釋非常復雜難以理解。所以,就用通俗易懂的方式為大家介紹向量數據庫概念。
微軟官方對向量數據庫的解讀
簡單來說,向量數據庫用來存儲非結構化數據,例如,文檔、圖片、視頻、音頻和純文本等,在保證100%信息完整的情況下,通過向量嵌入函數來精準描寫這些非結構化數據的特征,從而提供查詢、刪除、修改、元數據過濾等操作。而像SQL、Mysql這樣傳統的數據庫根本無法完成這些操作。
從向量數據庫的技術特性不難看出,這是專門為ChatGPT等生成式AI應用量身定制,例如,讓ChatGPT用莎士比亞的語氣生成一段詩句,ChatGPT通過向量數據庫的相似搜索功能,可以增強內容輸出的準確性。
因此,向量數據庫在大語言模型、計算機視覺、推薦系統以及其他需要語義理解和數據匹配的領域得到廣泛應用。
向量數據庫主要功能和用例
向量數據庫除了存儲數據之外,還提供了語義搜索、圖像/音頻/視頻/等非結構化數據相似度搜索、排名和推薦引擎、支持大規模數據、索引與壓縮技術、分布式架構等功能。
語義搜索:通常搜索文本和文檔可以用兩種方式完成,詞法搜索和精準的單詞或字符串匹配。向量數據庫的語義搜索可以理解文本、句子和整個文檔字符串的含義和上下文,從而提供更準確和相關的搜索結果。
圖像/音頻/視頻/等非結構化數據相似度搜索:圖像、音頻、視頻和其他非結構化數據集,在傳統數據庫中進行分類存儲非常具有挑戰性,通常需要將關鍵字、描述和元數據手動應用于每個對象。
向量數據庫的相似性搜索功能,如余弦相似性、歐氏距離等度量來衡量向量間的相似性。這使得用戶在處理如圖像識別、推薦系統等變得非常高效。
排名和推薦引擎:該功能對于電商、搜索引擎來說非常有用,例如,微軟的Bing,網易云音樂的推薦都應用了該技術。該功能主要基于用戶最近匹配項查找相似項目,使向量數據庫為用戶提供相關的最佳內容選擇,并且可以根據相似性分數對項目進行排名。
支持大規模數據:向量數據庫具有良好的擴展性,能夠支持大規模的向量數據存儲和檢索。這對于處理海量數據的大語言模型、機器學習、數據科研等非常有用。
索引與壓縮技術:為了提高搜索速度和降低存儲成本,向量數據庫通常采用先進的索引和壓縮技術。這些技術可以有效地降低數據的存儲空間,提高查詢速度,并降低內存占用。
分布式架構:為了實現高可用性和容錯能力,向量數據庫采用分布式架構。這使得用戶可以在多個計算節點上分布存儲和處理數據,提高系統的整體性能。
$創意信息(SZ300366)$ $中國軟件(SH600536)$ $昆侖萬維(SZ300418)$
關鍵詞:
相關文章
- ChatGPT引爆「向量數據庫」賽道!兩家公司共獲10億元融資-世界觀焦點
- IVD上市公司董事長的一條朋友圈,驚醒無數人!|全球百事通
- 百度文心大模型突破性成果:中國企業首次以第一完成單位登頂《Nature》正刊
- 美半導體協會總裁:中國是我們最大的市場 我們不能缺席 環球熱文
- 五一后機票價格大幅下降
- “小聚居、大空間”!露營經濟帶靚日照山海天全域旅游
- 餐具飲具集中消毒服務單位違反食品安全法_餐具飲具集中消毒服務單位衛生監督工作規范_全球觀點
- 今天最新消息 92.7%受訪00后對新職業感興趣 找工作看重待遇和前景
- 更古村志愿服務大隊_對于更古村志愿服務大隊簡單介紹_世界快消息
- 天天簡訊:杭州海底撈五一假期前三天接待人次超15萬,同比增長近七成
- 全球即時看!撬動汽車消費,各地促銷活動持續火熱
- 珠海口岸“五一”假期查驗出入境人員240余萬人次-世界訊息
- 環球觀熱點:格力電器2022年報印象:經營尚算穩健,分紅不及預期
- 環球精選!樂普醫療商業模式淺析(下)
- A股:本周四、五股市走勢分析預測,不廢話上重點-觀察
- 天天熱文:返程請注意!四川多地有雨?雨?雨?
- 寧波諾丁漢大學傳播學就業方向_傳播學就業方向
- 更做到_對于更做到簡單介紹 環球聚焦
- 礦產勘查地質學 全球觀察
- 樓上裝修的時候,自身過錯水泥堵了陽臺的存水彎的下水道,樓下剛裝修好
- 財報分析進階之 通威2023年的利潤 時快訊
- 短線→中線→長線的歷程
- 今年我參加了股東大會!
- 當前動態:香港警隊招募取消最低身高要求,增設“中英文筆試”
- 男扮女裝久了會怎樣_長期男扮女裝生活
- 熱推薦:紅燒黃花魚的家常做法_紅燒小黃魚的家常做法
- 熱議:5月3日大理至昆明增開2列普速旅客列車 助力客流返程
- 焦點快報!北京玉淵潭公園:因天氣原因,公園游船今天14時停止售票
- 全球觀熱點:跨過人性做投資!
- 【5月關注】3大黑馬橫空出世:AI+電競賦能公司,潛力巨大!-全球最資訊
熱文推薦
排行推薦
五一后機票價格大幅下降
“小聚居、大空間”!露營經濟帶靚日照山海天全域旅游
餐具飲具集中消毒服務單位違反食品安全法_餐具飲具集中消毒服務單位衛生監督工作規范_全球觀點



