人工智能专题研究:向量数据库——AI时代的技术基座|世界即时看
【资料图】
受大模型热潮催化,向量数据库方兴未艾。NVIDIA CEO 黄仁勋在3月的NVIDIA GTC Keynote 中,首次提及向量数据库,并强调其在构建专有大型语言模型的组织中的重要性。大模型作为新一代的 AI 处理器,提供了数据处理能力;而向量数据库提供了存储能力,成为大模型时代的重要基座。向量数据库是一种专门用于存储和查询向量数据的数据库系统,与传统数据库相比,向量数据库使用向量化计算,能够高速地处理大规模的复杂数据;并可以处理高维数据,例如图像、音频和视频等,解决传统关系型数据库中的痛点;同时,向量数据库支持复杂的查询操作,也可以轻松地扩展到多个节点,以处理更大规模的数据。
百亿蓝海市场蓄势待发,向量数据库空间广阔。据 Statista 数据,2021 年全球数据库市场规模为 800 亿美元,同比增长约20.3%。假设增速保持20%,预计到2025年,全球数据库市场规模将达到1658.9 亿美元。据中国信通院测算,2020年中国数据库市场规模约241亿元;预计到2025年,中国数据库市场规模将达688亿元,复合增长率为23.4%。随着AI应用场景加速落地,我们预计2025年向量数据库渗透率约为30%,则全球向量数据库市场规模约为99.5亿美元,中国向量数据库市场规模约为82.56亿元。
海外需求逐步爆发,新兴赛道群雄并起。目前向量数据库的赛道仍处于发展初期,随着大模型日趋成熟,越来越多玩家瞄准向量数据库的机会并选择加入赛道,呈现百花齐放的竞争格局。向量数据库的头部企业包括Zilliz、Pinecone等,目前的主要的客户还是互联网厂商随着大模型应用的不断拓宽,预计向量数据库的公司将受到更多投资者青睐,迎来投资井喷期。 Zilliz目前已与Nvidia、IBM、Mircosoft等公司展开合作,在一级市场获得1.13亿美元投资;Pinecone先后上架Google云和AWS,逐步打开市场,在一级市场获得1.38亿美元投资。
风险提示:AI技术更新迭代缓慢、专业领域落地效果不及预期、市场开拓不及预期等风险。
关键词: