黄东旭: 向量数据库还是向量搜索+SQL? 我对未来数据库趋势的洞见。

2024-02-18 热点资讯 关注公众号
    【引言】
黄东旭:“向量数据库”还是“向量搜索插件 + SQL 数据库”?丨我对 2024 年数据库发展趋势的思考    在数据库技术飞速发展的2023年,PingCAP的黄东旭先生深度剖析了这场变革,并对即将到来的2024年数据库发展趋势做出了前瞻性的预测。本文聚焦于GenAI时代对数据库产生的深远影响,并提出了两种应对策略:“向量数据库”和“向量搜索插件+SQL数据库”的融合路径。文章着重强调了个性化数据服务的核心地位以及数据库在实时交互与弹性能力方面所扮演的关键角色。
    【2023:数据技术的急速变革】
    2023年,数据库内核技术与云原生架构深度融合,AI+Data浪潮翻涌不息,用户工作负载经历深刻转型。GenAI时代的降临,犹如一股无法抗拒的力量,驱动着整个数据技术领域朝着智能化、灵活化方向汹涌前进。这一年,炫酷的AI Demo竞相上演,但随着我们步入2024年,业界将铭记这个由“AI从Demo走向真实场景落地”的关键转折点。开源大模型成本骤降,企业和开发者对数据的关注度瞬间超越了对模型的关注,预计在2023年投入AI模型预算的80%比例在未来一两年内可能发生逆转,用户将更多地(甚至超过80%)投资于数据处理与分析,这使得数据处理能力的重要性愈发凸显。
    【GenAI挑战与选择】
    面对AI带来的诸多新诉求,数据技术领域正面临多重挑战与机遇。GenAI正在重塑数据技术的全新生态格局。那么,在这一背景下,“向量数据库”与“向量搜索插件+SQL数据库”该如何抉择?如何应对GenAI对数据库扩展性和实时交互提出的严苛要求?海量数据实时查询的成本压力是否巨大?AI催生的自然交互方式又将如何革新开发者体验?本文将逐一深入探讨这些问题。
    【预测一:数据库模式的重构】
    在GenAI应用日益普及的今天,尤其是Chatbot或Agent形态的产品,对数据访问的需求呈现出更为灵活和动态的特点。个人或组织生成的数据价值飙升,尽管数据量并不庞大,但其重要性不可忽视。GenAI直接以高效动态的方式访问数据,发起端则由边缘计算如Agent或GenAI进行。GPTs是一个生动例证,它支持通过自定义Prompt和RESTful API构建个性化的ChatGPT,后台Action被灵活调用且参数难以预知。随着用户身份信息标记机制的引入,UserID将成为数据库核心索引,从而让传统关系型数据库能够适应新的需求。
    尽管出现了众多专门的向量数据库,但在黄东旭看来,更理想的方案是丰富现有的SQL数据库接口,使其标配向量搜索功能,而SQL仍为基石。向量搜索不必独立作为一个数据库来支持,而是作为数据库内置的一项功能。通过在SQL中插入和更新向量数据,结合向量索引的搜索能力,RAG得以实现动态更新与实时查找,从而消除向量数据库可能带来的数据孤岛问题。此外,Serverless产品形态也赋予用户对自身数据的所有权,这一理念在Web2时代几乎无法实现,却与Web3的理想愿景不谋而合。
    【预测二:实时交互与弹性基础】
    随着高价值数据驱动的应用成为GenAI应用主流,数据库的弹性与实时交互能力成为了至关重要的基石。在GenAI时代,知识和数据需要具备实时更新能力,这对数据库扩展性和实时交互性能提出了直接挑战。
    虽然过去十年间业界已经关注并解决了大部分单一在线业务的扩展性问题,但对于具有冷热特征的业务,尤其是在未来更加动态和灵活的2024年及以后,传统的Shared Nothing系统可能不再适用。TiDB从设计之初就尝试打破这种局限,通过存储节点(TiKV)、计算节点(TiDB)和元信息(PD)的分离,以及后续版本中引入的自定义Placement Rule等功能,尽可能降低对等假设的影响,使资源分配更具灵活性。
    而在云端,高效利用计算资源和提供弹性服务成为关键。数据库不仅需要满足强大的数据处理能力,还需要高效的实时数据广播和同步机制,确保决策基于最新、最准确的信息,实现实时交互。这要求数据库能够在毫秒级做出响应,并无缝同步事务处理(OLTP)和分析处理(OLAP),进而成为现代数据库区别于传统数据库的重要标志之一。
    【预测三:成本透明与可观测性】
    在云数据库时代,成本分析成为所有人的关注焦点,它在可观测性中独树一帜,成为评估云消费的新视角。云数据库的可观测性尤为重要,因为它几乎是开发者诊断问题的唯一途径。服务商提供的Dashboard应能清晰展示账单详情,账单的可解释性越好,用户体验便越佳。
    然而,计费测量粒度过细可能会对产品性能和实现成本产生负面影响,因此需找到一个平衡点。无论如何,成本分析作为可观测性产品的一个独立视角,可以帮助用户发现潜在问题并优化成本。例如,当用户发现某数据库实例CPU使用率低但成本高昂时,可考虑调整实例规格以降低成本。
    AWS今年发布的Cost and Usage Dashboard及其CTO Dr. Werner在Reinvent演讲中倡导的“俭约架构”七大法则,为我们提供了在云环境中打造高效、可持续系统的指导框架。
    【预测四:开发者体验为核心】
    随着GenAI时代应用工具变得越来越轻巧便捷,开发者体验已成为现代数据库设计的核心目标之一。优秀的数据库平台不仅仅是美观的Web界面和丰富的功能集合,更重要的是蕴含其中的设计巧思和产品经理的专业素养。
    数据库管理工具作为一种虽非高频但却严肃使用的工具,在AI和云时代,应当遵循一系列与体验紧密相关的设计原则:API优先,保证稳定且前向兼容;采用统一认证体系,打通管控认证与数据库内部认证;构建各具特色的小工具,并通过统一CLI入口和语义系统进行调用。这些原则旨在创造卓越的开发者体验,正如乔布斯所说,“伟大的艺术拓展审美边界,而不是刻意迎合”。
    综上所述,2024年的数据与数据库技术依然处于剧变之中,未来充满不确定性,但创新的步伐从未停止。黄东旭的这些前瞻性预测或许很快会被时间推翻或验证,但只要它们能在当下引发思考与启示,便已足够有价值。

上一篇:提前至 7 月发布,消息称三星 Galaxy Z Fold6 手机更薄、更轻
下一篇:开年王炸?OpenAI视频生成模型Sora隆重登场!|思维品书
更多更酷的内容分享
猜你感兴趣
研究人员开发AI多模态搜索引擎系统,提升向量数据库存储能力

研究人员开发AI多模态搜索引擎系统,提升向量数据库存储能力

深度学习引领新潮流,对媒体、科研、AI等领域产生深远影响;统一音视频多模态模型的重要性凸显;当前已有AI应用井喷发展,“AI-native”成为热门词汇;基于多模态搜索系统的研究创新在计算机视觉领域取得突破。

热点资讯 06.23
「大模型卷」的价格和向量数据库的作用:你的疑问,我的解答

「大模型卷」的价格和向量数据库的作用:你的疑问,我的解答

度等方面的显著提升。 尽管AutoGPT宣布停止使用向量数据库,但大模型+向量数据库的应用仍在持续发展。在企业市场,它们表现出强大的商业价值,并吸引了许多公有云厂商的关注。向量数据库虽然短暂地获得了热度,但其在AI领域的地位并未动摇。从长远看,它们的持久性会越来越高。

热点资讯 05.23
AI驱动下的数据库修炼:双向赋能与挑战并存

AI驱动下的数据库修炼:双向赋能与挑战并存

这篇新闻的主要内容可以总结为: 1. OpenAI收购了数据库初创公司Rockset,这是AI技术在数据库领域的一次重大突破。 2. 数据库技术与人工智能的融合面临着众多挑战,包括海量数据高性能和大并发、大量数据库实例智能优化等。 3. 东方国信、 PingCAP、云和恩墨等企业通过技术创新和生态协同应对挑战,并抓住了这一机遇。 4. 云计算平台借助AI技术优化资源使用和性能评判,这不仅提升了服务效率,还提高了数据安全性。 5. 英特尔与数据库领域的合作伙伴一起推动数据库产业向智能化、高效化转型,满足客户的需求。 整个报道的重点主要在于OpenAI收购Rockset以及业界对此的关注以及SQL、AI、云计算、数据库管理等新技术的应用和发展。

热点资讯 07.01
大数据的就业趋势与前景分析:是否适合学习大数据技术?

大数据的就业趋势与前景分析:是否适合学习大数据技术?

大数据应用前景广阔,高薪专业受青睐。

热点资讯 04.21
梦幻西游:六千万梅花酒换三倍回报,挖掘地图春意盎然

梦幻西游:六千万梅花酒换三倍回报,挖掘地图春意盎然

最近一个兄弟逆袭成功,通过隐藏宝藏和打书得到珍贵装备,但也花掉大量资金。另一个兄弟遭遇新手陷阱,买到假冒商品并损失惨重。最后,主播马头头成功打造一只全红金绕僧,但还需继续努力追全红。喜欢的同学可以关注、分享和收藏。

热点资讯 11.10
比正派更帅气的阿拉戈四魔将:魔神坛斗士:比正派更强力的战斗力与独特魅力的阿拉戈四魔将

比正派更帅气的阿拉戈四魔将:魔神坛斗士:比正派更强力的战斗力与独特魅力的阿拉戈四魔将

魔神坛斗士是一部改编自原作《铠传》的日本漫画,因其强大的人物塑造和剧情吸引而备受瞩目。其中的鬼魔将阿拉戈四魔将实力强大,同时又具有强烈的复仇精神,特别是剧中饰演的那哑挫角色,智商高、战斗经验丰富,但形象却给人一种冷酷无情的感觉。另外,暗魔将恶奴弥守和幻魔将螺咒罗也各有特点,但在总体上,他们都展现了出色的战斗技巧和人格魅力。

热点资讯 11.10
Uzi陷入困境,MLXG出手相援,LPL传奇杯感动一幕引热议

Uzi陷入困境,MLXG出手相援,LPL传奇杯感动一幕引热议

Uzi参加传奇杯后陷入困境,老OMG上单Gogoing、中单无状态只剩两人,多名解说质疑传奇杯官方立场。最终, MLXG助力Uzi在关键时刻选中了西门夜说,Uzi粉丝大受鼓舞。

热点资讯 11.10
AG4-1KSG的五年辉煌,挑战总决赛的冠军可能

AG4-1KSG的五年辉煌,挑战总决赛的冠军可能

拿下了五场比赛的胜利,并且在第四场的比赛中以4-1击败了KSG,晋级到总决赛。这一战的胜利为AG超玩会带来了巨大的荣誉,并且也打破了KSG战队在KPL赛事中的无敌记录。尽管这个结果并不如预期,但AG超玩会展现出了他们的实力和毅力,证明了他们是今年最强的队伍之一。AG超玩会的胜利也让我们看到了KPL赛事的魅力和精彩。我们期待他们在未来的比赛中能够继续保持这样的高水平表现。

热点资讯 11.10
2024年全球各国新能源汽车渗透率分析:日美印度落后,我国提升至2.9%

2024年全球各国新能源汽车渗透率分析:日美印度落后,我国提升至2.9%

当前全球汽车市场呈现稳定增长态势,其中新能源汽车尤其引人关注。中国在2024年新能源汽车市场的表现异常抢眼,占全球市场份额近六成。欧洲和北美市场也在加大投入推广新能源汽车,但总体来看,中国仍占据主导地位。各国对新能源汽车的推动政策不断优化,有望进一步提高新能源汽车的普及率。

热点资讯 11.10
小鹏P7+引领行业革新:仅需4小时即达成31528台预定目标

小鹏P7+引领行业革新:仅需4小时即达成31528台预定目标

截至11月7日24点,小鹏P7+收获31528台大定订单。小鹏P7+有多成功呢?这个数据超过了小鹏过往所有的纪录,而之前被认为“爆款”的MONA M03,达到3万大定用了48小时。未来周末,随着到店看车、试驾的潜客增加,P7+的订单还有望迎来第二波增长高峰。虽然最终P7+给出的上市价格还未公布,但其成功已无需过多解读,因为其背后是对科技的追求和对品质的坚持。小鹏汽车通过全新SoC解析技术,提升了0.6km的续航里程,使得P7+具备极高的能耗表现。它的成功证明,即使面对激烈的市场竞争和价格战,也能保持产品的核心竞争力。

热点资讯 11.10
特朗普政府推动,中国汽车降价潮或将持续

特朗普政府推动,中国汽车降价潮或将持续

11月7日,特朗普总统赢得选举,他的上台对全球产业格局产生巨大影响,电动车是否受到欢迎备受关注。特斯拉CEO马斯克的胜利不仅推动了股价猛涨,也为特斯拉带来了新的发展机遇。然而,电动车在美国的发展仍面临诸多困难,如政策阻力、规模效应及海外市场不确定性等。特斯拉能否在未来成功,还需进一步观察。

热点资讯 11.10
第三季度加仓首选:险资抢滩那些热门股票

第三季度加仓首选:险资抢滩那些热门股票

今年来,保险资金举牌次数创五年新高,累计达12次,涉及700多家上市公司,总投资规模超过1.6万亿。同时,险资加大对私募股权投资基金的投资布局,包括中国人寿、新华保险、陕煤业、伊利股份等。这一现象反映出保险资金对长期资本市场的信心,并带来了投资收益的增长。未来,监管部门将继续推动保险业的高质量发展,包括扩大保险资金长期投资改革试点等。

热点资讯 11.10
红杉中国:郭山汕创立新投资机构,成功引领拼多多与极兔快递等领域重大项目

红杉中国:郭山汕创立新投资机构,成功引领拼多多与极兔快递等领域重大项目

郭山汕自2024年10月创办熵管理投资机构,涉足公开市场股权投资、基金投资和慈善活动,其中投资拼多多、中通快递、极兔速递、满帮集团、BOSS直聘、得物、货拉拉、达达-京东到家等公司。投资界曾报道,红杉中国合伙人郭山汕在2016年末参与拼多多投资时完成尽调,并由麦肯锡出身的他确认数据真实性,下注拼多多。

热点资讯 11.10
巨额投资下,泡泡玛特再次海外布局:泰国寻求疗伤之旅?

巨额投资下,泡泡玛特再次海外布局:泰国寻求疗伤之旅?

11月2日,泡泡玛特在菲律宾的首个快闪店开业,实现了在东南亚六国的线下门店全面覆盖。 2021年以来,泡泡玛特在新加坡开出东南亚首店,之后一直保持稳步增长。数据显示,2023年全年,海外市场营收同比增长134.9%。这意味着它已经成为推动海外业务的关键力量。 泡泡玛特重视线下实体店,与当地艺术家合作,打造有文化感的品牌,并且强调品牌文化对用户吸引力的重要性。

热点资讯 11.10