Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

大模型时代究竟需要怎样的 AI 数据库?

AI 时代,需要怎样的数据库?10月23日,独立数据库厂商OceanBase在2024年度发布会上推出OceanBase 4.3.3GA版本,升级向量检索与索引功能,实现SQL+AI一体化。该版本深度融合AI与数据库处理能力,支持多模态数据的融合查询,帮助企业简化AI技术栈,提升AI应用构建效率。

CEO杨冰表示,OceanBase持续践行一体化产品战略,为AI时代打造易用、好用的数据底座。

杨冰:一体化数据库是AI时代的数据底座

随着AI技术发展,越来越多的AI应用不再局限于纯文本来生成回答,涉及的数据类型日益复杂,并且常存储于IT架构的不同数据库中,这对数据库提出了新的要求,包括提升性能与响应速度,要求数据库处理和存储不同类型的数据,并支持结构化、半结构化及非结构化数据的复杂融合查询。

杨冰认为,伴随着互联网/移动互联网时代向AI时代演进,数据库也正从分散走向统一,一体化数据库将成为AI时代的数据底座。如何通过一个统一的数据库来处理所有类型的数据,并通过向量融合查询能力,让小团队也可以快速构建AI应用,是OceanBase一体化产品战略在AI时代的核心思考。

会上,杨冰演示了一个叫“望小京”的AI Agent Demo,请“望小京”推荐两公里内、评分4.5以上、人均消费25元以内干净卫生的奶茶店。他介绍,这一Demo以OceanBase为数据底座,管理和处理结构化、半结构化以及非结构化数据,完成空间查询、关系过滤、向量计算等工作,为AI实时查询提供支持。

“以往构建一个复杂的AI应用,需要依赖多个不同的数据库、管理非常复杂的技术栈,同时还需要一个经验丰富且规模较大的团队。”他介绍,正是因为OceanBase具备一体化能力,才得以通过一个数据库高效处理所有查询、并通过极简架构就可以完成数据管理和AI应用开发。以OceanBase为底座的“望小京”仅依靠几位工程师、用一周时间就开发完成。

未来,OceanBase将成为蚂蚁集团的AI数据新底座,支持AI生活管家“支小宝”、AI金融管家“蚂小财”、AI健康管家三大AI应用,及支付宝百宝箱智能体开发平台的数据管理。

OceanBase 4.3.3发布,增加向量能力

面对AI时代提出的全新挑战,OceanBase持续推进技术升级。在发布会上,OceanBase推出4.3.3版本,这也是其面向实时AP场景的首个GA版本。

OceanBase CTO杨传辉介绍,OceanBase 4.3.3在向量融合查询的关键能力上取得了显著突破,推出全新的向量检索功能,实现SQL+AI一体化,深度融合AI与数据库处理。

具体而言,在对多模态数据的支持层面,4.3.3进一步扩展了对复杂数据类型的处理能力,新增Array类型,并对Roaringbitmap类型数据的计算性能进行了优化,为企业处理多样化数据结构提供更高的灵活性。

在向量融合查询能力上,4.3.3新增向量检索能力,支持向量数据类型和向量索引,并基于向量索引提供强大的搜索能力。用户可通过SQL及Python SDK等方式灵活调用OceanBase的向量检索能力,同时结合对海量数据的分布式存储能力、多模数据类型及多类型索引的支持,极大简化AI应用的技术栈,助力企业高效构建AI应用。

在多工作负载方面,OceanBase 4.3.3对AP(分析处理)场景进行大幅性能优化,尤其是在海量数据分析时,能够提供更短的响应时间和更高的吞吐能力。同时,4.3.3引入了列存副本的新形态,实现满足 TP 和 AP 负载的物理资源强隔离。该物理隔离机制可确保系统在处理事务型负载时,不受分析型负载的影响,特别是在实时数据分析和决策场景中,能够保持系统的高性能与稳定性。

发布会上,OceanBase与蚂蚁集团联合开发的向量库在业内标准的ANN Benchmarks基准测试中,针对GIST-960数据集表现出色。测试结果显示,该向量库在ANN Benmarks测试中性能远超其他算法,排名第一。特别是在 90% 以上的召回率区间,查询性能(QPS)相比此前最优算法 glass 提升 100%,相比基线算法 hnswlib 提升 300%。

杨传辉还强调,AI天然拥抱云,OceanBase作为一体化数据库,不仅具备云上云下一体化能力,同时具备多云原生开放架构,这些优势都能有效地帮助客户实现云与AI结合,满足客户在云+AI时代的数据管理需求。

产业
暂无评论
暂无评论~