发布日期:2025-11-14 浏览量:
报告题目:原生分布式数据库研究进展综述
时间:2025年11月18日 14:00-16:00
地点:思源西楼405
主办单位:研究生工作部
承办单位:计算机科学与技术学院
主讲人介绍:徐泉清,北京大学计算机系博士毕业、正高级工程师、蚂蚁技术研究院数据库实验室研究员、OceanBase技术总监,目前从事OceanBase分布式数据库前沿技术研究工作,浙江省省级海外高层次人才、杭州市全球引才“521”计划高层次人才,研究领域包括分布式数据管理、云数据管理等。曾任新加坡科技研究局(A*STAR)科学家和新加坡理工大学兼职教师(Adjunct Faculty),被A*STAR评为研究生导师。先后在国际学术期刊和会议发表120多篇学术论文,提交、授权专利130多件,担任VLDB、ICDE等多个国际学术会议的程序委员会委员以及应邀成为多个国际知名学术期刊的审稿专家,并作为多个标准工作组成员参与相关国际、国家标准的开发与维护。徐博士是国际工程与技术学会会士(IET Fellow)、CCF杰出会员和数据库专委会执行委员、ACM高级会员和IEEE高级会员。
讲座内容介绍:原生分布式数据库在可扩展应用中扮演关键角色,兼具事务处理与分析能力,但需应对数据复杂性、网络延迟及复制难题。在CAP定理约束下,系统需通过创新方法解决维护、安全与升级挑战。近年来,一致性算法、网络技术、自动化和机器学习优化等进展为分布式数据库提供了新机遇。通过支持混合事务/分析处理(HTAP),此类数据库实现了性能与分布式环境复杂性的平衡,代表了数据管理的进化方向。本报告以OceanBase为例,展示了其在TPC-C和TPC-H基准测试中的卓越表现,验证了其作为顶级分布式数据库的能力,同时探讨OceanBase在单机AI数据库方面的实践。本报告还将探讨原生分布式数据库的潜在发展方向,包括:1)技术融合:结合云原生弹性与无服务器架构(Serverless),提升资源利用率与自动扩展能力;2)AI与数据库协同(AI4DB/DB4AI):利用机器学习优化查询执行与存储管理,同时为AI提供高效数据支持;3)多模型支持:整合键值、文档、图等多种数据模型,优化任务适配性与查询效率;4)向量数据库:针对高维数据相似性搜索的需求,提升分布式环境下的存储与检索性能,等等。