1.SQL抽象语法树及改写场景应用
2.Cobar源码分析之AST
SQL抽象语法树及改写场景应用
我们日常编写SQL语句,源码提交后获取结果集。源码例如,源码"select * from t_user where user_id > ;",源码目标是源码从t_user表中筛选出user_id大于的所有记录。这条SQL经历了什么才能生成结果集呢?
不同数据库如MySQL、源码祥启科技源码网Oracle、源码TiDB、源码CK,源码乃至大数据计算引擎Hive、源码HBase、源码Spark,源码通过SQL引擎实现接受SQL并返回结果的源码功能。SQL引擎的源码核心执行逻辑大致为:词法分析、语法分析、源码查询优化、帧率检测源码下载生成逻辑计划、物理计划,最后执行。
词法分析和语法分析引出了抽象语法树(AST)的概念。AST是对源代码语法结构的抽象表示,以树状形式展现,每个节点代表源码中的一种结构。SQL提交给SQL引擎后,首先经过词法分析,然后利用语法解析器生成AST。
以"select username,ismale from userInfo where age> and level>5 and 1=1"为例,抽象语法树简单理解为逻辑执行计划,经过查询优化器优化,得到逻辑计划树,实现谓词下推、单词搜索游戏源码剪枝等操作。逻辑计划进一步转换为物理计划,如数据扫描、聚合,最后执行。
ANTLR4工具广泛应用于解析SQL,通过构建G4文件描述语法,实现SQL拆解、封装和内容提取。在Java中,利用ANTLR4解析SQL,获取AST并提取表名。AST解析过程复杂,但通过简单字符串解析理解ANTLR4逻辑,有助于深入理解SQL解析。交易担保论坛源码
在工业应用中,利用ANTLR4生成并解析AST,虽然提供了基础解析能力,但更深入处理通常需要进一步自定义操作。在Java生态中,Apache Sharding Sphere、Mycat等流行SQL解析工具实现了这一需求。
获取AST后,可以实现SQL的改写。改写SQL通常涉及添加占位符、正则匹配关键字,这些方法存在局限性和安全风险。基于AST的改写更安全,通过遍历树结构,调整目标节点,智能水务系统源码实现语法符合的改写。
利用Druid的SQL解析模块,通过SQLUtils类实现SQL改写,包括新增改写和查询改写。改写过程涉及识别SQL语法结构,如join、sub-query等。
在数据库数据隔离上,实现动态SQL改写,开发人员无需感知,通过在数据表上增加字段和环境标识,CRUD SQL自动增加标识字段(如flag='预发'、flag='生产'),操作数据仅限于当前应用环境。
Cobar源码分析之AST
Cobar是一款阿里开源的数据库中间件,专注于分库分表的路由功能。SQL,作为一种领域语言,广泛用于关系型数据库的管理和操作,其执行流程一般包括词法分析、语法分析、语义分析生成AST(抽象语法树),然后由优化器生成执行计划,最后由执行引擎执行。
在Cobar中,SQL Parser负责将SQL语句解析为AST。开发SQL Parser通常有两种方式。Cobar的SQL Parser经历了三个版本迭代,主要目的是提升性能。本文将深入解析Cobar中的SQL Parser和AST,包括其结构、操作和应用。
AST(抽象语法树)直观表示SQL语句的结构。以SQL语句“select id,type from goods as g where type in (select type from type_config where status = 0)”为例,Cobar SQL Parser将其解析为AST对象,其根节点为select语句,其他属性为叶子节点。
AST的Node定义包括accept方法,用于遍历树结构。实现AST主要涉及几个类,如ComparisionEqualsExpression,其中1为比较的左右表达式,2为判断符,3为计算表达式。evaluationInternal方法实现比较逻辑,将表达式结构化并穷举后,实现简单的数值比较。
AST操作中,遍历是最基本的,利用ASTNode的accept方法和SQLASTVisitor接口实现。SQLParserDelegate.parse(sql)解析结果为DMLSelectStatement对象,其visit方法负责构建SQL输出格式。MySQLOutputASTVisitor实现遍历并输出SQL语句,如“SELECT id, type FROM goods AS G WHERE type IN (SELECT type FROM type_config WHERE status = 0)”。Cobar利用AST进行分库分表,获取表名、列名、比较的值。
AST还可以生成SQL特征,如将原始SQL归一化为“select id, name, age from user as u where age >= ?”,在进行SQL慢查询统计、限流等操作时非常有用。Cobar利用AST对线上SQL进行安全检查,拦截无条件的update或delete语句。
本文从SQL AST的来源、结构、遍历原理、应用等方面进行介绍,通过Cobar项目中的单元测试,读者可以实际感受AST的功能和应用。了解SQL AST有助于后端技术、架构设计、性能优化、源码阅读、问题排查等领域。
欢迎搜索关注微信公众号"捉虫大师",获取更多后端技术分享,包括架构设计、性能优化、源码阅读、问题排查和踩坑实践等内容。