MySQL关联查询

在实际应用中，经常需要在一个查询语句中显示多张表的数据，这种多表数据记录连接查询，简称连接查询。关系数据操作连接操作是关系数据操作中专门用于数据库操作的关系运算。这里将先详细介绍关系数据操作中传统的三种运算：并（UNION）笛卡尔积（CARTESIAN PRODUCT）连接（JOIN）其中连接（JOIN）是专门针对数据库操作的运算。

Dobbin Soong

10423人浏览 · 2016-02-02 17:45:39

Dobbin Soong · 2016-02-02 17:45:39 发布

在实际应用中，经常需要在一个查询语句中显示多张表的数据，这种多表数据记录关联查询，简称关联查询。

关系数据操作

连接操作是关系数据操作中专门用于数据库操作的关系运算。这里将先详细介绍关系数据操作中传统的三种运算：

并（UNION）
笛卡尔积（CARTESIAN PRODUCT）
连接（JOIN）

其中连接（JOIN）是专门针对数据库操作的运算。

并（UNION）

“并”操作就是把具有相同字段数目和字段类型的表合并到一起。比如存在两张用户表，其数据分别如下图所示：
连接查询

将这两种用户表进行并操作后的数据如下：
连接查询
可以发现并操作去掉了重复记录。

笛卡尔积（CARTESIAN PRODUCT）

笛卡尔积就是没有连接条件表关系返回的结果。笛卡尔积新关系的字段数为各个表字段数目的和，记录数为各个表记录的积。如下图所示：
连接查询

连接（JOIN）

为了便于用户的操作，专门提供了一种针对数据库操作的运算——连接（JOIN）。所谓连接就是在表关系的笛卡尔积数据记录中，按照相应字段值的比较条件进行选择生成一个新的关系。连接又分为三种：

内连接（INNER JOIN）
外连接（OUTER JOIN）
交叉连接（CROSS JOIN）

内连接（INNER JOIN）

就是在表关系的笛卡尔积数据记录中，保留表关系中所有匹配的数据记录，舍弃不匹配的数据记录。按照匹配的条件可以分成三种：

自然连接（NATURAL JOIN）
等值连接
不等连接

这里将通过表示员工的表（t_employee）和表示部门的表（t_dept）来讲解各种内连接。这两张表的数据记录分别如下图所示：
连接查询

自然连接操作就是表关系的笛卡尔积中，首先根据表关系中相同名称的字段自动进行记录匹配，然后去掉重复的字段。其笛卡尔积结果如下图：
连接查询
根据相同名称字段值进行匹配后得到上图中用红色方框标记出来的数据行。再除去重复字段后得到的结果如下：

等值连接就是表关系的笛卡尔积中，选择所匹配字段值相等的记录，与自然连接相比保留重复字段，所以上面两个表等值连接后的数据如下图：
连接查询

不等连接就是表关系的笛卡尔积中所匹配字段不相等的数据记录，与等值连接的结果集互补，结果如下图：
连接查询

外连接（OUTER JOIN）

外连接就是在表关系的笛卡尔积中，不仅保留表关系中所有匹配的数据记录，而且还会保留部分不匹配的数据记录。按照保留不匹配条件数据记录来源可以分为以下三种：

左外连接（LEFT OUTER JOIN）
右外连接（RIGHT OUTER JOIN）
全外连接（FULL OUTER JOIN）

这里将通过表示部门的表（t_dept）和表示员工的表（t_employee）来讲解各种外连接。这两张表的数据记录分别如下图所示：
连接查询

左外连接就是表关系的笛卡尔积中，除了选择相匹配的数据记录，还包含关联左边表中不匹配的数据记录。上面两个表的笛卡尔积的结果如下：
连接查询
选择相匹配的数据记录，即上图中红色方框中的数据行。再关联左边表中不匹配的数据记录，即上图中红色细圈中的数据，去掉重复值。得出左外连接的结果如下：

右外连接就是表关系的笛卡尔积中，除了选择相匹配的数据记录，还包含关联右边表中不匹配的数据记录。用上面的t_employee表右连接t_dept表，结果如下：
连接查询

全外连接就是表关系的笛卡尔积中，除了选择相匹配的数据记录，还包含关联左右两边表中不匹配的数据记录。

内连接查询

在MySQL中可以通过两种方式来实现连接查询，早期的语法形式如下：

SELECT [field1, field2, ... ]
FROM [table1, table2, ...]
WHERE [condition1 AND|OR condition2 ...]

FIELD表示要查询的字段，在FROM子句中用逗号（,）区分多个表，在WHERE子句中通过逻辑表达式来实现匹配条件。

另一种是ANSI连接语法形式，其语法形式如下：

SELECT [field1, field2, ... ]
FROM table1 INNER JOIN table2 [INNER JOIN table3]
ON [join condition]

在FROM子句中使用“join … on …”关键字，连接条件写在关键字ON子句中。MySQL推荐使用该语法形式的连接。

按照匹配情况，内连接查询可以分为 等值连接 和 不等连接 两种，其中等值连接中存在一种特殊的情况叫自连接，这里将讲到这三种连接。

这一节也将用到表t_dept和表t_employee进行讲解，不过与上面相比对表t_employee增加了表示上级编号的字段superior_no，两个表的数据如下：
连接查询

自连接

自连接就是指表与其自身进行连接，下面将通过具体的实例来说明。

【实例6-1】查询员工的姓名和领导姓名。
分析可知员工姓名和领导姓名都是表t_employee的emp_name字段，而领导关系表现在表中的emp_no和superior_no字段的对应关系。因为员工姓名和领导姓名都在同一张表中，因此需要将表进行自连接。具体SQL语句如下：

SELECT e.emp_name employeename ,s.emp_name superiorname 
FROM t_employee e INNER JOIN t_employee s 
ON e.superior_no = s.emp_no;

通过“SELECT FROM WHERE”关键字也可以实现，具体SQL语句如下：

SELECT e.emp_name employeename, s.emp_name superiorname
FROM t_employee e, t_employee s
WHERE e.superior_no = s.emp_no;

在MySQL中，提供了一种机制来为表取别名，将别名放在字段名或表名之后即可。其查询结果如下：
连接查询
比较t_employee表数据可知上级编号为NULL的数据行并不在结果集中。

等值连接

内连接查询中的等值连接，就是在关键字ON后面的匹配条件中通过关系运算符（=）来实现等值条件。

【实例6-2】查询所有员工的编号、姓名和部门名称。
分析可知员工编号和姓名在t_employee表中，部门名称在t_dept表中，并通过两个表中的dept_no字段进行关联。具体SQL语句如下：

SELECT emp_no, emp_name, dept_name
FROM t_employee e INNER JOIN t_dept d
ON e.dept_no = d.dept_no;

通过“SELECT FROM WHERE”关键字实现的SQL语句如下：

SELECT emp_no, emp_name, dept_name 
FROM t_employee e, t_dept d 
WHERE e.dept_no = d.dept_no;

上面例子是2个表的连接，下面通过一个实例来说明多表（3张表）等值连接。

【实例6-3】查询有上级的员工的编号、姓名、部门名称、上级姓名。
分析可知员工编号和姓名在t_employee表，上级姓名需要自连接t_employee表，部门名称在t_dept表中，涉及到3张表。具体SQL语句如下：

SELECT e.emp_no, e.emp_name, dept_name, s.emp_name leadername 
FROM t_employee e INNER JOIN t_dept d ON e.dept_no = d.dept_no 
INNER JOIN t_employee s ON e.superior_no = s.emp_no;

通过“SELECT FROM WHERE”关键字实现的SQL语句如下：

SELECT e.emp_no, e.emp_name, dept_name, s.emp_name leadername 
FROM t_employee e, t_dept d, t_employee s 
WHERE e.dept_no = d.dept_no AND e.superior_no = s.emp_no;

查询结果如下：
连接查询

不等连接

内连接查询中的不等连接，就是在关键字ON后的匹配条件中除了可以有等于关系运算符来实现的条件外，还包含“>”，“>=”，“<”，“<=”，“!=”等运算符号，语法形式与等值连接相同，只是条件不同而已，这里不再举例说明。

外连接查询

在MySQL中，外连接查询会返回操作表中至少一个表的所有数据记录，通过SQL语句“OUTER JOIN … ON … ”来实现。其语法形式如下：

SELECT [field1, field2, ... ]
FROM table1 LEFT|RIGHT|FULL [OUTER] JOIN table2
ON [join condition]

外连接查询分为如下三类：

左外连接
右外连接
全外连接

左外连接

上面有说道外连接查询会返回操作表中至少一个表的所有数据记录，左外连接就是指新关系中执行匹配条件时，以关键字LEFT [OUTER] JOIN左边的表为参考表。这里用表t_employee和表t_dept进行说明，表的数据如下：

【实例6-4】查询所有员工的编号、姓名和领导姓名。
分析可知该查询仍然是t_employee表的自连接，但从数据中可以看出james位于公司最高级别，如果按照【实例6-2-2-1】中的内连接来查询，结果中是没有该数据信息的，所以这里要用到左外连接，其SQL语句如下：

SELECT e.emp_no, e.emp_name, s.emp_name AS superiorname
FROM t_employee e LEFT OUTER JOIN t_employee s 
ON e.superior_no = s.emp_no

其结果如下：
连接查询
可见左外连接把JOIN关键字左边的表数据全部显示出来了，没有匹配的数据则用NULL填充。

右外连接

右外连接就是指新关系中执行匹配条件时，以关键字RIGHT [OUTER] JOIN关键字右边的表为参考表。

【实例6-5】查询所有员工的编号、姓名和部门名称。
分析可知该查询需要关联表t_employee和表t_dept，其SQL语句如下：

SELECT e.emp_no, e.emp_name, d.dept_name
FROM t_employee e RIGHT OUTER JOIN t_dept d
ON e.dept_no = d.dept_no

由于t_dept表中部门编号为50的部门是没有员工的，所以右外连接操作下该部门的记录仍显示，左边数据用NULL填充，其结果如下：
连接查询

合并查询数据记录

MySQL中通过关键字UNION来实现并操作，可将多个SELECT语句的查询结果合并在一起组成新的关系。其语法形式如下：

SELECT field1, field2, ... fieldn FROM table1
UNION | UNION ALL
SELECT field1, field2, ... fieldn FROM table2
...

这里通过两张消息表t_msg_2015和t_msg_2016对并操作进行说明，这两张表的数据如下图所示：
连接查询

这两种表的字段数目和字段类型都相同，对两种表的结果集进行并操作，SQL语句如下：

SELECT * FROM t_msg_2015 
UNION 
SELECT * FROM t_msg_2016;

执行结果如下：
连接查询

结果集中把相同的记录给合并了，如果不想合并可用关键字UNION ALL，SQL语句如下：

SELECT * FROM t_msg_2015 
UNION ALL
SELECT * FROM t_msg_2016;

执行结果如下：
连接查询

子查询

在MySQL中虽然可以通过连接查询实现多表数据查询，但是却不建议使用。因为连接查询的性能较差，因此出现了子查询来替代连接查询。

在“6.1关系数据库操作”章节有讲到，关联查询的SQL语句在执行过程中，首先会对表进行笛卡尔积操作，然后再选取符合匹配条件的数据记录。如果关联查询中的表的数据记录很大，则在笛卡尔积操作时会产生大量的内存消耗，导致性能下降。

所谓子查询，就是指在一个查询之中嵌套了其它的若干查询，即在一个SELECT查询语句的WHERE或FROM子句中包含一个SELECT查询语句。这些嵌套着的查询语句称之为子查询语句。WHERE子句中的子查询一般返回单行单列、多行单列、单行多列数据记录，而FROM子句中的子查询一般返回多行多列数据记录，可以当做一张临时表。由此可根据子查询的返回结果将其分为以下四种：

单行单列子查询
多行单列子查询
单行多列子查询
多行多列子查询

单行单列子查询

这里同样以表t_employee和表t_dept来做说明，其数据如下：
连接查询

【实例6-6】查询出工资比tom高的员工的编号、姓名和工资。
分析可知这里要先查出员工tom的工资，然后通过该值来查询工资比tom高的员工的信息，其SQL语句如下：

SELECT emp_no, emp_name, sal
FROM t_employee
WHERE sal > (
    SELECT sal FROM t_employee WHERE emp_name = 'tom'
);

其查询结果如下：
连接查询

单行多列子查询

WHERE子句中的子查询还可以返回单行多列的数据记录，不过这种子查询很少见。

【实例6-7】查询出工资、部门编号都与jay相同的员工信息。
分析可知先要查出tom的工资和部门编号，然后根据这两个值来查询，其SQL语句如下：

SELECT *
FROM t_employee
WHERE (sal, dept_no) = (
    SELECT sal, dept_no FROM t_employee WHERE emp_name = 'tom'
);

查询结果如下：
连接查询

多行单列子查询

该子查询语句一般会在主查询语句的WHERE子句里，通常会包含IN、ANY、ALL、EXISTS等关键字。

1.带有关键字IN的子查询

关键字IN表示查询条件为某个字段在某个结果集内。
【实例6-8】查询出有员工的部门编号和部门名称。
分析可知先要从t_employee表中查询出所有出现了的部门编号集合，再从部门表t_dept中查询处于这个集合中的部门信息，其SQL语句如下：

SELECT dept_no, dept_name 
FROM t_dept 
WHERE dept_no IN (
SELECT DISTINCT dept_no 
FROM t_employee
);

关键字DISTINCT表示去掉重复记录，其查询结果如下：
连接查询

2.带有关键字ANY的子查询

关键字ANY用来表示主查询的条件为满足子查询返回查询结果中的任意一条数据记录，该关键字有三种匹配方式，分别如下。

=ANY：功能与关键字IN相同；
>ANY（>=ANY）：比子查询结果中最小的还要大（大于等于）的数据记录；
<ANY（<=ANY）：比子查询结果中最大的还要小（小于等于）的数据记录；

【实例6-9】查询员工编号、姓名和工资，这些员工的工资不低于部门编号为20的员工的工资。
分析可知先要查询出部门编号为20的员工工资集合，然后查出工资大于等于集合中最小值的员工信息，其SQL如下：

SELECT emp_no, emp_name, sal
FROM t_employee 
WHERE sal >= ANY (
    SELECT sal
    FROM t_employee
    WHERE dept_no = 20
);

查询结果如下：
连接查询

3.带有关键字ALL的子查询

关键字ALL用来表示主查询的条件为满足子查询返回查询结果中所有数据记录，该关键字有一下两种匹配方式：

>ALL（>=ALL）：比子查询结果中最大的还要大（大于等于）的数据记录；
<ALL（<=ALL）：比子查询结果中最大的还要小（小于等于）的数据记录；

【实例6-10】查询员工编号、姓名和工资，这些员工的工资高于部门编号为20的任何一位员工的工资。
同样，先查询出部门编号为20的员工工资集合，然后查出工资大于集合中最大值的员工信息，其SQL如下：

SELECT emp_no, emp_name, sal
FROM t_employee 
WHERE sal > ALL (
    SELECT sal
    FROM t_employee
    WHERE dept_no = 20
);

查询结果如下：
连接查询

4.带有关键字EXISTS的子查询

关键字EXISTS是一个布尔类型，当子查询返回结果集时为TRUE，否则返回FALSE。查询时EXISTS对主查询中的表逐条查询，每次查询都会比较EXISTS的条件语句，当EXISTS条件语句返回TRUE时则返回主查询当前遍历到的记录，反之不返回。

【实例6-11】查询部门下有员工的部门编号和部门名称。
SQL语句如下。执行时遍历t_dept表中的每条记录，并判断EXISTS子查询中是否有返回结果。

SELECT * 
FROM t_dept d
WHERE EXISTS (
    SELECT * 
    FROM t_employee e
    WHERE e.dept_no = d.dept_no
);

查询结果如下：
连接查询

多行多列子查询

该类子查询一般会在主查询语句的FROM子句里，被当做一张临时表的方式来处理。

【实例6-12】查询员工表t_employee中各个部门的编号、名称、员工人数和平均工资。
分析可知先在t_employee表中查询出各个部门的编号、员工人数和平均工资，其SQL语句如下：

SELECT dept_no, COUNT(emp_no) emp_sum, AVG(sal) average_sal
FROM t_employee
GROUP BY dept_no

结果如下：
连接查询

再将该结果集看做一张临时表与部门信息表t_dept进行关联查询，其最终SQL语句如下：

SELECT d.dept_name, e.dept_no, e.emp_sum, e.average_sal 
FROM t_dept d INNER JOIN (
    SELECT dept_no, COUNT(emp_no) emp_sum, AVG(sal) average_sal
    FROM t_employee
    GROUP BY dept_no
) e
ON d.dept_no = e.dept_no

查询结果如下：
连接查询

一门面向 Data 和 AI 的低代码、云原生的开源编程语言

无需安装部署，在线快速体验 Byzer

更多推荐

编译时权限控制

前言权限控制，对于 MLSQL 而言的重要程度可以说是生命线。 MLSQL 需要面对各式各样的资源访问，比如 MySQL, Oracle,HDFS，Hive，Kafka，Sorl，ElasticSearch，Redis，API，Web等等，不同用户对这些数据源（以及表，列）的权限是不一样的。传统模式是，每个用户都需要有个 proxy user，然后到每个数据源里面给这个 proxy user

Byzer 白泽

Byzer 支持 JDBC 聚合下推

聚合下推PR链接聚合下推我们知道 Byzer 支持多数据源和联邦查询，可以方便分析师在一个平台上快速的分析来自多种数据源的数据，从而进行灵活的探索式分析。使用场景和优势当前 Byzer 中加载数据的方式会拉取明细数据到 spark 中进行聚合计算，对于小数据量或者在分布式文件系统上的数据源来说是常规操作。但是对于 JDBC 数据源或者有分析能力的 OLAP 系统来说拉取明细数据可能就不是最

Byzer 白泽

Byzer 术语表

Byzer-lang Byzer ，又称为 Byzer-lang，一门面向 Data 和 AI 的低代码、云原生的开源编程语言。 Byzer 是一门结合了声明式编程和命令式编程的混合编程语言，其低代码且类 SQL 的编程逻辑配合内置算法及插件的加持，能帮助数据工作者们高效打通数据链路，完成数据的清洗转换，并快速地进行机器学习相关的训练及预测。 Byzer 希望能够提供一套语言、一个引擎，就能覆盖整