业界动态
【SQL学习+练习篇】基础训练,适用于初学者(一)
2024-12-20 22:37

【SQL学习+练习篇】基础训练,适用于初学者(一)

, 全称为Structured Query Language(结构化查询语言)。 要讲SQL就绕不开database(数据库), 平时所说的数据库,一般就是指的 . 

大家知道数据库是用来存储大量数据的一种软件,那么SQL呢是用来操作数据里的数据,具体来说SQL可以做数据查询,数据更新,写入数据等等。

这里的电影表Movies后续会一直用到

--电影表

IdTitleDirectorYearLength_minutes1Toy StoryJohn Lasseter1995812A Bug's LifeJohn Lasseter1998953Toy Story 2John Lasseter1999934Monsters, Inc.Pete Docter2001925Finding NemoFinding Nemo20031076The IncrediblesBrad Bird20041167CarsJohn Lasseter20061178RatatouilleBrad Bird20071159WALL-EAndrew Stanton200810410UpPete Docter200910111Toy Story 3Lee Unkrich201010312Cars 2John Lasseter201112013BraveBrenda Chapman201210214Monsters UniversityDan Scanlon2013110

 语句, 通常又称为 查询 queries), 正如其名,  可以用来从数据库中取出数据. 一条 SELECT 语句或者叫一个查询, 可以描述我们要从什么表取数据, 要取哪些数据,在返回之前怎么对结果做一些转化计算等等. 我们接下来会说明   的语法,看   是怎么来实现上述的取数据任务的。

你可以把一个表(Table)想象成一个类别的事物,比如 狗 (Dogs), 表里的每一行就是 一条狗,每一列代表了狗的一种属性,比如: 颜色,长度等等

现在有了这么一张表,最常见的一种查询就是取出表中的 一个或某几个属性列(注意:是所有数据的某几个属性列) 

Select 查询某些属性列(specific columns)的语法

查询的结果是一个二维的表格,由行(rows)和列(columns)组成, 看起来像是复制了一遍原有的表(Table),只不过列是我们选定的,而不是所有的列.

如果我们想取出所有列的数据, 当然可以把所有列名写上,不过更简单的方式用星号 () 来代表所有列.如下

Select 查询所有列

. 这条语句经常用来在不清楚table(表)中有什么数据时,能取出所有的数据瞜一眼。

  • 1.【简单查询】找到所有电影的名称
 
  • 2.【简单查询】找到所有电影的导演
 
  • 3.【简单查询】找到所有电影的名称和导演
 
  • 4.【简单查询】找到所有电影的名称和上映年份
 
  • 5.【简单查询】找到所有电影的所有信息
 
  • 6.【简单查询】找到所有电影的名称,Id和播放时长
 
 

我们已经学会了从数据表里取出 某几个列的SQL, 思考一下:如果数据表里有100万行数据?真实世界中确实存在,世界上肯定有100万条狗那么多. 如果数据量这么大 之前的SQL语句很可能运行时会崩溃(想象一下你一次性下载1T的电影

真实情况下,我们很少直接查所有行,即使查询出来也看不完。为了更精确的查询出特定数据,我们需要学习一个新的SQL语法:查询的  子句. 一个查询的 子句用来描述哪些行应该进入结果,具体就是通过 condition条件 限定这些行的属性满足某些具体条件。比如:WHERe 体重大于 10KG的狗。你可以把 想象成一个 筛子,每一个特定的筛子都可以筛下某些豆子。

条件查询语法


:这里的 condition 都是描述属性列的,具体会在下面的表格体现。

可以用  or  这两个关键字来组装多个条件(表示并且,或者) (ie. num_wheels >= 4 AND doors <= 2 这个组合表示 num_wheels属性 大于等于 4 并且 doors 属性小于等于 2). 下面的具体语法规则,可以用来筛选数字属性列(包括 整数,浮点数) :

Operator(关键字)Condition(意思)SQL Example(例子=, !=, < <=, >, >=Standard numerical operators 基础的 大于,等于等比较col_name != 4BETWEEN … AND …Number is within range of two values (inclusive) 在两个数之间col_name BETWEEN 1.5 AND 10.5NOT BETWEEN … AND …Number is not within range of two values (inclusive) 不在两个数之间col_name NOT BETWEEN 1 AND 10IN (…)Number exists in a list 在一个列表col_name IN (2, 4, 6)NOT IN (…)Number does not exist in a list 不在一个列表col_name NOT IN (1, 3, 5)


越是精确的条件筛选,会让结果更容易理解,同时因为条件在返回之前筛掉不必要的结果,SQL的运行速度也会快很多(想象一下你只是想看下最近有哪些大片上映,你没必要下载整个电影看一遍).

小贴士?

虽然之前我们的SQL 关键之如 , ,  都是大写的,但SQL其实是兼容写成 select,where小写的. 大写这些关键字有助于我们把 关键字 和 你的表名,列名区分开,让 SQL更容易理解。

  • 1.找到id为6的电影
 
  • 2.找到在2000-2010年间year上映的电影
 
  • 3.找到不是在2000-2010年间year上映的电影
 
  • 4.找到头5部电影
 
  • 5.找到2010(含)年之后的电影里片长小于两个小时的片子
 
  • 6. 找到99年和09年的电影,只要列出年份和片长
 
 

我们已经学会了 语句来筛选数字类型的属性,如果属性是字符串, 我们会用到字符串相关的一些操作符号,其中 LIKE(模糊查询) 和 %(通配符) 是新增的两个. 下面这个表格对字符串操作符有详细的描述:

Operator(操作符)Condition(解释)Example(例子=Case sensitive exact string comparison (notice the single equals)完全等于col_name "abc"!= or <>Case sensitive exact string inequality comparison 不等于col_name !"abcd"LIKECase insensitive exact string comparison 没有用通配符等价于 = col_name LIKE "ABC"NOT LIKECase insensitive exact string inequality comparison 没有用通配符等价于 != col_name NOT LIKE "ABCD"%Used anywhere in a string to match a sequence of zero or more characters (only with LIKE or NOT LIKE) 通配符,代表匹配0个以上的字符col_name LIKE "%AT%"
(matches "AT", "ATTIC", "CAT" or even "BATS") "%AT%" 代表AT 前后可以有任意字符_Used anywhere in a string to match a single character (only with LIKE or NOT LIKE) 和% 相似,代表1个字符col_name LIKE "AN_"
(matches "AND", but not "AN")IN (…)String exists in a list 在列表col_name IN ("A", "B", "C")NOT IN (…)String does not exist in a list 不在列表col_name NOT IN ("D", "E", "F")

小贴士?

在字符串表达式中的字符串需要用引号 " 包含,如果不用引号,SQL会认为是一个属性列的名字,如:col_name = color 表示 col_name和color两个属性一样的行 col_name = "color" 表示 col_name 属性为字符串 "color"的行.

字符串操作符

  • 找到所有Toy Story系列电影
 
  • 找到所有John Lasseter导演的电影
 
  • 找到所有不是John Lasseter导演的电影
 
  • 找到所有电影名为 "WALL_" 开头的电影
 
  • 找到98年电影中文名《虫虫危机
 
  • 找出所有Pete导演的电影,只要列出电影名,导演名和年份就可以
 
  • John Lasseter导演了两个系列,一个Car系列一个Toy Story系列,请帮我列出这John Lasseter导演两个系列千禧年之后(含千禧年)的电影
 
 

 语法介绍,我们拿之前的 Movies表来说,可能很多电影都是同一年Year发布的,如果你想要按年份排重,一年只能出现一部电影到结果中, 你可以用  关键字来指定某个或某些属性列唯一返回。写作

选取出唯一的结果的语法

因为  语法会直接删除重复的行, 我们还会学习  语句,  也会返回唯一的行,不过可以对具有相同的 属性值的行做一些统计计算,比如:求和.

在实际的数据表中,数据添加的时候不是完全顺序的,比如我们实际的Dog表,不会是按狗的身高从小到大去添加数据,当数据量成千上万之后,如果结果不做任何排序,结果会看起来很错乱.

为了解决结果排序问题, 我们可以用 排序的语法来让结果按一个或多个属性列做排序.

结果排序(ordered results

 这句话的意思就是让结果按照 col_name 列的具体值做 ASC升序 或 DESC 降序,对数字来说就是升序 1,2,3,... 或降序 ... 3,2,1 . 对于文本列,升序和降序指的是按文本的字母序。

 和  子句通常和 语句一起使用,当我们对整个结果集排序之后,我们可以 来指定只返回多少行结果 ,用 来指定从哪一行开始返回。你可以想象一下从一条长绳子剪下一小段的过程,我们通过  指定从哪里开始剪,用  指定剪下多少长度。

limited查询

 
 

你可以想象一下一个新闻网站的新闻条目数据,他们在页面上是按热度和时间排序的,每一个页面只显示10条数据,在所有这些属性都是不断变化的情况下。我们可以想见通过SQL的 句法,我们可以根据要求从数据库筛选出需要的新闻条目.

小贴士?

如果你对  和  在SQL中何时执行有疑问,可以说LIMIT和OFFSET一般在SQL的其他部分都执行完之后,再执行。

  • 按导演名排重列出所有电影(只显示导演),并按导演名正序排列
 
  • 列出按上映年份最新上线的4部电影
 
  • 按电影名字母序升序排列,列出前5部电影
 
  • 按电影名字母序升序排列,列出上一题之后的5部电影
 
  • 如果按片长排列,John Lasseter导演导过片长第3长的电影是哪部,列出名字即可
 
  • 按导演名字母升序,如果导演名相同按年份降序,取前10部电影
 
 

到目前为止,你已经学习基本的SQL查询语法了,是时候综合这些知识,来尝试下能否解决一些实际问题了.

服务SELECT查询语法

 
  
 

正如实际工作中,最大的变化不是SQL语法,而是实际数据的表结构和数据。在本节练习中,我们会放出一个新的表,简单介绍一下这个表,这个表存储了北美一些城市的人口信息和经纬度地理位置信息, 信息. 

小贴士?

在这个数据表中,你需要熟悉一下latitudes(纬度)和 longitudes(经度)的概念, latitudes在赤道以北是正数,以南是负数;longitudes在子午线东部是正数,以西是负数, 在查询中需要注意 经纬度和东西南北方向的对应关系。

Table(表): north_american_cities

CityCountryPopulationLatitudeLongitudeGuadalajaraMexico150080020.659699-103.349609TorontoCanada279506043.653226-79.383184HoustonUnited States219591429.760427-95.369803New YorkUnited States840583740.712784-74.005941PhiladelphiaUnited States155316539.952584-75.165222HavanaCuba210614623.05407-82.345189Mexico CityMexico855550019.432608-99.133208PhoenixUnited States151336733.448377-112.074037Los AngelesUnited States388430734.052234-118.243685Ecatepec de MorelosMexico174200019.601841-99.050674MontrealCanada171776745.501689-73.567256ChicagoUnited States271878241.878114-87.629798
  • 1.列出所有加拿大人的Canadian信息(包括所有字段)
 
  • 2.列出所有美国United States的城市按纬度从北到南排序(包括所有字段)
 
  • 3.列出所有在Chicago西部的城市,从西到东排序(包括所有字段)
 
  • 4.用人口数population排序,列出墨西哥Mexico最大的2个城市(包括所有字段)
 
  • 5.列出美国United States人口3-4位的两个城市和他们的人口(包括所有字段)
 
  • 6.北美所有城市,请按国家名字母序从A-Z再按人口从多到少排列看下前10位的城市(包括所有字段)
 
 

, 一般关系数据表中,都会有一个属性列设置为 。主键是唯一标识一条数据的,不会重复复(想象你的身份证号码)。一个最常见的主键就是auto-incrementing integer(自增ID,每写入一行数据ID+1, 当然字符串,hash值等只要是每条数据是唯一的也可以设为主键.

借助(当然其他唯一性的属性也可以,我们可以把两个表中具有相同 主键ID的数据连接起来(因为一个ID可以简要的识别一条数据,所以连接之后还是表达的同一条数据(你可以想象一个左右连线游戏)。具体我们用到  关键字。我们先来学习 .

用INNER JOIN 连接表的语法

 
 

通过条件描述的关联关系; 先将两个表数据连接到一起. 两个表中如果通过ID互相找不到的数据将会舍弃。此时,你可以将连表后的数据看作两个表的合并,SQL中的其他语句会在这个合并基础上 继续执行(想一下和之前的单表操作就一样了). 
还有一个理解的方式,就是把  想成两个集合的交集。

小贴士?

 可以简写做 . 两者是相同的意思,但我们还是会继续写作   以便和后面的 , 等相比较. 

Table: Boxoffice

Movie_idRatingDomestic_salesInternational_sales58.2380843261555900000147.426849276447506684388206445654417277164126.419145239636840000037.92458521792391630006826144109237000100098.5223808164297503696118.441500488064816703118.319179623317016250377.2244082982217900167108.329300416443833858048.128991625627290000027.2162798565200600000137.2237283207301700000
  • 1.找到所有电影的国内Domestic_sales和国际销售额
 
  • 2.找到所有国际销售额比国内销售大的电影
 
  • 3.找出所有电影按市场占有率rating倒序排列
 
  • 4.每部电影按国际销售额比较,排名最靠前的导演是谁,线上销量多少
 
 

 只会保留两个表都存在的数据(还记得之前的交集吗,这看起来意味着一些数据的丢失,在某些场景下会有问题.

真实世界中两个表存在差异很正常,所以我们需要更多的连表方式,也就是本节要介绍的左连接,右连接 和 全连接. 这几个 连接方式都会保留不能匹配的行。

用LEFT/RIGHT/FULL JOINs 做多表查询

 
 

和 语法几乎是一样的. 我们看看这三个连接方法的工作原理
在表A 连接 B, 保留A的所有行,不管有没有能匹配上B 反过来 则保留所有B里的行。最后 不管有没有匹配上,同时保留A和B里的所有行

我们还是可以用集合的图示来描述
 

 
 反过来 

 
 

 

将两个表数据1-1连接,保留A或B的原有行,如果某一行在另一个表不存在,会用 NULL来填充结果数据。所有在用这三个JOIN时,你需要单独处理 . 关于  下一节会做更详细的说明

小贴士?

这些Join也可以写作 , , 或 , 和 , , and  等价.

Table: Employees

RoleNameBuildingYears_employedEngineerBecky A.1e4EngineerDan B.1e2EngineerSharon F.1e6EngineerDan M.1e4EngineerMalcom S.1e1ArtistTylar S.2w2ArtistSherman D.2w8ArtistJakob J.2w6ArtistLillia A.2w7ArtistBrandon J.2w7ManagerScott K.1e9ManagerShirlee M.1e3ManagerDaria O.2w6EngineerYancy I.null0ArtistOliver P.null0

Table: Buildings

  • 1.找到所有有雇员的办公室(buildings)名字
 

或者

 
  • 3.找到所有办公室里的所有角色(包含没有雇员的),并做唯一输出(DISTINCT)
 
  • 4.找到所有有雇员的办公室(buildings)和对应的容量
    以上就是本篇文章【【SQL学习+练习篇】基础训练,适用于初学者(一)】的全部内容了,欢迎阅览 ! 文章地址:http://fabua.ksxb.net/news/4586.html 
     文章      相关文章      动态      同类文章      热门文章      栏目首页      网站地图      返回首页 海之东岸资讯移动站 http://fabua.ksxb.net/mobile/ , 查看更多   
最新文章
《实战十一人》12月20日内测开启
t2627_2_2627_1:4.0t1-t0:45.0t2-t1:4.0t3-t2:0.0t4-t3:2.0t5-t4:32.0t6-t5:14.0t7-t6:3.0t8-t7:0.0t9-t8:15.0t10-t9:0.0t11-t10
“报关骗局”阿里云客服《APP》软件无法提现是骗局吗,不正规能追回吗?
〖→被骗请点击进入帮助平台提现追款〗〖→被骗请点击进入帮助平台提现追款〗希望阅读此文的读者能够及时采取措施以减少损失;请
微信公众号点击菜单拉取消息事件推送如何操作?
2、注册成功后,通过用户名和密码登录微号帮平台,立即登录6、粉丝点菜单定时推送:推送信息设置7、推送信息设置:自定义弹出信
p站加速器哪个好?手把手教你怎么进P站?
老司机说的P站是什么?网上很多人都在说P站,而还有不少小白们不懂P站是什么意思,在网上也搜不到答案。其实,P站是有两层意思的
&quot;码海拾贝-趣探1688:免费源码的狂欢&quot;
一瞥眼,成品网站源码1688免费推荐,嘿,这话题不就跟那菜市场里挑挑拣拣的大妈一样,热热闹闹,沸反盈天?今儿个,科技圈里这档
哪些平台最适合进行广告推广?
在当今数字化时代,推广广告已成为企业营销战略的重要组成部分,选择合适的平台进行广告投放对于提高品牌知名度、吸引潜在客户以
东莞外贸建站推广,东莞外贸网站推广,东莞谷歌SEO优化
  在当今全球化的市场环境下,外贸企业越来越依赖于互联网来拓展业务和提高度。为了在激烈的竞争中脱颖而出,提高外贸网站在搜
maya快捷键大全
MAYA快捷键大全免费领取q群:289728818“独学而无友,则孤陋而寡闻!欢迎广大站友进群交流学习Enter 完成当前操作  ~ 终止当前操
外贸网站建设广告/百度下载电脑版
我开始使用 sklearn.naive_bayes.GaussianNB 进行文本分类,并且获得了很好的初始结果 . 我想使用分类器返回的概率作为置
优化博客seo的建议(优化博客seo的建议有哪些)
大家好,今天小编关注到一个比较有意思的话题,就是关于优化博客seo的建议的问题,于是小编就整理了7个相关介绍优化博客seo的建