才意识到 sql 执行也会很浪费时间,以前做什么缓存、中间件节省的时间,还不如改一个 sql 语句效率明显 。
哪里找一些大量模拟数据来练习 SQL ,亿? 十亿? 数据少了跑 sql 语句效果不够明显。
或者有什么数据库用法可以观察到 sql 的执行效率
1
Itoktsnhc 2021-12-24 17:45:42 +08:00 1
执行计划
|
2
zhensjoke 2021-12-24 18:17:50 +08:00
社工库
|
3
LING97 2021-12-24 19:01:47 +08:00
啥数据库呢? Sql 效率无非就是索引吧,分析下走没走索引就行了,数据量少一样能学。如果数据量上十亿,还有查询需求的话,我们一般上搜索引擎,或者分表,或者离线表定时查。不头铁就行😂
|
4
milk97 2021-12-24 19:26:38 +08:00 via iPhone 8
https://dev.mysql.com/doc/employee/en/employees-introduction.html
400 万数据,用来分析 SQL 执行效率配合 explain 应该是够了的 |
6
gavindexu 2021-12-25 09:32:23 +08:00 via iPhone
官网上装的 好像已经带了一些数据。sakila
|
7
noparking188 2021-12-25 11:50:57 +08:00
插一句,合理的 Schema 设计也很重要,优化半天 SQL 不如对表稍作修改
|
8
huaouo 2021-12-25 21:39:22 +08:00
|
9
billly 2021-12-26 00:02:12 +08:00
之前看 clickhouse 的时候,官网上有个几十 G 的数据集
|
10
hooopo 2021-12-26 09:08:11 +08:00
想搞一个
|
11
fly0512 2021-12-26 22:05:37 +08:00
tpc 了解一下,可以自己按需生成模拟数据。
http://tpc.org/ |
12
silencefly 2021-12-26 23:09:10 +08:00
@billly 搜了下 这个文件有 75G github-events https://clickhouse.com/docs/en/getting-started/example-datasets/github-events/
|
13
Joker123456789 2021-12-27 12:47:23 +08:00
数据自己插啊,循环 + insert 你总会写的吧?
执行效率 可以看执行计划 |
14
MoYi123 2021-12-27 13:18:54 +08:00
凭空想象一个场景,设计表结构,造数据, 然后去优化它
https://github.com/mmooyyii/mmooyyii/blob/master/docs/database/tiplist1.md |
15
VVValent 2021-12-28 13:39:22 +08:00
我也想知道
|
16
likeunix 2022-03-12 17:48:45 +08:00
推荐一个测试数据集的工具,一键生成各种数据类型,支持导出到 JSON 、SQL 、XML 等文件。官网地址: http://www.redisant.cn/da
|