Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

add new blogs #128

Merged
merged 10 commits into from
Nov 30, 2018
Merged
Changes from 1 commit
Commits
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
Prev Previous commit
Next Next commit
add tidb-21-ga-release-notes.md
  • Loading branch information
siyu-hu committed Nov 30, 2018
commit 263be8b8df814cf1a61f7727a01dcf54d6a66198
189 changes: 189 additions & 0 deletions tidb-21-ga-release-notes.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,189 @@
---
title: TiDB 2.1 GA Release Notes
author: ['PingCAP']
date: 2018-10-11
summary: 2018 年 11 月 30 日,TiDB 发布 2.1 GA 版。相比 2.0 版本,该版本对系统稳定性、性能、兼容性、易用性做了大量改进。
tags: ['TiDB']
---


2018 年 11 月 30 日,TiDB 发布 2.1 GA 版。相比 2.0 版本,该版本对系统稳定性、性能、兼容性、易用性做了大量改进。

## TiDB

### SQL 优化器

* 优化 `Index Join` 选择范围,提升执行性能
* 优化 `Index Join` 外表选择,使用估算的行数较少的表作为外表
* 扩大 Join Hint `TIDB_SMJ` 的作用范围,在没有合适索引可用的情况下也可使用 Merge Join
* 加强 Join Hint `TIDB_INLJ` 的能力,可以指定 Join 中的内表
* 优化关联子查询,包括下推 Filter 和扩大索引选择范围,部分查询的效率有数量级的提升
* 支持在 `UPDATE` 和 `DELETE` 语句中使用 Index Hint 和 Join Hint
* 支持更多函数下推:`ABS`/`CEIL`/`FLOOR`/`IS TRUE`/`IS FALSE`
* 优化内建函数 `IF` 和 `IFNULL` 的常量折叠算法
* 优化 `EXPLAIN` 语句输出格式, 使用层级结构表示算子之间的上下游关系

### SQL 执行引擎

* 重构所有聚合函数,提升 `Stream` 和 `Hash` 聚合算子的执行效率
* 实现并行 `Hash Aggregate` 算子,部分场景下有 350% 的性能提升
* 实现并行 `Project` 算子,部分场景有 74% 的性能提升
* 并发地读取 `Hash Join` 的 `Inner` 表和 `Outer` 表的数据,提升执行性能
* 优化 `REPLACE INTO` 语句的执行速度,性能提升 10x
* 优化时间类型的内存占用,时间类型数据的内存使用降低为原来的一半
* 优化点查的查询性能, Sysbench 点查效率提升 60%
* TiDB 插入和更新宽表,性能提升接近 20 倍
* 支持在配置文件中设置单个查询的内存使用上限
* 优化 `Hash Join` 的执行过程,当 Join 类型为 `Inner Join` 或者 `Semi Join` 时,如果内表为空,不再读取外表数据,快速返回结果
* 支持 [`EXPLAIN ANALYZE`](https://github.com/pingcap/docs/blob/master/sql/understanding-the-query-execution-plan.md#explain-analyze-output-format) 语句,用于查看 Query 执行过程中各个算子的运行时间,返回结果行数等运行时统计信息

### 统计信息

* 支持只在一天中的某个时间段开启统计信息自动 ANALYZE 的功能

* 支持根据查询的反馈自动更新表的统计信息

* 支持通过 `ANALYZE TABLE WITH BUCKETS` 语句配置直方图中桶的个数

* 优化等值查询和范围查询混合的情况下使用直方图估算 Row Count 的算法

### 表达式

* 支持内建函数:
* `json_contains`  
* `json_contains_path`
* `encode/decode`

### Server

* 支持在单个 tidb-server 实例内部对冲突事务排队,优化事务间冲突频繁的场景下的性能
* 支持 Server Side Cursor
* 新增 [HTTP 管理接口](https://github.com/pingcap/tidb/blob/master/docs/tidb_http_api.md)
* 打散 table 的 regions 在 TiKV 集群中的分布
* 控制是否打开 `general log`
* 在线修改日志级别
* 查询 TiDB 集群信息
* [添加 `auto_analyze_ratio` 系统变量控制自动 Analyze 的阈值](https://pingcap.com/docs-cn/FAQ/#3-3-11-%E5%9C%A8-tidb-%E4%B8%AD-auto-analyze-%E7%9A%84%E8%A7%A6%E5%8F%91%E7%AD%96%E7%95%A5%E6%98%AF%E6%80%8E%E6%A0%B7%E7%9A%84)
* [添加 `tidb_retry_limit` 系统变量控制事务自动重试的次数](https://pingcap.com/docs-cn/sql/tidb-specific/#tidb-retry-limit)
* [添加 `tidb_disable_txn_auto_retry` 系统变量控制事务是否自动重试](https://pingcap.com/docs-cn/sql/tidb-specific/#tidb-disable-txn-auto-retry)
* [支持使用 `admin show slow` 语句来获取慢查询语句](https://pingcap.com/docs-cn/sql/slow-query/#admin-show-slow-%E5%91%BD%E4%BB%A4)
* [增加环境变量 `tidb_slow_log_threshold` 动态设置 slow log 的阈值](https://pingcap.com/docs-cn/sql/tidb-specific/#tidb_slow_log_threshold)
* [增加环境变量 `tidb_query_log_max_len` 动态设置日志中被截断的原始 SQL 语句的长度](https://pingcap.com/docs-cn/sql/tidb-specific/#tidb_query_log_max_len)

### DDL

* 支持 Add Index 语句与其他 DDL 语句并行执行,避免耗时的 Add Index 操作阻塞其他操作
* 优化 `Add Index` 的速度,在某些场景下速度大幅提升
* 支持 `select tidb_is_ddl_owner()` 语句,方便判断 TiDB 是否为 `DDL Owner`
* 支持 `ALTER TABLE FORCE` 语法
* 支持 `ALTER TABLE RENAME KEY TO` 语法
* `Admin Show DDL Jobs` 输出结果中添加表名、库名等信息
* [支持使用 `ddl/owner/resign` HTTP 接口释放 DDL Owner 并开启新一轮 DDL Owner 选举](https://github.com/pingcap/tidb/blob/master/docs/tidb_http_api.md)

### 兼容性

* 支持更多 MySQL 语法
* `BIT` 聚合函数支持 `ALL` 参数
* 支持 `SHOW PRIVILEGES` 语句
* 支持 `LOAD DATA` 语句的 `CHARACTER SET` 语法
* 支持 `CREATE USER` 语句的 `IDENTIFIED WITH` 语法
* 支持 `LOAD DATA IGNORE LINES` 语句
* `Show ProcessList` 语句返回更准确信息

## PD

### 可用性优化

* 引入 TiKV 版本控制机制,支持集群滚动兼容升级
* PD 节点间 [开启 `Raft PreVote`](https://github.com/pingcap/pd/blob/5c7b18cf3af91098f07cf46df0b59fbf8c7c5462/conf/config.toml#L22),避免网络隔离后恢复时产生的重新选举
* 开启 `raft learner` 功能,降低调度时出现宕机导致数据不可用的风险
* TSO 分配不再受系统时间回退影响
* 支持 `Region merge` 功能,减少元数据带来的开销

### 调度器优化

* 优化 Down Store 的处理流程,加快发生宕机后补副本的速度
* 优化热点调度器,在流量统计信息抖动时适应性更好
* 优化 Coordinator 的启动,减少重启 PD 时带来的不必要调度
* 优化 Balance Scheduler 频繁调度小 Region 的问题
* 优化 Region merge,调度时考虑 Region 中数据的行数
* [新增一些控制调度策略的开关](https://github.com/pingcap/docs-cn/blob/master/tools/pd-control.md#config-show--set--)
* 完善[调度模拟器](https://github.com/pingcap/pd/tree/release-2.1/tools/pd-simulator),添加调度场景模拟

### API 及运维工具

* 新增 [`GetPrevRegion` 接口](https://github.com/pingcap/kvproto/blob/8e3f33ac49297d7c93b61a955531191084a2f685/proto/pdpb.proto#L40),用于支持 TiDB reverse scan 功能
* 新增 [`BatchSplitRegion` 接口](https://github.com/pingcap/kvproto/blob/8e3f33ac49297d7c93b61a955531191084a2f685/proto/pdpb.proto#L54),用于支持 TiKV 快速 Region 分裂
* 新增 [`GCSafePoint` 接口](https://github.com/pingcap/kvproto/blob/8e3f33ac49297d7c93b61a955531191084a2f685/proto/pdpb.proto#L64-L66),用于支持 TiDB 并发分布式 GC
* 新增 [`GetAllStores` 接口](https://github.com/pingcap/kvproto/blob/8e3f33ac49297d7c93b61a955531191084a2f685/proto/pdpb.proto#L32),用于支持 TiDB 并发分布式 GC
* pd-ctl 新增:
* [使用统计信息进行 Region split](https://github.com/pingcap/docs-cn/blob/release-2.1/tools/pd-control.md#operator-show--add--remove)
* [调用 `jq` 来格式化 JSON 输出](https://github.com/pingcap/docs-cn/blob/release-2.1/tools/pd-control.md#jq-%E6%A0%BC%E5%BC%8F%E5%8C%96-json-%E8%BE%93%E5%87%BA%E7%A4%BA%E4%BE%8B)
* [查询指定 store 的 Region 信息](https://github.com/pingcap/docs-cn/blob/release-2.1/tools/pd-control.md#region-store-store_id)
* [查询按 version 排序的 topN 的 Region 列表](https://github.com/pingcap/docs-cn/blob/release-2.1/tools/pd-control.md#region-topconfver-limit)
* [查询按 size 排序的 topN 的 Region 列表](https://github.com/pingcap/docs-cn/blob/release-2.1/tools/pd-control.md#region-topsize-limit)
* [更精确的 TSO 解码](https://github.com/pingcap/docs-cn/blob/release-2.1/tools/pd-control.md#tso)
* [pd-recover](https://github.com/pingcap/docs-cn/blob/release-2.1/tools/pd-recover.md) 不再需要提供 max-replica 参数

### 监控

* 增加 `Filter `相关的监控
* 新增 etcd Raft 状态机相关监控

### 性能优化

* 优化处理 Region heartbeat 的性能,减少 heartbeat 带来的内存开销
* 优化 Region tree 性能
* 优化计算热点统计的性能问题

## TiKV

### Coprocessor

* 新增支持大量内建函数
* [新增 Coprocessor ReadPool,提高请求处理并发度](https://github.com/tikv/rfcs/blob/master/text/2017-12-22-read-pool.md)
* 修复时间函数解析以及时区相关问题
* 优化下推聚合计算的内存使用

### Transaction

* 优化 MVCC 读取逻辑以及内存使用效率,提高扫描操作的性能,Count 全表性能比 2.0 版本提升 1 倍
* 折叠 MVCC 中连续的 Rollback 记录,保证记录的读取性能
* [新增 `UnsafeDestroyRange` API 用于在 drop table/index 的情况下快速回收空间](https://github.com/tikv/rfcs/blob/master/text/2018-08-29-unsafe-destroy-range.md)
* GC 模块独立出来,减少对正常写入的影响
* kv_scan 命令支持设置 upper bound

### Raftstore

* 优化 snapshot 文件写入流程避免导致 RocksDB stall
* [增加 LocalReader 线程专门处理读请求,降低读请求的延迟](https://github.com/tikv/rfcs/pull/17)
* [支持 `BatchSplit` 避免大量写入导致产生特别大的 Region](https://github.com/tikv/rfcs/pull/6)
* 支持按照统计信息进行 Region Split,减少 IO 开销
* 支持按照 Key 的数量进行 Region Split,提高索引扫描的并发度
* 优化部分 Raft 消息处理流程,避免 Region Split 带来不必要的延迟
* 启用 `PreVote` 功能,减少网络隔离对服务的影响

### 存储引擎

* 修复 RocksDB `CompactFiles` 的 bug,可能影响 Lightning 导入的数据
* 升级 RocksDB 到 v5.15,解决 snapshot 文件可能会被写坏的问题
* 优化 `IngestExternalFile`,避免 flush 卡住写入的问题

### tikv-ctl

* [新增 ldb 命令,方便排查 RocksDB 相关问题](https://github.com/tikv/tikv/blob/master/docs/tools/tikv-control.md#ldb-command)
* compact 命令支持指定是否 compact bottommost 层的数据

## Tools

* 全量数据快速导入工具 [TiDB-Lightning](https://pingcap.github.io/docs-cn/tools/lightning-overview-architecture)
* 支持新版本 [TiDB-Binlog](https://pingcap.github.io/docs-cn/tools/tidb-binlog-cluster/)

## 升级兼容性说明

* 由于新版本存储引擎更新,不支持在升级后回退至 2.0.x 或更旧版本
* 新版本默认开启 `raft learner` 功能,如果从 1.x 版本集群升级至 2.1 版本,须停机升级或者先滚动升级 TiKV,完成后再滚动升级 PD
* 从 2.0.6 之前的版本升级到 2.1.0 之前,最好确认集群中是否存在正在运行中的 DDL 操作,特别是耗时的 Add Index 操作
* 因为 2.1 版本启用了并行 DDL,对于早于 2.0.1 版本的集群,无法滚动升级到 2.1,可以选择下面两种方案:
* 停机升级,直接从早于 2.0.1 的 TiDB 版本升级到 2.1
* 先滚动升级到 2.0.1 或者之后的 2.0.x 版本,再滚动升级到 2.1 版本