ClickHouse 简单介绍-APISpace

ClickHouse 简单介绍

1: 简介

ClickHouse 是俄罗斯的Yandex于2016年开源的列式存储数据库(DBMS)，使用C++语音编写，主要用于在线分析处理查询(OLAP),能够使用SQL查询实时生成分析数据报告。

官网地址: 特点

2.1: 列式存储

2.1.1 采用行式存储时

一行行存储数据，一行就是对应一个对象的所有数据。

2.1.2 采用列式存储时

将一列的数据顺序排列，这样当我们查询想要的字段的时候，只需要将那一列拿出来就可以了。

2.1.3 好处

对于列的聚合，计数，求和等统计操作原因优于行式存储由于某一列的数据类型都是相同的，针对数据存储更容易进行数据压缩，每一列选择更优的数据压缩算法，提高了数据的压缩比例由于数据压缩比更好，节省了空间，对cache也有更大的发挥空间

2.2: DBMS功能

几乎涵盖了标准SQL的大部分语法，包括DDL和DML，以及各种函数，用户管理和权限管理，数据的备份和恢复。

2.3: 多样化的引擎

ClickHouse和MySQL类似，把表级的存储引擎插件化，根据表的不同需求可以设定不同的存储引擎。目前包括合并树，日志，接口和其他四大类的20多种引擎

2.4: 高吞吐写入能力

ClickHouse采用了类LSM Tree的结构，数据写入后定期在后台压缩(Compaction),通过类LSM Tree的结构，ClickHouse在数据导入时全部是顺序append写，写入后台数据段不可更改，在后台压缩时，也是多个段merge sort 后顺序写回磁盘。顺序写的特性，充分利用了磁盘的吞吐能力。

2.5: 数据分区与线程级并行

ClickHouse 将数据划分为多个partition(分区)，每个分区再进行一步划分为多个index granularity（索引粒度），然后通过多个CPU核心分别处理其中的一部分来实现并行数据处理。在这种设计中，单条查询就能利用整机的所有CPU, 降低了查询的延迟。虽然ClickHouse能够对大量的数据能够分而治之平行处理，但是对于单条查询使用多CPU,就不利于同时并发多条查询。所以高QPS的查询业务，ClickHouse 不是其强项。

3: 总结

总的来说，ClickHouse 的功能还是非常强大的。采用列式存储，能够快速对一列的数据进行操作。同时它还支持DBMS的特性和SQL支持，同时还有多元化的引擎，帮助数据很多的存储，采用了CPU多核操作处理数据，降低了查询的延迟。为了追求查询的极致，导致了其对并发不是很好，同时也不支持事务。每一项技术都有自己的优缺点，合适自己的才是最好的。

mysql连接测试不成功的原因有哪些

319 2022-11-22

ClickHouse 简单介绍

SQLServer Decimal数据类型怎么赋值

navicat怎么添加check约束

mysql连接测试不成功的原因有哪些

推荐文章

api接口有哪几种分类及功能

什么是API接口?API接口简单介绍

短信API接口概述，短信API接口的优势

7款快递物流的物流查询API工具，物流快递查询API接口怎么对接？

企业四要素: 了解企业经营成功的关键

什么是语音验证码?,语音验证码平台有哪些

全国工商查询系统怎么查企业名录

哪些平台提供实名认证的接口？

PHP如何调用API接口?

如何使用百度天气预报API接口?

最近发表

热评文章

数据接口api（数据接口API开发平台）

数据开放接口api（数据服务api开发）

Python爬虫教程：爬取酷狗音乐（python爬取

hbuilder怎么更改字体大小和颜色

直播平台api接口 - 构建卓越的直播平台

实时股票数据api接口（股票实时行情api接口）