citus 以及timescaledb对于时许数据存储的处理

网友投稿 304 2022-11-02

citus 以及timescaledb对于时许数据存储的处理

从专业程度来说timescaledb 处理时许数据更加方便强大,citus 可以基于pg的分区可以很好的支持时许数据处理

citus 操作流程

一般是创建分区表参考

CREATE TABLE github_events ( event_id bigint, event_type text, event_public boolean, repo_id bigint, payload jsonb, repo jsonb, actor jsonb, org jsonb, created_at timestamp) PARTITION BY RANGE (created_at);

基于citus 提供了create_time_partitions 函数方便处理分区表的管理,当然我们还是需要创建分布式表,time_partitions 可以方便查看信息参考

SELECT create_time_partitions( table_name := 'github_events', partition_interval := '1 month', end_at := now() + '12 months'); SELECT create_distributed_table('github_events', 'repo_id'); SELECT partition FROM time_partitions WHERE parent_table = 'github_events'::regclass;

时许数据的维护,因为数据一直的变,解决方法是基于了pg_cron参考

SELECT cron.schedule('create-partitions', '0 0 1 * *', $$ SELECT create_time_partitions( table_name := 'github_events', partition_interval := '1 month', end_at := now() + '12 months' )$$); -- 2. (optional) ensure we never have more than one year of data SELECT cron.schedule('drop-partitions', '0 0 1 * *', $$ CALL drop_old_time_partitions( 'github_events', now() - interval '12 months' /* older_than */ );$$);

数据归档的处理,基于列式存储处理,利用了alter_old_partitions_set_access_method 函数对于自动的也可以使用pg_cron参考

SELECT cron.schedule('compress-partitions', '0 0 1 * *', $$ CALL alter_old_partitions_set_access_method( 'github_columnar_events', now() - interval '6 months' /* older_than */, 'columnar' );$$);

timescaledb 的处理

timescaledb 处理此类的就比较专业了,因为就是为了支持时许处理的,套路上很多与citus 类似,timescaledb 自己开发了一个定时任务处理的

创建Hypertables,对于包含数据的,timescale也支持了数据迁移创建持续聚合处理,同时可以按需压缩数据 add_compression_policy 函数创建数据保留策略基于add_retention_policy 函数

说明

citus 与timescaledb对于时许数据的处理即有相似的地方,也有差异的地方,使用上大家都比较类似,但是timescaledb更加擅长处理时许处理

参考资料

​​https://docs.citusdata.com/en/stable/use_cases/timeseries.html#timeseries-data​​

​​https://docs.timescale.com/​​

​​https://citusdata.com/blog/2021/09/17/citus-10-2-extension-to-postgres-whats-new/#partition-mgmt​​

​​https://docs.timescale.com/timescaledb/latest/how-to-guides/data-retention/​​

​​https://docs.timescale.com/timescaledb/latest/getting-started/data-retention/#learn-more-about-data-retention​​

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:Mybatis中一条SQL使用两个foreach的问题及解决
下一篇:TCL智能电视全线采用数字高清互动接口(DiiVA)技术
相关文章

 发表评论

暂时没有评论,来抢沙发吧~