大数据科学新发展展望:不得不知的四大趋势

网友投稿 275 2022-11-27

大数据科学新发展展望:不得不知的四大趋势

但无论技术热点如何变换,我们能看到的是,随着行业沉下心来进行实质的落地,大数据生态也越来越细分。今天就我和大家来谈谈大数据领域的一些新变化、新趋势。

在这里还是要推荐下我自己建的大数据学习交流群:529867072,群里都是学大数据开发的,如果你正在学习大数据 ,小编欢迎你加入,大家都是软件开发党,不定期分享干货(只有大数据软件开发相关的),包括我自己整理的一份最新的大数据进阶资料和高级开发教程,欢迎进阶中和进想深入大数据的小伙伴加入。

一、数据治理与安全 Data Governance& Security

就发展趋势而言,这个可以放在第一位来讲讲。

多年来,数据已经在企业中不断快速积累。物联网(IoT) 更是不断加速数据的生成。

但是,除非你知道数据湖里具体有什么,并且能够访问到合适的数据进行分析,否则数据湖再大也没有意义。因此,最后大家都会意识到许多数据湖是表现不佳的资源,人们不知道其中存储着什么内容,如何进行访问,或者如何从这些数据中获取洞察力。

但是,方便地找到想要的东西、同时管理好权限并不容易。除了数据湖以外,治理的另一个主题是以安全的、可审计的方式为任何人提供对可靠数据的便捷访问。

所以,站在管理并使用好公司数据资产的角度而言,数据治理犹如公司的顶层制度和宣言一样需要被重视,并且用相应的策略、流程等来进行落实。最终目的是通过实现数据治理,来提升数据管理、确保数据质量、形成开放共享的新局面等。此外,数据治理也是决策、职能以及操作流程有机组合的系统,并且人们对这些数据资产承担责任。

二、致力于协作的数据工作台发展

在大多数大型企业里,大数据的采用是从少数独立项目开始的,个推也是如此:譬如这里做一点Hadoop集群,那里用一用分析工具,跑一个简单业务模型,以及意识到需要设立一些新的职位(数据科学家、首席数据官)等等。

现在,业务场景越来越丰富,异质性也越来越突出,各种各样的工具在整个企业范围内得到了使用。在公司的组织范围内,集中化的“数据科学部门”正在逐渐让位于更加去中心化的组织,原因在于集中化的部门越来越走向瓶颈,也更容易造成资源的流失。

这个由数据科学家、数据工程师以及数据分析师组成的群体,正日益嵌入到不同的业务部门里。因此,对于平台来说需求已经很明显了,那就是要让一切都能协作到一起来,因为大数据的成功正是建立在设立一条由技术、人以及流程组成的装配线基础之上的。

因此,一些全新的协作平台类型(譬如 Jupyter等)正在加快出现,引领着所谓的DataOps(与DevOps对应)领域的发展。

三、数据科学自动化

数据科学家(Data Scientist)依然是市场上炙手可热的争夺对象。但是我们在周围却很少见到这类人,哪怕是财富前1000强的公司也为无法招到更多“数据科学家”而感到困扰。而在一些组织里,数据科学部门正在从使能者演变为瓶颈。

与此同时,AI的大众化以及自服务工具的蔓延使得数据科学技能有限的数据工程师,甚至是数据分析师在执行一些基本操作时变得更加容易了,而这些操作直到最近仍然是数据科学家的领地。在自动化工具的帮助下,企业大量的大数据工作,尤其是那些简单枯燥的工作,将由数据工程师和数据分析师进行处理,而不必麻烦有着深厚技术技能的数据科学家。当然,即便如此,数据科学家目前还不需要太过“恐惧”。

在可预见的未来里,自服务工具和自动化模型将会“增强”数据科学家而不是消灭他们,会解放他们,让他们把焦点放在需要判断、创造力、社会化技能或者需要垂直行业知识的任务上,那样才能更加体现科学家的名号。

四、大数据管理员的崛起

大数据管理员(BDA)也对标于数据库管理员(DBA),虽然两个英文字母只是变换了一下顺序,但是其内涵相差甚远。一个非常明显的趋势是,企业将对一个新岗位角色产生需求,即大数据管理员。DBA大家已经非常熟悉,但它与大数据时代下的数据管理员,有非常大的差别。大数据学习交流群:251956502

数据管理员处于数据使用者和数据工程师之间。为了取得成功,数据管理员在进行大数据系统的维护工作之外,还必须了解数据的含义以及掌握应用于数据中的一些技术。

数据管理员需要清楚整个组织内需要执行的数据分析类型,哪些数据集非常适用于这项工作,以及如何将数据从原始状态转换为数据使用者执行这项工作所需的形态和形式。数据管理员应使用像自助服务数据平台这样的系统来加快数据使用者访问基本数据集的端到端流程,而无需制作无数的数据副本。

结语

以上四个方面是数据科学在实践发展中提出的新需求,谁能在这些方面得到好的成绩,谁便会在这个大数据时代取得领先的位置。

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:大数据入门学习之Hadoop技术优缺点
下一篇:使用嵌入式802.11ax将Wi-Fi扩展到物联网
相关文章

 发表评论

暂时没有评论,来抢沙发吧~