大数据搜索与挖掘及可视化管理方案 :Elastic Stack 5:Elasticsearch、Logstash、Kibana、X-Pack、Beats (第3版)
上QQ阅读APP看书,第一时间看更新

1.4 其他

基于Elastic Stack的数据处理解决方案架构如图1.4所示。其实,Elastic Stack还包括其他一些组件。

图1.4 基于ElasticStack的数据解决方案架构

Beats:可将其理解为一个代理,官方提供了用来实时收集日志的Filebeat、用来收集系统基础设置数据的Topbeat、统计收集网络信息的Packetbeat等,这些收集到的信息经过处理后可以输入到Elasticsearch中进行后续处理等(如图1.4左侧框图所示)。其中,Topbeat用来收集系统负载、内存、硬盘以及每个进程的情况,它是跨平台的,会周期性发送指标到Elasticsearch中;Packetbeat是开源的、分布式的组件,能实时嗅探每个事务的请求与响应并将相关数据插入到Elasticsearch中,相关的社区也添加了对MongoDB的支持、基于UDP和TCP的DNS支持等。

X-Pack:Elastic Stack的扩展插件,将安全、警报、监视、报告和图形功能捆绑在一个易于安装的软件包中。虽然X-Pack中的组件被设计为无缝协同工作,但仍可以轻松启用或禁用其中的部分功能。

Elasticsearch for Apache Hadoop and Spark:虽然Hadoop生态链(如Spark、Hive、Storm、MapReduce、Cascading等)能提供多维度的大数据分析能力,但其快速、实时检索并不强。Elasticsearch for Apache Hadoop and Spark是位于存储大数据的Hadoop集群与Elasticsearch之间的中间件,如图1.5中的结构,它可以无缝连接Hadoop和Elasticsearch间的数据,能提供实时检索,通过Kibana更可方便地可视化Hadoop生态链中的数据流。

图1.5 ElasticStack相关软件产品