大数据基础概念:CAP 定理与分布式系统的本质
回想一下你曾经遇过的问题:
Topic
9 篇文章,像一份单独的主题档案,按最近更新时间倒序整理。
回想一下你曾经遇过的问题:
作为在互联网公司工作多年的 Java 开发者,我发现很多同事对大数据既向往又困惑:
水印用于处理乱序数据:
HDFS(Hadoop Distributed File System)的核心思想:
上一章我们学了 MapReduce,但它有个严重问题:写代码太麻烦!
Kafka Streams 是 Kafka 内置的轻量级流处理库:
想象你要统计一个超大文件的词频:
回顾一下 MapReduce:
构建一个完整的用户行为数据处理与分析平台: