h
h
hocdata.com
source
Search…
h
h
hocdata.com
Học trở thành Data Engineer
Data Engineering Roadmap
Chương 1: Dữ liệu thô
Array với numpy
Empowering data analysis with pandas
Data cleansing
Data operations
Tổng kết
Chương 2: Data Pipeline
Lambda architecture
Data Pipeline trên GCP
Data Pipeline trên AWS
Chương 3: Công cụ, framework
Apache Spark
Apache Kafka
Apache Airflow
Chương 4: Principles of Data-Intensive Systems
Database System Architecture
Storage Formats and Indexing
Distributed Databases
Cloud Systems
Streaming Systems
Powered By
GitBook
Data Pipeline trên AWS
Thiết kế và xây dựng một Data Pipeline đơn giản trên AWS, sử dụng các service như S3 (lưu trữ), EMR (xử lý dữ liệu batch, lớn), AWS Data Pipeline, Cloudwatch để monitor, ...
Đang cập nhật, đọc tạm ở đây:
https://talk.duyet.net/data-pipeline-aws/design-datapipeline-aws.pdf
Chương 2: Data Pipeline - Previous
Data Pipeline trên GCP
Next - Chương 3: Công cụ, framework
Apache Spark
Last modified
3yr ago
Copy link