Lấy và làm sạch dữ liệu với R: Ngày và Thời gian với lubridate

Watch
Watch

Trong bài viết này, ta sẽ khảo sát lubridate R package được phát triển bởi Garrett Grolemund và Hadley Wickham.  Theo tác giả đề cập, “lubridate có cú pháp đồng nhất và dễ nhớ giúp cho thao tác trên dữ liệu Ngày và Thời gian thêm thú vị thay vì bực dọc”. Nếu bạn đã từng làm việc với Ngày và Thời gian thì phát biểu trên sẽ khiến bạn chú ý.

Notebooks: datetime_with_lubridate.

Advertisement

Lấy và làm sạch dữ liệu với R: Dọn dẹp dữ liệu với tidyr

Data Cleaning
Data Cleaning

Trong bài viết này, ta sẽ học cách dọn dẹp dữ liệu với tidyr package. Các phần trong bài viết này đòi hỏi sử dụng dplyr. Nếu bạn không có kiến thức căn bản về dplyr, bạn nên đọc trước loạt bài dplyr trước khi bắt đầu bài viết này.

Notebooks: working_with_tidyr_dplyr.

R: Làm quen với dữ liệu Air quality

Trong bài viết này, tôi sẽ sử dụng tập dữ liệu air quality để minh họa đôi nét về quá trình phân tích sơ khởi trong data analysis. Trước khi bước vào áp dụng các giải thuật Machine learning, việc nên làm trước tiên đó là quan sát dữ liệu đầu vào. Từ đó, bạn sẽ cảm nhận được tổng quan về tập dữ liệu để có thể dùng trực giác của mình áp dụng những giải thuật phù hợp nhất.

Notebooks: air_quality.