Exploratory Data Analysis: Giảm số chiều dữ liệu

Mình xin chia sẻ bài viết về phân tích thành phần chính (Principle Component Analsysi – PCA). Đây là một công cụ rất hữu ích khi làm việc với big data. Bằng cách giảm số chiều dữ liệu từ vài triệu xuống còn vài nghìn, ta có thể cải thiện hiệu suất tính toán của máy tính nhưng vẫn giữ được độ chính xác của mô hình dự đoán của mình. Đây là bài báo được viết bởi Jonathon Shlens của Google Research, có nhan đề “A Tutorial on Principal Component Analysis”. Bạn có thể download ở link sau: http://arxiv.org/pdf/1404.1100.pdf

pca

pca

Advertisements

Trả lời

Mời bạn điền thông tin vào ô dưới đây hoặc kích vào một biểu tượng để đăng nhập:

WordPress.com Logo

Bạn đang bình luận bằng tài khoản WordPress.com Đăng xuất / Thay đổi )

Twitter picture

Bạn đang bình luận bằng tài khoản Twitter Đăng xuất / Thay đổi )

Facebook photo

Bạn đang bình luận bằng tài khoản Facebook Đăng xuất / Thay đổi )

Google+ photo

Bạn đang bình luận bằng tài khoản Google+ Đăng xuất / Thay đổi )

Connecting to %s