Những dự án Machine Learning tập dợt khi rảnh rỗi

Machine Learning projects

Machine Learning projects

Các dự án thực tế giúp cho những kiến thức trừu tượng về Machine Learning trở nên rõ ràng hơn. Trong bài viết này, tôi xin liệt kê một vài dự án thú vị trong thực tế để chúng ta có cơ hội tập dợt mỗi khi rảnh rỗi. Bạn sẽ thấy được machine learning áp dụng như thế nào vào các lĩnh vực như giáo dục, khoa học, kĩ thuật và y tế.

Mỗi dự án được liệt kê bên dưới đều có đường link dẫn đến tập dữ liệu cần thiết. Nếu có dự án nào khiến bạn cảm thấy hứng thú, bạn có thể download tập dữ liệu về và bắt đầu “vọc” ngay lập tức.

  • Otto Group Product Classification Challenge. Cho các thuộc tính của sản phẩm, phân lớp các sản phẩm này vào một trong 9 danh mục sản phẩm khác nhau.
  • Rossmann Store Sales. Cho lịch sử bán hàng của các sản phẩm ở những cửa hàng khác nhau, dự đoán tình hình kinh doanh trong tương lai.
  • Bike Sharing Demand. Cho dữ liệu thuê mướn xe đạp và dữ liệu thời tiết đi kèm, dự đoán nhu cầu thuê mướn xe đạp hàng ngày của khách hàng trong tương lai.
  • The Analytics Edge. Cho thông tin các bài viết của New York Times, dự đoán bài viết nào được đọc nhiều nhất.
  • Restaurant Revenue Prediction. Cho thông tin chi tiết của một nhà hàng, dự đoán doanh thu trong một năm sắp tới.
  • Liberty Mutual Group: Property Inspection Prediction. Cho thông tin chi tiết về một tài sản bất kì, dự đoán mức độ rủi ro bảo hiểm cho tài sản đó.
  • Springleaf Marketing Response. Cho thông tin các khách hàng, dự đoán xem họ có phải là khách hàng mục tiêu hay không.
  • Higgs Boson Machine Learning Challenge. Cho mô tả về mô phỏng va chạm giữa các hạt, dự đoán xem biến cố này có phân rã thành hạt Higgs hay không.
  • Forest Cover Type Prediction. Cho thông tin bản đồ, dự đoán rừng thuộc loại bao phủ nào.
  • Amazon.com Employee Access Challenge. Cho lịch sử truy cập tài nguyên của các nhân viên, dự đoán các nguồn tài nguyên nào nhân viên cần dùng thường xuyên.
  • Iris dataset. Cho kích thước (cm) của một bông hoa, dự đoán nó thuộc về loài hoa nào.
  • Adult dataset. Cho dữ liệu điều tra dân số, dự đoán những cá nhân nào có thu nhập nhiều hơn $50,000 một năm.
  • Wine dataset. Cho dữ liệu phân tích thành phần hóa học của rượu, dự đoán xuất xứ của rượu này.
  • Car evaluation dataset. Cho thông tin chi tiết về một chiếc xe, dự đoán mức độ an toàn của chiếc xe đó.
  • Breast Cancer Wisconsin dataset. Cho xét nghiệm chẩn đoán tế bào vú, dự đoán xem tế bào này có bị ung thư hay không.
  • Abalone dataset. Cho thông tin đo lường về bào ngư, dự đoán tuổi của bào ngư này.
  • Wine Quality dataset. Cho thông tin khác nhau về rượu, dự đoán chất lượng của rượu này.
  • Heart Disease dataset. Cho các kết quả chẩn đoán khác nhau về một bệnh nhân, dự đoán mức độ mắc bệnh tim mạch của người đó.
  • Human activity recognition using smart phones dataset. Từ dữ liệu chuyển động của smart phone, dự đoán loại hoạt động của người dùng.
  • Forest fires dataset. Cho thông tin khí tượng và một số dữ kiện khác, dự đoán vùng rừng có nguy cơ bị cháy cao.
  • Internet Advertisements dataset. Cho thông tin các bức ảnh trên trang web, dự đoán bức ảnh này có phải quảng cáo hay không.
Advertisements

Trả lời

Mời bạn điền thông tin vào ô dưới đây hoặc kích vào một biểu tượng để đăng nhập:

WordPress.com Logo

Bạn đang bình luận bằng tài khoản WordPress.com Đăng xuất / Thay đổi )

Twitter picture

Bạn đang bình luận bằng tài khoản Twitter Đăng xuất / Thay đổi )

Facebook photo

Bạn đang bình luận bằng tài khoản Facebook Đăng xuất / Thay đổi )

Google+ photo

Bạn đang bình luận bằng tài khoản Google+ Đăng xuất / Thay đổi )

Connecting to %s