Khai thác ưu điểm của Deep Learning với Topological Data Analysis

Deep learning 6

Deep learning

Gỉa sử bạn có hàng ngàn cột và hàng triệu dòng trong tập dữ liệu của bạn. Dù cho bạn nhìn tập dữ liệu này dưới góc độ nào – nhỏ, vừa, hay lớn – bạn cũng không thể nào thật sự quan sát hết tính chất của dữ liệu hiện tại. Đó là khuyết điểm trong giác quan của con người. Ta chỉ có thể quan sát tốt một đối tượng cụ thể hay một bức tranh tổng quát. Vậy có cách nào để chuyển tải tập dữ liệu của bạn vào một bản đồ duy nhất, để từ đó bạn có thể điều hướng và quan sát từng chi tiết một bên trong đó?

Deep Learning kết hợp với Topological Data Analysis có thể làm được việc này và hơn thế nữa. Edward Kibardin, Lead Data Scientist tại Badoo đã phát triển một công cụ để làm điều này. Bằng cách kết hợp hai công nghệ trên vào một giao diện người dùng thân thiện. Công cụ này có thể gíup mọi người quan sát dữ liệu hiện tại một cách dễ dàng hơn cũng như trả lời được những câu hỏi ngay cả bản thân còn không thể đặt ra trước đó.  website DataRefiner.

Khả năng tạo một bức tranh về dữ liệu trong vòng vài phút

Deep learning 1

Mỗi điểm dữ liệu là một item hay một group các item tương tự nhau.

Phát hiện các patterns bên trong dữ liệu là điều bất khả thi nếu áp dụng các phương pháp phân tích truyền thống

Deep learning 2

Nhận diện hai nhóm riêng biệt bằng cách phân tích các hoạt động của users. Các điểm màu vàng là nữ giới, các điểm xanh là nam giới.

Deep learning 3

Bằng cách phân tích loại hoạt động, ta thấy nhóm nam có xu hướng gửi tin nhắn nhiều hơn nhóm nữ là nhóm nhận tin nhắn.

Nhận diện các phân đoạn bên trong dữ liệu với nhiều cấp độ

Deep learning 4

Netflix dataset, mỗi điểm dữ liệu là một bộ phim. Những nhóm ở cấp độ cao là music, kids, foreign and adult movies. Cấp độ trung bình là Indian và Hong Kong tương ứng với các bộ phim kinh dị. Cấp độ thấp là TV series như “Jeeves and Wooster”, “The Office”, “Doctor Who”.

Có khả năng phân tích bất kì loại dữ liệu nào: văn bản, hình ảnh, sensors data và âm thanh

Deep learning 5

Bất kì dữ liệu nào cũng có thể được phân đoạn và hiểu nếu chúng có thể biểu diễn dưới dạng một ma trận các số thực.

Khả năng học được các mối quan hệ phức tạp nếu được hướng dẫn

Deep learning 6

Phân tích 20,000 bài viết với 20 chủ đề khác nhau được biểu diễn bởi ảnh bên trái. Sau khi áp dụng Deep Learning vài lần để gom nhóm, ta thu được error rate chỉ khoảng 1.2% được biểu diễn bởi ảnh bên phải.

Khả năng học không gíam sát

Deep learning 7

Deep learning huấn luyện để nhận diện mặt người và mặt mèo dựa trên 10 triệu ảnh kĩ thuật số lấy từ YouTube videos.

Xem thêm: http://www.kdnuggets.com/2015/11/crazy-deep-learning-topological-data-analysis.html

Advertisements

Trả lời

Mời bạn điền thông tin vào ô dưới đây hoặc kích vào một biểu tượng để đăng nhập:

WordPress.com Logo

Bạn đang bình luận bằng tài khoản WordPress.com Đăng xuất / Thay đổi )

Twitter picture

Bạn đang bình luận bằng tài khoản Twitter Đăng xuất / Thay đổi )

Facebook photo

Bạn đang bình luận bằng tài khoản Facebook Đăng xuất / Thay đổi )

Google+ photo

Bạn đang bình luận bằng tài khoản Google+ Đăng xuất / Thay đổi )

Connecting to %s