
Với sự phát triển và tiến bộ nhanh chóng về các thuật toán Machine Learning như hiện nay, nếu không có sự hỗ trợ mạnh mẽ từ các API của các nhà khổng lồ về lĩnh vực này thì các developer thiên về kĩ thuật như chúng ta sẽ khó có thể xây dựng được những ứng dụng thông minh để đem lại trải nghiệm cao cho người dùng.
Với nhiều sự lựa chọn cho các nhiều loại tập dữ liệu khác nhau như hiện nay, cuộc đua tranh giải Machine Learning API tốt nhất vẫn còn đang diễn ra, ai là người nhanh hơn sẽ giành chiến thắng. Dưới đây, tôi xin đưa ra 5 Machine Learning APIs tốt nhất dành cho Data Science để mọi người tham khảo.
IBM Watson
- Machine Translation – giúp dịch văn bản theo các cặp ngôn ngữ khác nhau.
- Message Resonance – xác định một cụm từ hay một từ phổ biến với một user được xác định trước.
- Question and Answers – dịch vụ cung cấp những câu trả lời trực tiếp từ các câu truy vấn liên quan đến một nguồn tài liệu xác định.
- User Modelling – đưa ra nhận định về tính cách xã hội của một người khi cho trước tập các văn bản.
Microsoft Azure Machine Learning API
- Khả năng tạo ra những điều chỉnh về cài đặt cho các module R, nhờ vậy mà data analysts hay data scientists có thể sử dụng R language code để train hay dự đoán.
- Azure cho phép data scientists hay analysts include Python scripts bằng cách sử dụng các Python libraries khác nhau như SciPy, SciKit-Learn, NumPy, Pandas. Những tool phổ biến như iPython Notebook và các tool khác như Visual Studio cũng có thể sử dụng API này.
- Analysts hay data scientists có thể train hàng petabytes dữ liệu bằng cách sử dụng một lớp SVM cho tác vụ anomaly detection, PCA để đơn giản hóa dữ liệu, hay “Learning with Counts” để thống kê dữ liệu.
- Azure Machine Learning API còn hỗ trợ Spark và Hadoop để xử lý big data giúp cho API này là một sự lựa chọn cạnh tranh so với các API khác.
Google Prediction API
Hỗ trợ: customer sentiment analysis, churn analysis, spam detection, document classification, purchase prediction, recommendations, intelligent routing và hơn thế nữa.
Amazon Machine Learning API
- Data scientists hay analysts có thể phân loại một bản nhạc bằng cách phân tích các thuộc tính ở cấp độ signal.
- API này còn được sử dụng cho tác vụ Human Activity Recognition dựa vào accelerometer và sensor data thu thập thông tin từ smartphone hay tín hiệu từ gyroscope để xác định xem mobile device đang đi lên cầu thang, đi xuống cầu thang, nằm dọc hay nằm ngang, ngồi yên hay đang đứng.
- Dự đoán khách hàng tương lai có mua hàng nữa không bằng cách phân tích hoạt động mua sắm của họ từ tuần đầu tiên hay tháng đầu tiên.
- Phân tích hoạt động của website để xác định các tài khoản ảo, bots hay spammer từ hệ thống.
BigML
- Giúp tạo ra một mô hình mô tả để hiểu được các mối quan hệ giữa những thuộc tính khác nhau trong tập dữ liệu phức tạp để giúp doanh nghiệp lựa chọn các thuộc tính thích hợp nhất cho mô hình dự đoán.
- Analysts có thể xây dựng mô hình dự đoán bằng cách sử dụng BigML chỉ thông qua một CSV file.
- BigML còn được ứng dụng trong các tác vụ dự đoán mô hình theo một khoảng thời gian xác định như chứng khoán, các khoản vay tín dụng. Developer cũng có thể cập nhật hệ thống của mình thông qua phương thức remote hay command line interface.
Tham khảo thêm: