Góp nhặt kinh nghiệm làm nghề Data scientist

A good data scientist knows how to do something really well, but a great data scientist can do “something of everything.” From raw data all the way to shining in front of C-level executives, a great data scientist has the skills to architect data systems, build applications, perform modeling and machine learning and wrap up the results in a clear (and quickly iterable) manner. From data models to ETL to databases to distributed algorithms and learning, this book has you covered.

Data Science with Java

Qua thời gian làm việc cũng như tìm tòi tài liệu, sách báo về machine learning, nếu vai trò của bạn là Data Scientist/Data Engieer/Data Analyst thì phần lớn bạn sẽ nhận được những chia sẻ kinh nghiệm bên dưới. Trong bài viết này, mình sẽ tổng hợp lại những kinh nghiệm trong ngành Data Science để dễ dàng tham khảo sau này.

Modern data scientist

Modern data scientist

Tuyển dụng

Data Science Interview.png

  • Ở Việt Nam, muốn làm Data Scientist bạn phải có bằng PhDs hay Master và Master nếu chưa có kinh nghiệm thực tế về Big Data thì cũng không được làm. Do vậy, bạn hãy đi từ thấp lên cao, từ vị trí technical như Data Engineer hay Data Analyst  để tiếp xúc dần dần với dự án thực tế rồi sau đó nâng cấp mình lên thành Data Scientist.
  • Ở Việt Nam, khi phỏng vấn về Data Scientist, bạn cần phải giỏi cấu trúc dữ liệu và giải thuật cũng như lập trình vì họ đòi hỏi cao về khả năng giải quyết vấn đề, tối ưu hóa hệ thống. Do đó, hãy dành thời gian ôn lại các khái niệm như Dynamic Programming, Recursive Programming, Combinatorial optimization cũng như tập code lại các vấn đề như chuỗi Fibonacci hay Knapsack.
  • Ở Việt Nam, khi phỏng vấn về Data Scientist, họ ít khi hỏi về Machine Learning hay các dự án thực nghiệm mà bạn đã làm, không như các nước như Mĩ họ quan tâm đến cách bạn sử dụng công cụ hiện có để xây dựng mô hình Machine Learning sao cho chính xác, nhanh là được. Lý do, người phỏng vấn chỉ là kĩ thuật viên nên không đủ kiến thức để hỏi, hoặc họ muốn bạn code lại tự đầu các thuật toán sao cho phù hợp với hệ thống hiện tại mà các tool hiện tại chưa cung cấp. Vì vậy, họ chủ yếu đào sâu vào giải thuật nhiều hơn là khoa học phân tích dữ liệu hay huấn luyện và đánh giá mô hình Machine Learning.
  • Bạn nên tránh xa những công ty khi nói với bạn những câu đại loại như thế này: “Bạn không phải là chuyên gia về R và chúng tôi sử dụng ngôn ngữ này rất nhiều nên chúng tôi không muốn tuyển dụng bạn nữa.” Bởi vì data science không phụ thuộc vào công nghệ mà phụ thuộc vào bài toán muốn giải. Hơn nữa, bạn sẽ học được R chỉ trong một tuần và thành thạo chỉ trong 1 tháng làm việc.
  • Bạn cần một team để có thể hoàn thành dự án về Data science. Bởi vì một người có bằng PhDs hay Master cũng không thể nào thành thạo về kĩ thuật cài đặt hệ thống như Hadoop hay Spark, không thể có kinh nghiệm nhiều như các chuyên gia phát triển phần mềm và quản lý dự án. Bạn không thể cùng lúc ôm xuể được tất cả mọi lĩnh vực, điều này chỉ dẫn đến thật bại của dự án mà thôi.

Làm việc

data science team.jpg

  • Dự án Data Science cần có các thành viên sau trong nhóm:
    • Algorithms team: những chuyên gia về thuật toán, thường có bằng Phd/Master trong lĩnh vực khoa học máy tính và thống kê, kĩ năng làm việc với R, Python, thuật toán, và Machine learning.
    • Big Data team: thu thập, tiền xử lý và quản trị dữ liệu Big Data (Extract, Transform, Load), chiếm 80% trong quá trình phát triển.
    • Domain Experts: những chuyên gia về mô hình kinh doanh, thường có bằng MBA, đảm bảo những phân tích và nghiên cứu được đưa vào sử dụng đúng với mục tiêu kinh doanh của doanh nghiệp.
    • Visualization and Design team: thiết kế và trình diễn mô hình dữ liệu hay dự đoán sao cho người sử dụng có thể quan sát một cách trực quan và nhanh chóng nhất để có thể đưa ra quyết định một cách hiệu quả.
    • Product Managers: người đảm bảo tiến độ của dự án, tập hợp và điều phối tiến trình làm việc của mọi người.
  • Bạn phải hiểu được ý nghĩa của tập dữ liệu muốn nói gì, điều này rất quan trọng. Đây là một nghệ thuật chứ chưa liên quan gì đến thuật toán hay kĩ thuật lập trình.
  • Dù có nhiều công cụ hay nhiều phương pháp đi chăng nữa, nếu bạn không biết được bài toán muốn giải và làm thế nào sử dụng tập dữ liệu hiện tại để giải quyết thì mọi thứ cũng bằng thừa.
  • Bạn cần biết về kĩ thuật phần mềm để có thể xây dựng được một hệ thống mang lại trải nghiệm tốt nhất tại đúng thời điểm cho người sử dụng.
  • Phần lớn 90% công việc của bạn là tinh chỉnh và làm sạch dữ liệu.
  • Cẩn trọng khi lựa chọn thu thập dữ liệu từ các nguồn: website analytics, social media data, sensor data, machine log data, media, business apps.
  • Công nghệ dữ liệu phân tán Hadoop/Spark được dùng để xây dựng mô hình dự đoán với tốc độ cao gần như real-time. Mô hình kết quả sẽ được lưu trữ tại cơ sở dữ liệu NoSQL như MongoDB, Cassandra cho các tác vụ truy vấn (Pig, Hive, SQL-like). Ta sẽ lên lịch cập nhật mô hình định kỳ theo ngày hay tuần.
  • Nên sử dụng dịch vụ cloud computing như Amazon Web Service, Databricks thay vì tốn nhiều thời gian và chi phí để mua máy móc thiết bị phục vụ cho phân tích Big Data. Mà các máy móc này thường lỗi thời rất nhanh, ta nên sử dụng dịch vụ cloud trả phí theo dung lượng sử dụng, hoặc theo sức mạnh phần cứng.
  • Sử dụng githubbitbucket, hay sourceforge để lưu lại các tài liệu phân tích dữ liệu của mình và chia sẻ cho cộng đồng.
  • Bạn không cần phải biết lập trình Java để tiếp cận với Hadoop. Ta đơn giản hóa tiến trình bằng cách sử dụng Pig hoặc Hive. Trong đó, 10 dòng code của Pig = 200 dòng code của Java.
  • Các dự án Kaggle không tạo nên thế mạnh cho Resume của bạn:
    • Bạn không có gì nổi bật trừ khi bạn đạt vị trí top 5 trong bảng xếp hạng.
    • Bạn không chứng minh được kĩ năng phân tích và xử lý dữ liệu của mình. Bởi vì các tập dữ liệu của Kaggle đều đã được tiền xử lý để giúp các Data scientist tập trung nhiều hơn vào xây dựng mô hình dự đoán.
    • Bạn không cho thấy được sáng kiến của mình trong giải quyết vấn đề thực tế. Mọi ý tưởng đều đã được Kaggle đặt ra và bạn chỉ có việc đi giải quyết các bài toán này. Trong thực tế, việc xác định được các bài toán cần giải là một bước quan trọng và tốn rất nhiều thời gian.
    • Hầu hết các dự án bạn bắt tay vào làm đều không liên quan đến lĩnh vực của công ty bạn muốn apply. Ví dụ, công ty bạn đang cần xây dựng hệ thống recommendation system nhưng bạn chỉ show được các dự án về xử lý ảnh y khoa.
  • Bạn dễ bị sa thải khi:
    • Không thích làm việc nhóm, nghĩ rằng một mình có thể làm hết mọi thứ.
    • Ngạo mạn, không chịu học hỏi, tiếp thu những ý kiến đóng góp của đồng nghiệp.
    • Gửi đến sếp những báo cáo dài dòng như tiểu thuyết làm mất thời gian.
    • Nhàm chán khi làm những tác vụ liên quan đến tiền xử lý dữ liệu.
    • Năng suất công việc không xứng đáng với mức lương bạn được trả.

Học tập và trau dồi

long-road-to-data-scientist.png

  • Học, học nữa, học mãi để trau dồi nhiều kiến thức và kĩ năng liên quan đến ngành bùng nổ nhanh chóng như Data science này.
  • Biết thật kĩ một vài thuật toán sẽ tốt hơn rất nhiều khi chỉ biết sơ sơ thật nhiều thuật toán: nếu bạn biết về linear regression, k-means clustering, hay logistic regression và có thể giải thích, diễn giải mạch lạc các kết quả của thuật toán, cũng như có thể cài đặt từ đầu đến cuối dự án bằng các thuật toán này, thì bạn sẽ được đánh giá cao hơn những người biết rất nhiều thuật toán nhưng không thể áp dụng chúng vào đâu.
  • Khi áp dụng một thuật toán machine learning nào đó, hầu như bạn chỉ cần sử dụng các thư viện đã cài đặt sẵn. Hiếm khi bạn phải code lại từ đầu thuật toán SVM vì nó tốn rất nhiều thời gian.
  • Học thông qua thực hành, tốt nhất là qua một dự án nhỏ sẽ giúp bạn tăng tốc việc học gấp 10 lần so với việc chỉ đọc mớ lý thuyết từ các chương sách như Linear algebra, Statistics, Database, Programming, … hay ngồi xem video hàng giờ liền từ các chương trình online như Coursera, Udemy, …
  • Để bắt đầu một dự án, cách đơn giản nhất là tìm cho mình một tập dữ liệu yêu thích như Iris sau đó cố gắng trả lời các câu hỏi như làm thế nào để phân lớp các loài hoa khi chỉ biết một vài thuộc tính… Một số nguồn để download tập dữ liệu: 100+ Interesting Data Sets for StatisticsDatasets subredditUCI machine learning repository.
  • Hãy bắt đầu viết blog, post các kết quả phân tích dữ liệu mà mình đã tìm tòi tuần qua. Việc này giúp bạn thu được kĩ năng trình bày cũng như khích lệ bản thân để tiếp tục học hỏi. “If you can’t explain it simply, you don’t understand it well enough.” – Albert Einstein. Do đó, nếu bạn có thể giải thích một cách đơn giản, dễ hiểu các lý thuyết phức tạp cho mọi người thì bạn đã hiểu vấn đề đó một cách thấu đáo.
  • Theo dõi các blog hay trang web như kdnuggetsoreilly, datasciencecentralinsidebigdata, Quora, DataTau, machine learning subredditEdwin ChenInternational Journal of Forecasting, UC Berkeley Social Lab, Nervana.
  • Thử tham gia các cuộc thi trên Kaggle để làm quen với những bài toán thực tế mà các doanh nghiệp đặt ra.
  • “Học thầy không tày học bạn”. Hãy lập một nhóm riêng của bạn về data science, mỗi tuần chia sẻ kiến thức và kinh nghiệm với nhau, bạn sẽ học được rất nhiều điều mới mẻ cũng như tiết kiệm nhiều thời gian tìm tòi.
  • Thử thách bản thân với tập dữ liệu Big data: bạn sẽ học hỏi được thêm những kiến thức cũng như các kĩ năng làm việc trên các hệ thống phân tán và sử lý song song như Hadoop, Spark, Mahout, YARN, HBase, Kudu, MapReduce, Hive, Pig, …
  • Trau dồi kiến thức bản thân thông qua các thuật toán machine learning tiên tiến nhất hiện nay như Deep learning, Topic modeling, Word2vec, On-line learning, …
  • Hãy hiểu điểm mạnh trong việc học của mình để tiếp cận data science nhanh hơn. Nếu bạn có óc tư duy lý thuyết tốt thì bạn có thể tìm đọc cùng lúc rất nhiều cuốn sách về học thuật để trau dồi kiến thức của mình. Nếu bạn là người thiên về kĩ thuật thì các tutorial step-by-step, các dự án nhỏ, hay học hỏi kinh nghiệm từ bạn bè của mình sẽ không phải là một ý kiến tồi.
  • Những trang web giúp bạn tiếp cận data science thông qua thực hành: Dataquest, Datacamp.

Các chứng chỉ nên đạt được

18 Data Science Certificates Rated

18 Data Science Certificates Rated

Infographs

The Building Precursors to Data Science.png

The Building Blocks of Data Science.png

Top-12-interesting-careers-to-explore-in-bigdata-2016-final.jpg

Modern data science

Modern data science

Nguồn tham khảo

Advertisements

36 thoughts on “Góp nhặt kinh nghiệm làm nghề Data scientist

        • Em nên học CS ở các trường ĐH uy tín như Bách Khoa hay Tự nhiên và đi làm trong ngành Big Data thì sẽ phát triển tốt hơn.
          Ngành này tự mày mò, góp nhặt kinh nghiệm từ học tập và làm việc cá nhân là chủ yếu. Việc học trong trường chỉ trang bị cho em kiến thức căn cơ nhất để tiếp tục nghiên cứu độc lập sau này. Ngành IT nói chung và Data Science nói riêng đều có tốc độ phát triển nhanh, chính vì thế một background chuyên ngành vững sẽ giúp em nắm bắt và theo kịp công nghệ dễ dàng hơn.

          Số lượt thích

  1. Trước hết cảm ơn anh rất nhiều vì bài viết tuyệt vời này.
    3 năm đi làm sau khi ra trường, từ code .net, javascript, HTML, CSS,… em đã tìm được niềm đam mê của mình là làm về Data. Em đã có 1 thời gian dài làm DBA Oracle, tiếp xúc nhiều với dữ liệu, em cũng đã làm các bài toán Data Warehouse, BI. Có hiểu biết cơ bản về Hadoop, Spark, Python. Nay em muốn đi theo hướng Data Scientist. Nhưng quả thực tìm kiếm 1 công ty ở Việt Nam làm theo hướng này thật sự là khó, vì ở Việt Nam vẫn là outsource code như lập trình Web, mobile, … cho các thị trường khác.
    Không biết anh có lời khuyên nào về cơ hội nghề nghiệp cho lĩnh vực này không ạ?

    Liked by 2 people

  2. Chào anh, em hiện không phải là một sinh viên thuộc ngành IT( em học ngành kinh tế ), tuy nhiên sau một thời gian làm thêm tại một công ty IT và học một chút Python, nghiên cứu thêm về Data Science em cảm thấy rất thích thú và muốn theo đuổi. Không biết em có nên bỏ tiền tiết kiệm ra để học một bằng SE online như FUNIX không, và nếu không thì anh có một lời khuyên nào không ạ, vì em ngại thị trường VN vẫn trọng bằng cấp và không biết những khoá trên coursera hay edx có phù hợp không. Em xin cảm ơn rất nhiều ạ.

    Số lượt thích

    • Hi em,
      Về định nghĩa một DS thật thụ thông thường gồm 4 tố chất:
      1. Kiến thức toán và thống kê (cái này anh nghĩ em có)
      2. Kỹ thuật lập trình và quản trị database (có kinh nghiệm Big Data là cần thiết)
      3. Kỹ năng trình bày và viết báo cáo (tùy khả năng mỗi người)
      4. Bản tính tò mò thích học hỏi và chia sẻ kiến thức (rất cần thiết trên con đường theo đuổi)
      Bên kinh tế anh nghĩ phần lập trình sẽ không phải là thế mạnh của em, đặc biệt là cấu trúc dữ liệu và giải thuật. Khi phỏng vấn họ sẽ hỏi nhiều về chuyên môn này để xem cách em giải quyết vấn đề có tốt không. Tùy công ty mà họ có thể hỏi thêm về kiến thức tài chính và thống kê.
      Về bằng cấp, nếu có người quen thì không nhất thiết phải học lấy bằng, em có thể học online và áp dụng ngay vào công việc là ok. Ngược lại, một tấm bằng hoặc chứng chỉ liên quan đến lập trình hoặc kinh nghiệm nghiên cứu sẽ dễ dàng hơn cho em xin việc sau này.
      Anh có để ý là hiện nay họ thường lập team để cùng làm việc trong đó có team về lập trình và team về domain expert (như em) như vậy sẽ dễ dàng hơn khi phát triển hệ thống. Nếu chịu khó tìm kiếm trên Vietnamworks hay ITviec, anh nghĩ em có thể tìm được công việc phù hợp.

      Liked by 1 person

  3. Chào anh, đầu tiên cám ơn anh về một bài giới thiệu rất hay và đầy đủ về data science, em có một câu hỏi mong anh hổ trợ giúp em: Em là dân kinh tế, không phải It nhưng sau một thời gian làm việc analyst và tìm hiểu về SQL cũng như BI tool, quả thật em rất hứng thú với ngành data science. Những kiến thức hiện tại của em: SQL, tableau, python basic.
    -Em nên học khóa học ngắn hạng nào để có thể đi theo con đường này.
    -Những kiến thức cần bổ sung.
    -Nên xin việc với vị trí nào với những kiến thức hiện tại và hổ trợ đi theo định hướng data science. Vì em có xin làm một số vị trí database thì đa phần không gọi, khi gọi trao đổi thì họ cũng lắc đầu vì muốn người có background về IT.

    Em cám ơn anh rất nhiều ạ.

    Số lượt thích

    • -Em nên học khóa học ngắn hạng nào để có thể đi theo con đường này: nếu đi theo chính quy thì nhanh nhất 3 năm, nếu học về lập trình em có thể đăng ký học bên Aptech để lấy chứng chỉ nghề, hoặc em xem thử chương trình bên JVN http://www.jvn.edu.vn/vi/page/Xet-tuyen.html.
      -Những kiến thức cần bổ sung: Toán, Lập trình, CSDL, Business domain, Machine learning, Data mining, AI, …
      -Nên xin việc với vị trí nào với những kiến thức hiện tại và hổ trợ đi theo định hướng data science. Vì em có xin làm một số vị trí database thì đa phần không gọi, khi gọi trao đổi thì họ cũng lắc đầu vì muốn người có background về IT: cũng giống như anh muốn làm CEO bên ngành kinh tế thì họ cũng sẽ lắc đầu thôi, ngoại trừ chính anh lập công ty hoặc có người quyen cho cơ hội làm việc, số còn lại họ sẽ ưu tiên các bạn bên chuyên ngành này. Lý do, thời gian đào tạo một chuyên ngành tốn nhiều thời gian, không có con đường tắt. Nếu học tiếp để lấy văn bằng 2 thì sẽ đảm bảo cho em hơn, hoặc em hãy xem ngành này như một đam mê bên ngoài công việc chính của mình, khi nào có cơ hội thì ứng dụng vào chính công việc của mình luôn, không nhất thiết mình phải làm đúng vai trò DS em nhé.

      Số lượt thích

      • Em cám ơn anh nhiều, hiện tại em đang vạch ra hướng đi cho mình như sau, anh cho em nhận xét nha:
        -Đăng ký một khóa học lấy bằng của aptech hoặc có thể là một khóa học online trên udacity. Cái này em đang phân vân.
        -Tự học machine learning(machinelearningcoban.com: tiếng việt và bài giảng tiếng anh của thầy andrew ng), em nghĩ đây là kiến thức nền tảng với người đi theo con đường này, skill:python for data science, SQL server, big data: hadoop, spark.
        -Em sẽ tiếp tục công việc hiện tại là data analyst để có thể tiếp xúc và làm việc nhiều với data.
        Đây là hướng đi sau khi em góp nhặt kiến thức trên internet, nên có thể có phần không hợp lý, nên em rất mong nhận được góp ý.
        “em hãy xem ngành này như một đam mê bên ngoài công việc chính của mình, khi nào có cơ hội thì ứng dụng vào chính công việc của mình luôn, không nhất thiết mình phải làm đúng vai trò DS em nhé.” Cám ơn lời khuyên rất hay này của anh ạ.

        Số lượt thích

  4. Chào anh. Hiện tại em đang muốn tìm hiểu nghành nghề Big Data này. A có thể tư vấn cho em được không ạ? Em nên bắt đầu từ đâu và hiện tại em đã ở con số 0. Chưa có kiến thức hay nền tảng về big data ạ. Em cám ơn anh

    Số lượt thích

    • Hi em, em có thể bắt đầu bằng các keyword sau:
      Cơ sở dữ liệu (MySQL, PostgreSQL, MongoDB).
      Ngôn ngữ truy vấn SQL.
      Thiết kế cơ sở dữ liệu (ràng buộc toàn vẹn, đại số quan hệ, các dạng chuẩn hoá dữ liệu).
      Truy xuất đồng thời.
      Mạng máy tính cơ bản (Zookeeper, Mesos, Chronos, Marathon, Jenkins)
      Business Intelligent – BI (OLAP, OLTP, Star/Snowflake schema).
      Hadoop file system
      Map Reduce
      Spark

      Lịch sử phát triển từ Paper notes > Flat file > Excel > SQL > BI > NoSQL > Big Data (text, video, image, voice, …) mỗi giai đoạn tương ứng với các keyword ở trên.

      Số lượt thích

  5. Hi anh,

    Em hiện tại đang là data analyst, xuất phát điểm của em là kinh tế chứ không phải công nghệ thông tin.
    Trong 1 lần tìm hiểu về data analyst em tìm được check list này
    http://1onjea25cyhx3uvxgs4vu325.wpengine.netdna-cdn.com/wp-content/uploads/2014/12/UdacityUltimateSkillChecklistForYourFirstDataAnalystJob.pdf
    Em có nên dựa theo check list này để bổ sung thêm những gì em còn thiếu hay không vì thật sự em chỉ có kiến thức về business, nếu theo check list này em thật sự không có cái nào cả. Và anh có thể tư vấn em nên ưu tiên cái gì trước hay không. Em cảm ơn ạ

    Số lượt thích

      • DS và ML trong mấy năm gần đây phát triển nhanh vượt sức tưởng tượng, ngày xưa học mấy món kiểu như trí tuệ nhân tạo thấy nó còn xa vời thực tếlắm, chắc chỉ có mấy ông giáo sư, học giả quan tâm tới thôi.

        Thời gian gần đây mình tìm đọc các topic về DS thì thấy rất cuốn hút, mình đi làm đã lâu, có rất nhiều kinh nghiệm phát triển ứng dụng với Oracle Database (query dữ liệu rất phức tạp, viết b.cáo, tối ưu hệ thống, query, thiết kế CSDL, viết pakage,….) , đã từng tham gia triển khai thành công 2 dự án ERP lớn. Mình sợ kiến thức, kinh nghiệm cũ sẽ thành lối mòn cản trở việc tư duy những thứ mới. Nếu chuyển sang làm DS, ML thì có trở ngại gì không, thứ tự những phần nào mình nên bắt đầu. Nhờ bạn tư vấn giùm 🙂

        Cảm ơn bạn rất nhiều!

        Số lượt thích

        • Chào bạn,

          Background bên DS thường có thêm Toán và ML cơ bản. Tuỳ mục tiêu mà bạn sẽ có những khó khăn khác nhau. Nếu tìm hiểu để biết sơ và sử dụng công cụ thì đọc một vài bài ở blog mình đã có thể start dự án được rồi. Nếu tìm hiểu sâu hơn thì ngoài kiến thức cơ bản còn đỏi hỏi nhiều thời gian nghiên cứu một domain của ML nào đó mà bạn quan tâm như Xử lý ảnh, Xử lý ngôn ngữ tự nhiên, Khai thác dữ liệu, …

          Số lượt thích

  6. Hi anh Xuân Hồng,
    Em hiện là sinh viên sắp bắt đầu vào năm 2 ngành CNTT. Em có tìm hiểu từ lâu và muốn theo làm về Big Data. Theo em đọc bên trên thì anh nói là cần ít nhất 3 năm để theo con đường này. Anh có thể tư vấn cho những kiến thức mà em cần trang bị, các bước học tập để sau 3 năm em ra trường có thể làm việc được với nó không ạ. Em cám ơn anh nhiều.

    Số lượt thích

  7. em chào anh
    em muốn hỏi anh một số điều được không anh
    background của em cũng là kinh tế như các anh bên trên
    nên em muốn hỏi thời gian anh ước lượng để học data analyst đến mức đi làm được là khoảng bao nhiêu ạ. Em rất băn khoăn về cái này trước khi quyết định dấn thân vào ngành này. Vì theo em được biết, càng ngày càng có nhiều vị trí vừa phải biết kiến thức kinh tế, vừa phải biết kiến thức về data để phân tích. Nên việc học và tìm hiểu thêm về data analyst là một lợi thế rất lớn.
    Kiến thức hiện tại của em thì chỉa có basic python thôi ạ.
    mong anh cho ý kiến về thời gian ước lượng để học ạ, liệu có kéo dài đến tận 3-4 năm không ạ

    Số lượt thích

    • Định hướng của Data Analyst là:
      – Thống kê ứng dụng tốt: descriptive analysis, dianogsis analysis, hypothesis testing, bayesian inferencial,…
      – Trực giác về dữ liệu tốt.
      – Thông thạo các công cụ: R, python, Excel.
      Từ đây, nhanh hay chậm là do khả năng của mỗi người. Có thể 1-2 tuần, 2-3 tháng hoặc 1 năm làm việc là cùng. Còn bằng cấp thì tuỳ chứng chỉ mà có thể từ 1-2 năm.
      Nhưng quan trọng nhất vẫn là sự may mắn: có người cho em cơ hội làm việc về nó. Hoặc tự em là chủ doanh nghiệp có thể tự phân tích số liệu của sản phẩm công ty mình chẳng hạn.
      Anh nghĩ kinh tế cũng khá chung chung, em nên chọn một lĩnh vực hẹp như quảng cáo, tín dụng, giám sát khách hàng, nghiên cứu đối thủ cạnh tranh, chứng khoán chẳng hạn để tập trung chuyên môn của mình.

      Số lượt thích

  8. Hi anh,

    Em đọc bài viết này của anh lần này không biết là lần thứ mấy rồi.
    Hiện em đang theo học Master of Data Science tại JVN. Mỗi lần lạc lối và hoang mang trong thế giới mênh mông của Data Science hay BigData là em lại tìm đến bài viết của anh để đọc và suy ngẫm những bước tiếp theo cần phải thực hiện trong hành trình cuộc đời mình. Để cảm thấy đỡ cô đơn hơn, để biết được con đường tiếp theo mình cần đi tiếp.

    Một bài viết xuất sắc, đầy trải nghiệm và hiểu rất rõ thị trường Việt Nam. Không biết nói gì hơn, cảm ơn anh nhiều lắm.

    Số lượt thích

Trả lời

Mời bạn điền thông tin vào ô dưới đây hoặc kích vào một biểu tượng để đăng nhập:

WordPress.com Logo

Bạn đang bình luận bằng tài khoản WordPress.com Đăng xuất / Thay đổi )

Twitter picture

Bạn đang bình luận bằng tài khoản Twitter Đăng xuất / Thay đổi )

Facebook photo

Bạn đang bình luận bằng tài khoản Facebook Đăng xuất / Thay đổi )

Google+ photo

Bạn đang bình luận bằng tài khoản Google+ Đăng xuất / Thay đổi )

Connecting to %s