RECAP HỘI THẢO DATA ANALYTICS: Phần 1 TỔNG QUAN về Data Analytics

Chiều Chủ nhật vừa qua hẳn là một buổi chiều thú vị với các bạn tham gia hội thảo Data Analytics (DA) cùng hai khách mời vô cùng tài năng Nghiêm Hoàng Linh và Lê Minh Hòa. Những chia sẻ chân thành của hai anh về con đường sự nghiệp, hiểu biết và kinh nghiệm trong ngành cho mọi người cái nhìn toàn diện hơn về lĩnh vực mới mẻ này cũng như triển vọng phát triển của DA tại Việt Nam.

Bạn hiểu và sử dụng Data Analytics như thế nào ?

Hãy dành vài phút trả lời câu hỏi đó và tiếp tục đọc phần Recap của chúng mình để xem DA có thực sự như bạn tưởng ?!

Data Analytics là gì? : Là khoa về các quá trình phân tích dữ liệu để phát hiện ra các mẫu dạng các tương quan và thông tin có giá trị để đưa ra quyết định tốt hơn.

Hội thảo Data Analytics tổ chức bởi Career Me

Lấy một ví dụ đơn giản thế này

Phân tích giỏ hàng hóa của người tiêu dùng khi mua sữa họ sẽ mua gì đi kèm ta được 71% mua bánh mỳ, 43% mua sữa và 29% sẽ mua kèm giấy vệ sinh.Như vậy,các siêu thị / nhà bán lẻ sẽ sắp xếp các mặt hàng này gần nhau, nhằm mục đích tạp ra nhiều lợi nhuận hoặccáp dụng cho giảm giá 1 trong 2 mặt hàng

Data Analytics gồm những phần nào?

Kĩ thuật và phương pháp (Academic): Tất cả các chương trình đào tạo đều tập trung rất nhiều vào kĩ thuật và phương pháp nghiên cứu gồm: Thống kê/ xác suất, Machine learning và Data Mining.

Triển khai(Áp dụng) :Computing Power.– Các công ty / doanh nghiệp sẽ tập trung vào phần triển khai để hướng tới diễn giải số liệu như sử dụng Excel / SPSS, lập trình (Programming / Engineering…), hạ tầng (Infrastructure)

Chuyên môn trong: hiểu / diễn giải kết quả → Báo cáo→ Đưa ra quyết định

Data Analytics có quy trình như thế nào?

Case Study: Phân tích chứng khoán

Vấn đề thường gặp nhất khi lấy dữ liệu là Missing Value. Ví dụ: Bạn cần số liệu của 10 công ty trong 10 năm; công ty thứ 10 chỉ có dữ liệu cho 6 năm Trong quy trình lấy thông tin, lấy được càng nhiều thông tin càng tốt; khả năng tìm ra insights càng cao

Problem: Bạn sẽ băn khoăn chọn ngành nào để đầu tư?, Nên kỳ vọng lãi suất bao nhiêu? Nên đầu tư dài hạn hay ngắn hạn? Rủi ro là bao nhiêu?,…phải không nào. Đừng vội vàng đi vào chi tiết như vậy, một nhà đầu tư chuyên nghiệp sẽ đặt các câu hỏi chung, ví dụ như: cổ phiếu tốt sẽ có những đặc điểm gì? (Signals) và nên phân bổ nguồn tiền như thế nào? (Allocation).

Plan:

Tín hiêu đó được đo lường (measurement) và lấy từ đâu (sources) là những yếu tố cực kì quan trọng trong bước này. Trở lại ví dụ, chỉ số ROI có được từ Website công ty; sàn chứng khoán; các bên thứ 3(công ty chứng khoán / Công ty kiểm toán….) Lưu ý, khi làm Data Analytics, cần thống nhất giữa agency và client: nên lấy từ 1 nguồn hay nhiều nguồn; và lấy từ những nguồn nào.

Data: Các vấn đề thường gặp khi thu thập thông tin

Vấn đề thường gặp nhất khi lấy dữ liệu là Missing Value. Ví dụ: Bạn cần số liệu của 10 công ty trong 10 năm; công ty thứ 10 chỉ có dữ liệu cho 6 năm

Trong quy trình lấy thông tin, lấy được càng nhiều thông tin càng tốt; khả năng tìm ra insights càng cao

Analytics:

Communication rất quan trọng: bạn cần giải thích tất cả quá trình bạn thực hiện xử lý dữ liệu, và chứng minh kết luận bạn đưa ra là có giá trị

Conclusion: Đưa ra kết luận từ những phân tích đã thực hiện.

ỨNG DỤNG CỦA Data Analytics

Ứng dụng trong Kinh doanh: Phân tích tài chính/ chứng khoán, nghiên cứu thị trường, phát hiện bất thường trong giao dịch

Ứng dụng trong Giải trí: Phân loại email, đề xuất video, chèn quảng cáo,..

Ứng dụng trong Y học: Chuẩn đoán bệnh tật, tìm ra vị trí khối u, tìm ra phương pháp điều trị mới,..

Ứng dụng trong Công nghệ: Dịch đa ngôn ngữ (Google / Bing Translate), tìm kiếm nội dung (Google / Bing / Yahoo search),sử dụng dữ liệu từ mạng xã hội để phân tích trạng thái / thái độ của người tiêu dùng, thương mại điện tử: thu thập phản hồi khách hàng và ghi lại hành vi tiêu dùng của khách hàng, sừ dữ liệu hình ảnh, chuyển sang quy trình Data Analytics, ứng dụng vào việc tag ảnh tự động (pattern recognition),trợ lý ảo: Siri, robot trả lời tự động trong phần chat với khách hàng trên website thương mại…

Case study:Quy trình xử lý dữ liệu trong xử lý video trên Youtube

Với mục đích cá nhân hóa cho từng khách hàng sao cho họ sử dụng dịch vụ của mình càng nhiều càng tốt, Youtube sử phương pháp-kĩ thuật cũng như hạ tầng công nghệ ( Big Data, cloud computing, Internet of things,..) để thu tập Data về người dùng từ thông tin cá nhân, thiết bị sử dụng, thời gian sử dụng, video yêu thích cho đến cả nhiệt trỏ chuột (?!). Qua phân tích dữ liệu video, một số kết luận có thể đưa ra

  • Đưa ra Top-30 video có điểm dự đoán cao nhất để gợi ý cho từng người dùng
  • Thu nhận thêm dữ liệu từ phản hồi của người dùng để cải thiện (tự động) mô hình hiện tại

Theo dõi hoạt động của hệ thống trong một khoảng thời gian để có đánh giá chân thực cho mục tiêu kinh doanh ban đầu

  • Thử nghiệm cải thiện mới? Thông tin mới? Tính năng mới? Hệ thống mới? … ⇒ tiếp tục vòng quay

Bởi vậy bạn đừng ngạc nhiên vì sự thông minh ‘quá đáng’ của máy tính khi  gợi ý bạn một trang mua sắm cực cool cho các ‘quý cô’ hay một video cực hay về mẫu tablet mới nhất cho những tín đồ công nghệ. Và  rất dễ dàng để bạn rút hầu bao chi cho những sản phẩm  thời thượng đó phải không nào.

comments