Hai thuật ngữ Phân tích Dữ liệu (Data Analyst) và Mô hình hóa Dữ liệu (Data Visualization) ngày nay trở nên khó phân biệt trong ngôn ngữ thường ngày của một cộng đồng rộng lớn người làm về dữ liệu.
Một lượng lớn các quảng cáo việc làm tập trung vào kĩ năng Mô hình hóa Dữ liệu trong khi không thực sự đề cao tầm quan trọng của kĩ năng Phân tích Dữ liệu. Các tiêu đề việc làm phản ảnh xu hướng này xuất hiện các vai trò mới “Nghệ sĩ Dữ liệu”, “Cuyên gia mô hình hóa dữ liệu” và “Người kể chuyện Dữ liệu”. Nhưng các tổ chức vẫn đang tìm kiếm những người có thể trích xuất giá trị từ dữ liệu của họ. Vì vậy vị trí này cần bao gồm cả kĩ năng phân tích dữ liệu.
So sánh phân tích dữ liệu và mô hình hóa dữ liệu
Phân tích Dữ liệu là một quá trình khám phá, thường bắt đầu với các câu hỏi cụ thể. Nó đòi hỏi người nghiên cứu phải có sự tò mò, mong muốn tìm ra câu trả lời và sự kiên nhẫn, bởi những câu trả lời đó không phải lúc nào cũng dễ dàng tìm ra.
Mô hình hóa Dữ liệu liên quan đến việc biểu diễn dữ liệu một cách trực quan, gồm các biểu đồ đơn đến các Bảng phân tích Dữ liệu toàn diện. Mô hình hóa Dữ liệu hiệu quả làm giảm đáng kể lượng thời gian cần thiết để người đọc xử lý và tiếp nhận những thông tin có giá trị.
Phân tích Dữ liệu đã được mô hình hóa (Visual analytics) trong quá trình phân tích
Tuy khác biệt nhưng đây lại là hai công việc khó có thể tách rời. Khi làm việc với dữ liệu, cần phải phân tích trước khi mô hình hóa chúng. Tuy nhiên, Phân tích Dữ liệu đã được mô hình hóa lại là một phương pháp tuyệt vời để việc phân tích trở nên hiệu quả hơn.
Phân tích Dữ liệu đã được mô hình hóa liên quan đến quá trình xây dựng các biểu đồ dựa trên dữ liệu đã có để cung cấp cho bạn các thông tin đa dạng. Điều này giúp bạn xác định được bố cục, thông tin còn thiếu, xu hướng và các dữ liệu hữu ích để đảm bảo việc phân tích được sâu hơn.
Hình 1: Mô phỏng quá trình Phân tích Dữ liệu hoàn chỉnh.
Ở phía bên trái là quá trình phân tích, nghiên cứu và khám phá trực quan. Càng về phía bên phải, điều này càng trở nên rõ ràng và sáng tỏ hơn. Khi kết thúc quá trình, đầu ra là mọi thông tin đã được phân tích hoàn chỉnh.
Vai trò của Bảng phân tích Dữ liệu (Dashboard)
Trong công việc, dù là một nhà phân tích dữ liệu hay chuyên gia trực quan hóa dữ liệu, bạn có xu hướng tạo ra các Bảng phân tích Dữ liệu cho khách hàng. Vậy vai trò của Bảng phân tích Dữ liệu trong toàn bộ quá trình phân tích là gì?
Nhiều người cho rằng sản phẩm cuối cùng sẽ trả lời tất cả các câu hỏi của họ. Tuy nhiên, tôi cho rằng Bảng phân tích Dữ liệu chỉ là điểm khởi đầu cho những thảo luận và phân tích sâu hơn.
Sử dụng Bảng phân tích Dữ liệu, Infographic hoặc Câu chuyện Dữ liệu có thể là một phương pháp tuyệt vời và hiệu quả để truyền đạt ý tưởng. Dù vậy, vai trò của Bảng phân tích liệu không nên dừng lại ở đó. Khi mà các khách hàng của bạn làm việc với bảng Phân tích Dữ liệu, bản in của báo cáo hoặc ảnh chụp màn hình họ đã nhận được qua email, đó là khi các cuộc thảo luận tiếp theo sẽ diễn ra. Nó không nên là điểm cuối cùng.
Nhìn vào bảng Phân tích Dữ liệu Bán hàng & Lợi nhuận dưới đây được thực hiện bởi Ann Jackson. Đây là một bản tóm tắt trực quan, dữ liệu được thiết kế rõ ràng, cho thấy các thay đổi theo thời gian, sự khác biệt về địa lý, tổn thất bởi các loại sản phẩm nhất định và tóm tắt các chỉ số hiệu suất chính dưới dạng số.
Hình 2: Ví dụ về Bản phân tích Dữ liệu Bán hàng và Lợi nhuận
Đặt trường hợp, một nhà Phân tích Dữ liệu, ở đây là Ann, đưa cho khách hàng bảng Bảng phân tích Dữ liệu và thế là công việc của cô ấy đã hoàn thành? Không, bởi bây giờ các cuộc thảo luận mới thực sự bắt đầu. Ann có thể ngồi với khách hàng của mình và đi sâu vào chi tiết để khám phá lý do tại sao một số kết quả nhất định xuất hiện và xác định các cơ hội để cải thiện hiệu quả kinh doanh. Ngoài việc đưa ra bảng phân tích dữ liệu, việc nghiên cứu sâu hơn về dữ liệu, phân tích nó cùng với khách hàng của bạn, đó là giá trị gia tăng mà bạn đem lại với tư cách là nhà phân tích dữ liệu. Bảng phân tích dữ liệu cung cấp cho bạn nền tảng tuyệt vời cho các cuộc thảo luận tiếp theo với khách hàng.
Không dừng lại ở việc mô hình hóa
Một lời khuyên tôi đã chia sẻ với nhiều nhà phân tích là không chỉ dừng lại ở việc trực quan hóa dữ liệu, bạn cần phải thể hiện cả những hiểu biết sâu sắc và kỹ năng phân tích.
Nhiều công cụ giúp việc trực quan hóa dữ liệu trở nên dễ dàng và nhanh chóng. Vai trò của một Nhà Phân tích là đảm bảo rằng thông tin họ trình bày có thể truy cập được, dễ hiểu và rõ ràng. Tôi đặc biệt khuyến khích bạn đưa những phát hiện của bạn vào các câu, chú thích, tiêu đề và phụ đề để hướng dẫn khách hàng hiểu được báo cáo hoặc bảng phân tích dữ liệu cho dù khả năng hiểu biết dữ liệu của họ ở mức độ nào đi chăng nữa.
Hãy tự hỏi mình câu hỏi: những kết luận của tôi có dễ hiểu đối với người không trải qua quá trình phân tích và nghiên cứu tương tự với bộ dữ liệu này không?
Nhìn vào Mô hình Dữ liệu này của Justin Davis. Justin đã tạo ra hai biểu đồ và làm rõ chúng bằng cách nêu những phát hiện của mình trong phần giải thích. Anh ta không sử dụng tiêu đề cho mỗi biểu đồ, nhưng việc làm rõ đã đảm bảo rằng khách hàng của anh ta không cần tự phân tích, thay vào đó có thể nhanh chóng nắm bắt thông tin được trình bày. Sau đó, họ có thể đặt thêm câu hỏi.
Hình 3: Infographic Phân tích Dữ liệu của Justin Davis
Một ví dụ tuyệt vời khác đến từ Jenna DeVries, người đã tạo ra một mô hình đơn giản về giá bia tại giải Bóng chày Major League.
Việc thêm các chú thích trong hình ảnh giúp khách hàng của cô ấy hiểu được những phát hiện quan trọng, nắm bắt được thông tin, và cũng cho thấy Jenna không chỉ đưa ra một biểu đồ mà là cả một quá trình phân tích dẫn đến các mô hình để đưa ra kết luận tốt nhất.
Hình 4: Mô hình giá bia ở giải Bóng chày Major của Jenna DeVries
Hãy show ra các Phân tích của bạn đi nào !
Phân tích dữ liệu và mô hình hóa dữ liệu có thể là các hoạt động khác nhau, nhưng thực chất chúng liên kết và hỗ trợ lẫn nhau.
Khi bạn làm việc với dữ liệu, xây dựng bảng phân tích dữ liệu tiếp theo, tôi khuyến khích bạn suy nghĩ thêm về cách bạn có thể kết hợp hiệu quả hơn những phát hiện của mình. Làm thế nào để đưa ra những phát hiện quan trọng cho khách hàng theo cách dễ tiếp cận nhất với họ?
Một thiết kế mô hình dữ liệu tốt và hiệu quả là rất tốt nhưng bạn có nguy cơ mất khách hàng nếu thông tin bị ẩn đi và khách hàng không tiếp nhận được.
Bài viết được dịch từ bài đăng của tác giả Eva Murray trên Forbes. Link: https://www.forbes.com/sites/evamurray/2019/03/29/what-is-the-difference-between-data-analysis-and-data-visualization/