(How to find and visualize right charts using Python)
Đọc dữ liệu từ file excel, sql thông qua pandas. Cấu trúc dữ liệu có dạng bảng table. Đối với một dữ liệu thô làm thế nào để có thể hiểu nó một cách trực quan hóa hơn.
Trực quan hóa dữ liệu là gì?
Tại sao phải trực quan hóa dữ liệu?
Khả năng đọc hiểu dữ liệu trên hình ảnh, video sẽ tốt hơn là dữ liệu đọc, thô.
Trực quan hóa dữ liệu lên để có thể phân tích được insight. Từ insight đó mình có thể phân tích được data đó có tính xu hướng, tương quan như thế nào. Sau đó mình sẽ tới bước feature engineering để có thể hiểu được feature nào nó có thể phù hợp với mô hình AI của mình.
Bước phân tích data thông qua bước trực quan hóa dữ liệu là EDA-Exploratory Data Analysis,
Tương quan nghịch: chi phí tăng lợi nhuận giảm, giá vàng tăng và số lượng bán ra, …
Distribution:
Comparison:
Composition:
Khi nhận data về thì mình cần góc nhìn tổng quan trước data cần phân tích
df.describe():