Phần 7: Biểu đồ Phân tán
1.Hiểu được mục đích sử dụng Cheksheet
2. Sử dụng đúng loại lưu đồ tùy tình huống
3. Thiết lấp được checkheet kết quả thông qua ví dụ minh học
Tổng quan
Biểu đồ phân tán hoặc sơ đồ phân tán được sử dụng để điều tra mối quan hệ có thể có giữa hai biến mà cả hai đều liên quan đến cùng một sự kiện. Biểu đồ phân tán cung cấp cho bạn biểu diễn trực quan về các mối quan hệ có thể được xác nhận thông qua phân tích hồi quy tương quan.
Sơ đồ phân tán rất hữu ích để khám phá nguyên nhân gốc rễ. Mặc dù chúng không chỉ ra nguyên nhân và kết quả một cách cụ thể, nhưng được sử dụng với các bằng chứng khác thì nguyên nhân và kết quả có thể được ngụ ý. Biểu đồ phân tán thường được tạo bằng phần mềm thống kê, chẳng hạn như Many Tab, Excel hoặc một số ứng dụng bảng tính khác, nhưng chúng dễ dàng được vẽ bằng tay. Biến độc lập, biến mà bạn nghĩ có thể là nguyên nhân, là trục y hoặc trục tung. Biến phụ thuộc, biến mà bạn đang cố sửa, là trục x hoặc trục hoành. Đối với mọi sự kiện hoặc sự kiện, hai phần dữ liệu được báo cáo. Một cho biến độc lập và một liên quan cho biến phụ thuộc.
Dữ liệu được ghi theo cặp x, y. Mỗi điểm trên đồ thị đại diện cho các cặp giá trị của x và y.
Trong ví dụ đơn giản này, chúng tôi sẽ chỉ sử dụng ba cặp dữ liệu. Chúng tôi đã tạo một bảng hoặc bảng tính với các cột có nhãn x và y.
Mỗi cặp dữ liệu được vẽ trên một biểu đồ. Hãy nhớ rằng giá trị y phải thẳng hàng với điểm thích hợp trên trục y và giá trị x phải thẳng hàng với điểm tương ứng trên trục x. Ví dụ: cặp đầu tiên của chúng tôi là x = 4 và y = 2. Chúng tôi chọn một điểm ngay phía trên giá trị trục x là 4 và ngay bên phải giá trị trục y là 2. Sau đó, chúng tôi vẽ một điểm tại điểm này. Quá trình này được lặp lại cho mọi cặp dữ liệu x, y.
Ví dụ của chúng tôi chỉ hiển thị 3 cặp dữ liệu nhưng một biểu đồ phân tán hữu ích có thể sẽ chứa ít nhất 30 cặp.
Nếu các điểm trên một biểu đồ phân tán tập trung trong một dải chạy từ phía dưới bên trái lên phía trên bên phải, thì có một mối tương quan tích cực. Nghĩa là khi x tăng thì y tăng. Đây là điều kiện trong biểu đồ ở đầu trang chiếu. Nếu các điểm tập trung trong một dải từ phía trên bên trái xuống phía dưới bên phải, thì có một mối tương quan nghịch. Nghĩa là khi x tăng thì y giảm.
Nếu các điểm có xu hướng gần với đường thẳng, điều này cho thấy mối quan hệ bền chặt. Nghĩa là, khi x tăng, y tăng tỷ lệ thuận.
Càng nhiều điểm tập hợp chặt chẽ xung quanh một đường tưởng tượng phù hợp nhất, thì mối quan hệ tồn tại giữa hai biến càng mạnh mẽ. Nếu các điểm dường như không thiết lập bất kỳ hướng cụ thể nào, thì có thể không có mối quan hệ nào cả.
Đây là một số ví dụ thực tế. Trong sơ đồ phân tán này, dường như có một mối quan hệ tích cực giữa điểm SAT và điểm trung bình của các lớp đại học. Nó tích cực nhưng nó không mạnh lắm.
Biểu đồ phân tán này cho thấy mối quan hệ giữa số giờ làm việc mỗi tuần và điểm trung bình của sinh viên đại học. Có lẽ không có gì đáng ngạc nhiên khi số giờ tăng lên, điểm trung bình giảm xuống nhưng cuối cùng lại có một sự gia tăng đáng ngạc nhiên. Sinh viên làm việc hơn 40 giờ một tuần dường như làm tốt hơn những sinh viên làm việc 20 đến 40 giờ một tuần.
Cho đến nay chúng ta đã nói về các mối quan hệ tuyến tính. Nghĩa là, chúng dường như đi theo một đường thẳng nhưng không phải lúc nào cũng vậy. Đôi khi các mối quan hệ đi theo một đường cong.
Giống như biểu đồ, biểu đồ phân tán cung cấp ảnh chụp nhanh hữu ích. Điều quan trọng cần nhớ là đây chỉ là ảnh chụp nhanh.
Phân tích kết luận hơn có thể được thực hiện với tương quan và hồi quy. Tương quan cho bạn biết liệu có mối quan hệ nào giữa hai biến hay không. Chúng ta có thể biết mối quan hệ bền chặt đến mức nào nhưng chúng ta không biết liệu x có gây ra y, liệu y có gây ra những thay đổi trong x hay không, hay liệu có điều gì khác gây ra những thay đổi trong cả hai.
Nếu chúng ta muốn biết nhiều hơn, chúng ta cần phân tích nhiều hơn. Phân tích tương quan và hồi quy là một chủ đề cho các khóa học trong tương lai nhưng hiện tại, chỉ cần biết rằng tương quan cho bạn biết hướng đi và sức mạnh của một mối quan hệ là đủ. Một mối tương quan sẽ là một số giá trị giữa -1 và +1. Tương quan +1 cho thấy mối quan hệ tích cực hoàn hảo. Tức là, tất cả các điểm sẽ nằm ngay trên đường thẳng. Tương quan -1 biểu thị mối quan hệ phủ định hoàn hảo và tương quan bằng 0 nghĩa là không có mối quan hệ đáng kể nào giữa x và y.
Phân tích hồi quy sẽ cho bạn biết bản chất của mối quan hệ giữa biến độc lập và biến phụ thuộc và hồi quy cho phép bạn tạo và kiểm tra phương trình dự đoán.
Đọc: https://www.datylon.com/blog/scatter-plot-deep-dive#:~:text=Michael%20Friendly%20and%20Daniel%20Denis,and%20the%20year%20of%20measurement.
Video: https://www.youtube.com/watch?v=5GihhMCPucg&list=PL55ZwvYHxcu2QqhSl-NwKvIF8kUeww-JB
Phân loại:
Strong correlation\ Positive Correlation
Moderate correlation\ Negative Correlation
No correlation\ No Correlation
https://ppcexpo.com/blog/what-is-scatter-diagram https://www.youtube.com/watch?v=Dkn1eAJApUU
Thiết lập: https://www.youtube.com/watch?v=5GihhMCPucg&t=80s
Interview:
Quiz: