Tứ phân vị là gì?
Tứ phân vị là một khái niệm trong thống kê, được đề cập trong sách giáo trình toán lớp mới. Tứ phân vị của một tập dữ liệu gồm ba giá trị. Khi sắp xếp tập dữ liệu theo thứ tự tăng dần, ba giá trị này chia tập dữ liệu thành bốn phần bằng nhau.
Ví dụ:
Giả sử chúng ta có tập dữ liệu sau đây: [1, 3, 4, 6, 7, 8, 9, 11, 12, 15].
Đầu tiên, ta sắp xếp tập dữ liệu theo thứ tự tăng dần: [1, 3, 4, 6, 7, 8, 9, 11, 12, 15].
Tiếp theo, chia tập dữ liệu thành bốn phần bằng nhau:

- Phần 1: [1, 3, 4], tứ phân vị 25%.
- Phần 2: [6, 7, 8], tứ phân vị 50%.
- Phần 3: [9, 11, 12], tứ phân vị 75%.
- Phần 4: [15].
Độ trải giữa (khoảng tứ phân vị) là gì?
Độ trải giữa, hay còn gọi là khoảng tứ phân vị, là một đại lượng đo lường mức độ phân tán của tập dữ liệu. Nó được tính bằng hiệu của giá trị tứ phân vị thứ ba và tứ phân vị đầu tiên.
Ví dụ:
Từ ví dụ trước, giá trị tứ phân vị thứ ba là 11 và tứ phân vị đầu tiên là 4. Do đó, độ trải giữa của tập dữ liệu là 11 – 4 = 7.
Giá trị bất thường là gì?
Giá trị bất thường, hay còn được gọi là giá trị ngoại lệ, là các điểm dữ liệu có giá trị khác biệt đáng kể so với phần còn lại của tập dữ liệu. Những giá trị này thường không tuân theo quy luật chung của dữ liệu và có thể gây ảnh hưởng đáng kể đến kết quả thống kê.
Ví dụ:
Trong tập dữ liệu [1, 3, 4, 6, 7, 8, 9, 11, 12, 15], giá trị 1 là một giá trị bất thường vì nó rất khác biệt so với các giá trị khác trong tập dữ liệu.
Bài viết này đã giới thiệu với bạn những khái niệm căn bản về tứ phân vị, độ trải giữa và giá trị bất thường trong thống kê. Hy vọng rằng bạn đã hiểu rõ hơn về những khái niệm này và cách áp dụng chúng trong phân tích dữ liệu.