Đường cong chuông và định nghĩa phân phối chuẩn

Thuật ngữ đường cong hình chuông được sử dụng để mô tả khái niệm toán học được gọi là phân phối chuẩn, đôi khi được gọi là phân phối Gaussian. “Đường cong hình chuông” đề cập đến hình chuông được tạo khi một đường được vẽ bằng cách sử dụng các điểm dữ liệu cho một mục đáp ứng các tiêu chí của phân phối chuẩn.

Trong một đường cong hình chuông, tâm chứa số giá trị lớn nhất và do đó, nó là điểm cao nhất trên cung của đường. Điểm này được gọi là giá trị trung bình, nhưng nói một cách đơn giản, nó là số lần xuất hiện cao nhất của một phần tử (theo thuật ngữ thống kê là chế độ).

Điều quan trọng cần lưu ý về phân phối bình thường là đường cong tập trung ở trung tâm và giảm ở hai bên. Điều này quan trọng ở chỗ dữ liệu ít có xu hướng tạo ra các giá trị cực đoan bất thường, được gọi là giá trị ngoại lệ, so với các phân phối khác. Ngoài ra, đường cong hình chuông biểu thị rằng dữ liệu đối xứng. Điều này có nghĩa là bạn có thể tạo ra những kỳ vọng hợp lý về khả năng một kết quả sẽ nằm trong phạm vi bên trái hoặc bên phải của trung tâm, sau khi bạn đã đo lường mức độ sai lệch có trong dữ liệu. Điều này được đo lường theo độ lệch chuẩn .

Đồ thị đường cong hình chuông phụ thuộc vào hai yếu tố: giá trị trung bình và độ lệch chuẩn. Giá trị trung bình xác định vị trí của tâm và độ lệch chuẩn xác định chiều cao và chiều rộng của chuông. Ví dụ: độ lệch chuẩn lớn tạo ra hình chuông ngắn và rộng trong khi độ lệch chuẩn nhỏ tạo ra đường cong cao và hẹp.

Để hiểu các yếu tố xác suất của phân phối chuẩn, bạn cần hiểu các quy tắc sau:

  1. Tổng diện tích dưới đường cong bằng 1 (100%)
  2. Khoảng 68% diện tích dưới đường cong nằm trong một độ lệch chuẩn.
  3. Khoảng 95% diện tích dưới đường cong nằm trong hai độ lệch chuẩn.
  4. Khoảng 99,7% diện tích dưới đường cong nằm trong ba độ lệch chuẩn.

Các mục 2, 3 và 4 ở trên đôi khi được gọi là quy tắc thực nghiệm hoặc quy tắc 68–95–99.7. Khi bạn xác định rằng dữ liệu được phân phối chuẩn (hình chuông cong) và tính toán giá trị trung bình và độ lệch chuẩn, bạn có thể xác định xác suất mà một điểm dữ liệu sẽ nằm trong một phạm vi khả năng nhất định.

Một ví dụ điển hình về đường cong hình chuông hoặc phân phối chuẩn là tung hai con xúc xắc. Phân phối tập trung vào số bảy và xác suất giảm khi bạn di chuyển ra khỏi trung tâm.

Đây là phần trăm cơ hội của các kết quả khác nhau khi bạn gieo hai viên xúc xắc.

  • Hai: (1/36) 2,78%
  • Ba: (2/36) 5,56%
  • Bốn: (3/36) 8,33%
  • Năm: (4/36) 11,11%
  • Sáu: (5/36) 13,89%
  • Bảy: (6/36) 16,67% = kết quả rất có thể xảy ra
  • Tám: (5/36) 13,89%
  • Chín: (4/36) 11,11%
  • Mười: (3/36) 8,33%
  • Mười một: (2/36) 5,56%
  • Mười hai: (1/36) 2,78%

Phân phối chuẩn có nhiều đặc tính thuận tiện, do đó, trong nhiều trường hợp, đặc biệt là trong vật lý và thiên văn học, các biến ngẫu nhiên với phân phối chưa biết thường được coi là chuẩn để cho phép tính toán xác suất. Mặc dù đây có thể là một giả định nguy hiểm, nhưng nó thường là một phép tính gần đúng tốt do một kết quả đáng ngạc nhiên được gọi là định lý giới hạn trung tâm .

Định lý này nói rằng giá trị trung bình của bất kỳ tập hợp biến thể nào với bất kỳ phân phối nào có giá trị trung bình hữu hạn và phương sai có xu hướng xảy ra trong phân phối chuẩn. Nhiều thuộc tính phổ biến như điểm kiểm tra hoặc chiều cao tuân theo phân phối gần như bình thường, với một số thành viên ở mức cao và thấp và nhiều thành viên ở mức trung bình.

Có một số loại dữ liệu không tuân theo mẫu phân phối bình thường. Các bộ dữ liệu này không nên bị buộc phải cố gắng khớp với đường cong hình chuông. Một ví dụ điển hình là điểm của học sinh, thường có hai chế độ. Các loại dữ liệu khác không theo đường cong bao gồm thu nhập, tăng dân số và hỏng hóc máy móc.

Đọc Thêm:  Góc nhọn nhỏ hơn 90 độ

Viết một bình luận