Monday, April 1, 2013

Standard deviation and Standard error


SE = SD / sqrt (n)

 Phân biệt Standard deviation, Sample standard deviation và Standard error 

Quantitative method đề cập đến các khái niệm standard deviation (độ lệch chuẩn), sample standard deviation (độ lệch chuẩn mẫu hiệu chỉnh) và standard error (sai số chuẩn) để sử dụng Ước lượng khoảng tin cậy (Confident Interval) và Kiểm định (Hypothesis testing). Trong nhiều trường hợp, ngay cả trong các báo cáo nghiên cứu nhiều người vẫn dùng lẫn lộn các khái niệm này. Bài viết sẽ tìm hiểu một cách sơ lược ý nghĩa của các khái niệm trên.

          Độ lệch chuẩn là một đại lượng thống kê mô tả dùng để đo mức độ phân tán của một tập dữ liệu.


Từ tập hợp dữ liệu ta rút ra một mẫu, nếu ta coi đấy là một tập hợp thì công thức tính toán độ lệch chuẩn không có gì thay đổi. Tuy nhiên mục đích và các phương pháp được sử dụng trong thống kê học là để ước lượng các giá trị của tổng thể hay tập dữ liệu dựa trên các thông số khi thu thập mẫu. Chính vì vậy ta phải sử dụng độ lệch chuẩn mẫu hiệu chỉnh để ước lượng độ lệch chuẩn tổng thể.

          Độ lệch chuẩn mẫu hiệu chỉnh:
 
Thống kê học đã chứng minh rằng
+ Số bình quân mẫu   là ước lượng không chệch, hiệu quả và bền vững của số bình quân tổng thể chung   do đó có thể ước lượng trung bình tổng thể từ trung bình mẫu + Độ lệch chuẩn hoặc phương sai mẫu hiệu chỉnh là ước lượng không chệch, hiệu quả và bền vững của độ lệch chuẩn hoặc phương sai tổng thể nên có thể ước lượng Độ lệch chuẩn tổng thể từ độ lệch chuẩn mẫu hiệu chỉnh

          Sampling Distribution: Nếu chúng ta lặp lại việc chọn mẫu N lần (N vô cùng lớn) thì ta sẽ có một tập hợp N mẫu (mỗi mẫu gồm n phần tử) rút từ tổng thể chung. Giả sử ta đang khảo sát giá trị trung bình của tổng thể thì với N mẫu ta có N giá trị trung bình của mẫu đây chính là một sampling distribution của giá trị trung bình (Có thể coi đây là một tập hợp giá trị trung bình của các mẫu).

         Central limit theorem đã chứng minh rằng khi cỡ mẫu n tăng lên (n≥30) thì sampling distribution sẽ tiến tới normal probability distribution; Tập hợp này sẽ có giá trị trung bìnhtiệm cận giá trị trung bình   của tổng thể ban đầu và phương sai tiệm cận ∂2/n (∂ là độ lệch chuẩn của tổng thể ban đầu)

         Standard error (sai số chuẩn) chính là độ lệch chuẩn của tập hợp mẫu sau khi được sampling. Sai số chuẩn là độ lệch chuẩn của giá trị trung bình trong N lần chọn mẫu. Vì vậy sai số chuẩn phản ánh độ dao động hay biến thiên của các số trung bình mẫu
                     Standard error = ∂/√n (Trong trường hợp ∂ của tổng thể đã biết)
Trong trường hợp ∂ của tổng thể chưa biết thì ta sử dụng Độ lệch chuẩn mẫu hiệu chỉnh để ước lượng Độ lệch chuẩn của tổng thể
                      Standard error = s/√n
          CFA sử dụng 2 công thức để ước lượng standard error với 2 kí hiệu khác nhau nhưng không phải có 2 loại standard error mà chỉ có một khái niệm. Nhiều tài liệu khác chỉ sử dụng duy nhất một ký hiệu cho 2 cách tính

       Central limit theorem cho ta một kết luận rất quan trọng nữa là sampling distribution sẽ có dạng normal probability distribution nên ta có thể sử dụng các đặc tính của normal probability distribution để ước lượng khoảng tin cậy giá trị trung bình của sampling distribution hay đây chính là ước ượng khoảng tin cậy giá trị trung bình của tổng thể.


� ^ < p h�� x � tyle='margin:0cm;margin-bottom:.0001pt;text-align:justify;orphans: auto; text-align:start;widows: auto;-webkit-text-size-adjust: auto;-webkit-text-stroke-width: 0px; word-spacing:0px'> 

3 comments:

  1. bài viết rất chi tiết và chính xác. Cảm ơn anh rất nhiều!!!

    ReplyDelete
  2. Hiện tại bạn có sw nào hay gửi tặng cho mình 1 con ko ạ mail: 1boyvungtau@gmail.com

    ReplyDelete