Monday, March 16, 2015

Sai lầm loại I, loại II và Power


Thống học một phương pháp khoa học có mục đích phát hin, hay đi tìm những cái có thể gộp chung li bng cụm từ chưa được biết” (unknown).  Cái chưa được biết đây là những hin tượng cng ta không quan sát đưc, hay quan sát được nhưng không đy đủ.  Cái chưa biết có thể một n số (như chiu cao trung nh người Vit Nam, hay trng lượng một phn tử), hiu quả của một thut điu tr, tỉ lệ lưu hành (prevalence), tỉ lệ phát sinh (incidence) của bnh, v.v… Chúng ta có th đo chiu cao, hay tiến hành xét nghim để biết hiu quả của thuốc, nhưng các nghiên cứu như thế chỉ được tiến hành tn một nhóm đối tượng, chứ không phi toàn bộ qun thể của dân số. Vn đề sử dụng kết quả của một nhóm đối tượng đ suy lun cho mt qun thể lớn hơn.  Mục đích ca ước tính c mu tìm số lượng đối tượng sao cho suy lun đó đt độ chính xác cao nht và đy đủ nht.


mức độ đơn gin nht, những cái chưa biết này có thể xut hin dưới hai hình thức: hoc có, hoc không. Chng hn như một thut điu tr có hay không có hiu quả chống gãy xương.  Bởi không ai biết hin tượng một cách đy đủ, cng ta phi đt ra gi thiết.  Giả thiết đơn gin nht gi thiết đảo (hin tượng không tồn ti, hiu Ho) gi thiết chính (hin tượng tồn ti, kí hiu Ha).


Chúng ta s dụng c phương pháp kim đnh thng kê (statistical test) như kim đnh t, F, z, χ2, v.v… đ đánh giá khả năng của gi thiết.  Kết quả ca một kim đnh thống kê có thể đơn gin chia thành hai g tr: hoc có ý nghĩa thng kê (statistical significance), hoc không có ý nghĩa thng kê (non-significance).  Có ý nghĩa thống kê ở đây thường dựa vào tr số P: thông thường, nếu P < 0.05, cng ta phát biu kết qu có ý nghĩa thống kê; nếu P > 0.05 chúng ta nói kết quả không có ý nghĩa thống kê.  Cũng có thể xem có ý nghĩa thống hay không có ý nghĩa thống kê như có tín hiu hay không có tín hiu.  Hãy tm đt hiu T+ kết quả có ý nghĩa thống kê, T- là kết quả kim đnh không có ý nghĩa thống kê.


Hãy xem xét một dụ c th: để biết thuốc risedronate có hiu quả hay không trong vic điu tr loãng xương, chúng ta tiến hành một nghiên cứu gồm 2 nhóm bnh nhân (một nhóm được điu tr bng risedronate một nhóm chỉ sử dụng giả dược placebo).  Cng ta theo dõi thu thp số liu gãy xương, ước tính tỉ lệ gãy xương cho từng nhóm, so sánh hai tỉ lệ bng một kim đnh thống kê.  Kết quả kim đnh thống kê hoc là có ý nghĩa thng kê (P<0.05) hay không có ý nghĩa thống (P>0.05).  Xin nhc li rằng cng ta không biết risedronate tht sự có hiu nghim chng gãy xương hay không; cng ta chỉ có thể đt giả thiết.  Do đó, khi xem xét một giả thiết kết quả kim đnh thống kê, cng ta có bốn tình huống:


(a) Giả thuyết Ha đúng (thuốc risedronate có hiu nghim) kết qu kim đnh thống kê P<0.05.
(b) Giả thuyết Ha đúng, nhưng kết qu kim đnh thống không có ý nghĩa thống kê; (c) Giả thuyết Ha sai (thuc risedronate không có hiu nghim) nhưng kết quả kim
đnh thống có ý nghĩa thống kê;


(d) Giả thuyết Ha sai và kết quả kim đnh thống không có ý nghĩa thống kê.


đây, trường hợp (a) và (d) không có vn đ, vì kết quả kim đnh thống kê nht quán với thực tế của hin tượng.  Nhưng trong trường hợp (b) (c), cng ta phm sai lm, vì kết quả kim đnh thống kê không phù hợp với giả thiết.  Trong ngôn ng thống kê học, chúng ta có vài thut ng:


    xác sut của tình huống (b) xy ra được gọi sai lm loi II (type II error), và thường kí hiu bng β.


    xác sut của tình huống (a) được gọi là Power.  Nói cách khác, power chính là xác sut kết quả kim đnh thống cho ra kết qu p<0.05 với điu kin giả thiết Ha là tht.  Nói cách khác: power = 1-β ;


    xác  sut  của  tình  huống  (c)  được  gọi   sai  lm  loi  I  (type  I  error,  hay significance level), thường kí hiu bng α.  Nói cách khác, α chính xác sut mà kết quả kim đnh thống cho ra kết qu p<0.05 với điu kin giả thiết Ha sai;


    xác sut tình huống (d) không phi vn đề cn quan tâm, nên không có thut ngữ, dù có thể gọi đó là kết quả âm tính tht (hay true negative).


Có thể tóm lược 4 tình huống đó trong một Bng 1 sau đây:



Bng 1.  Các tình hung trong vic th nghim mt gi thiết khoa hc




Kết qu kim định thng kê
Gi thuyết Ha
Đúng
(thuốc có hiu nghim)
Sai
(thuốc không có hiu nghim)

Có ý nghĩa thng kê
(p<0,05)

Dương nh thật (power),
1-β= P(S | Ha)

Sai lầm loại I (type I error)
α = P(S | Ho)

Không ý nghĩa thng
(p>0,05)

Sai lầm loại II (type II error)
β = P(NS | Ha)

Âm nh tht (true negative)
1-α = P(NS | Ho)
C thích: hiu S trong bảng này nghĩa là significant (tức p<0.05); NS = non-
significant(tc p>0.05).  Do đó, thể mô t 4 tình huống trên bng ngôn ng xác sut điu kiện như sau: Power  = 1 β = P(S | Ha); β = P(NS | Ha); và α = P(S | Ho).  Xin nhắc lại rằng kí hiệu toán học “P(A | B) nghĩa là một xác suất điều kiện, cụ thể hơn kí hiệu P(S | Ha) có nghĩa là “xác sut S xảy ra nếu (hay vi điều kin) Ha là đúng.”

No comments:

Post a Comment