Thống kê học là một phương pháp khoa học có mục đích phát hiện, hay
đi tìm
những cái có thể gộp chung lại bằng cụm từ “chưa được biết” (unknown).
Cái chưa được biết ở đây là những hiện tượng chúng ta không quan sát được, hay quan sát được nhưng không đầy đủ. Cái chưa biết có thể là một ẩn số (như chiều cao trung bình ở người Việt Nam, hay
trọng lượng một phần tử), hiệu quả của một thuật điều trị, tỉ lệ lưu hành (prevalence), tỉ lệ phát sinh (incidence) của bệnh, v.v… Chúng ta có thể đo chiều cao, hay
tiến hành xét nghiệm để biết hiệu quả của thuốc, nhưng các nghiên cứu như thế chỉ
được tiến hành trên một nhóm đối tượng, chứ không phải toàn bộ quần thể của dân số.
Vấn
đề là sử dụng kết quả của một nhóm đối tượng để suy luận cho một quần thể lớn
hơn. Mục đích của ước tính cỡ mẫu là tìm số lượng
đối tượng sao cho suy
luận đó đạt độ
chính xác cao nhất
và đầy đủ
nhất.
Ở mức độ đơn giản nhất, những
cái chưa biết này có thể xuất hiện dưới hai hình
thức: hoặc là có, hoặc là không. Chẳng hạn như một thuật điều trị có hay
không có hiệu quả chống gãy xương. Bởi vì không ai biết hiện tượng một cách đầy đủ, chúng ta phải
đặt
ra giả thiết. Giả thiết đơn giản nhất là giả thiết đảo (hiện tượng
không tồn tại, kí hiệu Ho)
và giả thiết chính (hiện tượng
tồn tại, kí hiệu Ha).
Chúng ta sử dụng các phương pháp kiểm định thống kê (statistical test) như kiểm định t, F, z, χ2, v.v… để đánh giá khả năng của giả thiết.
Kết quả của một kiểm định
thống kê có thể đơn giản chia thành hai giá trị: hoặc là có ý nghĩa thống kê (statistical
significance), hoặc là không có ý nghĩa thống kê (non-significance). Có ý nghĩa thống
kê ở
đây thường dựa vào trị số P: thông thường, nếu P < 0.05, chúng ta phát biểu kết quả có
ý nghĩa thống kê; nếu P > 0.05 chúng ta nói kết quả không có ý
nghĩa thống kê.
Cũng có thể xem có ý nghĩa thống kê hay không có ý nghĩa thống kê như là có tín hiệu hay không
có
tín hiệu. Hãy
tạm
đặt kí hiệu T+ là kết quả có ý nghĩa thống kê, và T- là kết quả kiểm định
không có ý nghĩa thống kê.
Hãy xem xét một ví dụ cụ thể: để biết thuốc risedronate có hiệu quả hay không
trong việc điều trị loãng xương, chúng ta tiến hành một nghiên cứu gồm 2 nhóm bệnh
nhân (một nhóm được điều trị bằng risedronate và một nhóm chỉ sử dụng giả dược
placebo). Chúng ta theo dõi và thu thập số liệu gãy
xương, ước tính tỉ lệ gãy
xương cho
từng nhóm, và so sánh hai tỉ lệ bằng một kiểm định thống kê. Kết quả kiểm định thống kê hoặc là có ý nghĩa thống kê (P<0.05) hay không có ý nghĩa thống kê (P>0.05).
Xin
nhắc lại rằng chúng ta không biết risedronate thật sự có hiệu nghiệm chống gãy xương hay
không; chúng ta chỉ có thể đặt giả thiết. Do đó, khi xem xét một giả thiết và kết quả
kiểm định thống kê, chúng ta có
bốn tình huống:
(a) Giả thuyết Ha đúng (thuốc risedronate có hiệu nghiệm) và kết quả kiểm định thống
kê P<0.05.
(b) Giả thuyết Ha đúng,
nhưng
kết quả kiểm định
thống kê không có ý nghĩa thống kê;
(c)
Giả thuyết Ha sai (thuốc risedronate không có hiệu nghiệm) nhưng kết quả kiểm
định thống kê có ý nghĩa thống kê;
(d) Giả thuyết Ha sai và kết quả kiểm định
thống kê không có ý nghĩa thống kê.
Ở đây, trường hợp (a) và (d) không có vấn đề, vì kết quả kiểm định thống kê nhất quán với thực tế của hiện tượng.
Nhưng trong trường hợp (b) và (c), chúng
ta phạm sai lầm, vì
kết
quả kiểm định thống
kê không phù hợp với giả thiết.
Trong ngôn ngữ thống kê
học, chúng ta có
vài thuật ngữ:
• xác suất của tình huống (b) xảy ra được gọi là sai lầm loại II (type II error), và thường
kí hiệu bằng β.
• xác suất
của
tình huống (a) được gọi
là
Power. Nói cách khác, power chính
là xác suất mà kết quả kiểm định thống cho ra kết quả p<0.05 với điều kiện giả thiết Ha là thật.
Nói cách khác:
power
= 1-β ;
• xác
suất của
tình
huống (c)
được
gọi là sai
lầm loại I (type
I
error, hay
significance level), và thường
kí hiệu bằng α. Nói cách khác, α chính là xác suất mà kết quả
kiểm định thống cho ra kết quả p<0.05 với điều
kiện giả thiết Ha sai;
• xác suất tình huống (d) không phải là vấn đề cần quan tâm, nên không có thuật ngữ,
dù có
thể gọi
đó là kết quả âm
tính thật (hay true negative).
Có thể tóm
lược 4 tình huống đó trong một Bảng
1 sau đây:
Bảng 1.
Các tình huống trong việc thử nghiệm một giả thiết khoa
học
Kết quả
kiểm định thống kê
|
Giả thuyết Ha
|
|
Đúng
(thuốc
có hiệu nghiệm)
|
Sai
(thuốc
không có hiệu nghiệm)
|
|
Có
ý nghĩa thống
kê
(p<0,05)
|
Dương tính thật (power),
1-β= P(S | Ha)
|
Sai lầm loại I (type I error)
α =
P(S | Ho)
|
Không có ý nghĩa thống kê
(p>0,05)
|
Sai lầm loại II (type II error)
β =
P(NS |
Ha)
|
Âm tính thật (true negative)
1-α = P(NS | Ho)
|
Chú thích: kí hiệu S trong bảng này có nghĩa là “significant” (tức p<0.05); NS = “non-
significant”
(tức p>0.05). Do đó, có thể mô tả 4 tình huống trên bằng
ngôn
ngữ xác suất có điều kiện như sau: Power
= 1 –
β = P(S | Ha); β = P(NS | Ha); và α = P(S | Ho).
Xin nhắc lại rằng kí hiệu toán học “P(A | B)” có nghĩa là một xác suất có điều kiện, cụ thể hơn kí hiệu P(S | Ha) có nghĩa là “xác suất S xảy ra nếu
(hay với điều
kiện) Ha là đúng.”
No comments:
Post a Comment