GS Nguyễn Văn Tuấn
Đó
là nhận định của Bộ Y tế về con số hơn 6200 người
bị nhập viện vì ẩu đả nhau trong 9 ngày nghỉ Tết
(1). Chưa nói đến ngôn ngữ chính trị (vốn rất dở),
chỉ cần xem qua dữ liệu tôi thấy đây là một nhận
định rất sai. Không thể xem hàng ngàn trường hợp đánh
nhau đến nhập viện là bình thường được. Trong cái
note này tôi sẽ chỉ ra rằng đó là một “hiện tượng”
bất bình thường bằng cách dùng chính con số của của
Bộ Y tế.
Cách
mà Bộ Y tế lí giải con số đó là “bình thường” có
thể xem là một cách ngụy biện thống kê. Họ lí giải
như sau: "Nếu chia cụ thể con số gần 100
trường hợp trong 9 ngày thì trung bình mỗi ngày mỗi
địa phương chỉ xảy ra khoảng 11 trường hợp nhập
viện vì đánh nhau. Con số này không có gì bất thường"
(1).
Có
cái gì đó buồn cười trong lí giải trên! Con số 11 trên
là họ lấy 6207 trường hợp ẩu đả chia cho 63 [tỉnh
thành], rồi chia cho 9 ngày [thời gian nghỉ Tết]. Tức là
mỗi tỉnh chỉ có 11 ca nhập viện mỗi ngày. Có lẽ các
bạn tự hỏi sao họ không chia cho 24 giờ để con số
trung bình chỉ còn 0.46, tức là mỗi giờ [trong thời gian
nghỉ Tết] ở mỗi tỉnh thành chỉ có 0.46 người nhập
viện vì đánh nhau! Muốn làm cho sự kiện lớn thì tính
trên mỗi ngày cho cả nước; muốn làm cho sự kiện nhỏ
thì chia cho số giờ, thậm chí phút! Cách minh họa đó
cho thấy “nói dóc bằng thống kê” nó trơ trẽn và vô
duyên như thế nào. Thật ra đó là một ngụy biện mà
giới khoa học gọi là “fallacy of average”, khi nào có
dịp tôi sẽ quay lại khái niệm này. Nhưng cách dùng con
số thống kê của Bộ Y tế làm tôi nhớ đến câu nói
nổi tiếng của Nhà thơ Andrew Lang "Some individuals
use statistics as a drunk man uses lamp posts - for support rather
than for illumination" (tạm dịch "Vài người
dùng con số thống kê như là một gã say rượu dùng cái
đèn đường -- họ dùng để tìm điểm tựa hơn là để
soi sáng vấn đề).
Quay
lại nhận xét “bình thường”, câu hỏi đặt ra
là thế nào là bình thường? Xin chú ý chữ
“bình thường” tôi để trong ngoặc kép (bởi vì theo
chuẩn mực đạo đức, đánh nhau đến nhập viện là
không bình thường). Cách hợp lí nhất là so sánh số ca
nhập viện trung bình mỗi ngày trong thời gian nghỉ Tết
với thời gian ngoài Tết.
Tính
trung bình mỗi ngày trong thời gian nghỉ Tết vừa qua có
~690 người nhập viện vì đánh nhau. Nhưng chúng ta không
biết trong thời gian ngoài Tết, có bao nhiêu ca nhập viện
mỗi ngày vì đánh nhau. Do đó, tôi nghĩ đến 2 cách để
so sánh: thứ nhất là so số ca nhập viện vì ẩu đả
với số ca tai nạn giao thông ngày thường. Thứ hai là so
sánh với cùng thời gian những ngày nghỉ Tết các năm
trước. Hai so sánh này sẽ giúp chúng ta có một nhận xét
đúng đắn và có bằng chứng hơn.
So
với số ca tai nạn giao thông
Tuy
nhiên, chúng ta biết rằng trong năm 2013 có 32266 người bị
thương tích vì tai nạn giao thông (2). Tính trung bình mỗi
ngày có 88 người bị thương vì tai nạn giao thông. Nếu
tính cả 9805 người chết vì tai nạn giao thông, thì mỗi
ngày có 115 người bị thương và tử vong do tai nạn giao
thông.
Nhưng
trong thời gian nghỉ Tết, mỗi ngày có đến 690 người
nhập viện vì ẩu đả nhau. Như vậy, tính trung bình tỉ
suất nhập viện vì ẩu đả trong ngày Tết tăng gấp 6
lần so với tỉ suất thương vong vì tai nạn giao thông.
Xin nhắc lại: cao gấp 6 lần. Có thể xem sự chênh lệch
đó là “bình thường” không? Tôi nghĩ chỉ có người
có suy nghĩ bất bình thường mới nói đó là “bình
thường”.
So
với kì nghỉ Tết năm 2012 và 2013
Một
cách khác để đánh giá bình thường hay không là so sánh
tỉ suất năm 2014 với các năm trước. Bài báo trên
Vietnamnet cho biết số ca nhập viện vì đánh nhau trong
ngày Tết qua các năm như sau:
Năm
2014: 6702 ca
Năm 2013: 4737 ca
Năm 2012: 3995 ca
Như
vậy, so với năm 2012, số ca ẩu đả và nhập viện năm
2014 tăng đến 55%! Rõ ràng có sự gia tăng về số ca ẩu
đả đến nỗi phải nhập viện. Nhưng so sánh đó chưa
công bằng vì chúng ta phải tính đến dân số, mà dân số
thì tăng trưởng mỗi năm. Dân số của VN qua 2012-2014 là
như sau:
Năm
2014: 92.55 triệu người
Năm 2013: 89.71 triệu người
Năm
2012: 88.77 triệu người
Vấn
đề đặt ra là sự gia tăng số ca nhập viện là do dao
động thống kê hay là do yếu tố nào khác? Chúng ta phải
kiểm định giả thuyết đàng hoàng. Gọi tỉ suất nhập
viện vì ẩu đả trong thời gian nghỉ Tết năm 2012, 2013
và 2014 lần lượt là L12, L13, và L14. Dùng số liệu trên,
chúng ta có thể ước tính L(t) cho từng năm như sau:
Năm
2014: L14 = 6702 / (92.55*9) = 8.046 trên 1 triệu;
Năm
2013: L13 = 4737 / (89.71*9) = 5.867 trên 1 triệu;
Năm
2012: L12 = 3995 / (88.77*9) = 5.000 trên 1 triệu;
Nếu
phát biểu của Bộ Y tế là đúng (tức “bình thường”)
thì chúng ta kì vọng rằng L14 = L13 = L12, hoặc có khác
nhau chút ít do dao động thống kê. Nhưng kết quả tính
toán trên cho thấy hình như giả thuyết này không đúng.
Tuy nhiên, vẫn chưa thể kết luận được rằng L14 khác
với L13 hay L12, vì chúng ta chưa xem xét đến yếu tố dao
động ngẫu nhiên qua các năm.
Chúng
ta cần phải tính xác suất dữ liệu xảy ra nếu L14=L13
là bao nhiêu. Nói cách khác, gọi dữ liệu là D, và giả
thuyết bình thường là H0: L14=L13, chúng ta cần tính P(D |
H0). Nếu xác suất này là thấp, thì chúng ta có thể bác
bỏ giả thuyết “bình thường”, và kết luận rằng sự
gia tăng số ca nhập viện trong dịp Tết vừa qua là không
“bình thường”.
Nhưng
làm sao tính xác suất đó? Phương pháp thống kê đơn
giản nhất và thích hợp nhất để so sánh 2 tỉ suất là
phương pháp kiểm định Poisson (3). Giả định rằng tỉ
suất L14, L13 và L12 tuân theo luật phân bố Poisson. Theo
luật phân bố Poisson, phương sai của số ca nhập viện
cũng chính là L. Điều này dẫn đến một phương pháp
kiểm định giả thuyết rất đơn giản, dựa trên khác
biệt giữa 2 thời gian. Dùng ngôn ngữ R, tôi tính được
xác suất như sau:
So
sánh tỉ suất năm 2014 và 2013:
>
poisson.test(c(6207, 4737), c(9*92.55, 9*89.71),
alternative=c("two.sided"))
P-value
< 2.2e-16
rate ratio: 1.27 (95 percent confidence interval:
1.22, 1.32)
Nói
cách khác, tỉ suất nhập viện vì đánh nhau năm 2014 cao
hơn năm 2013 là 27%, và khoảng tin cậy 95% dao động từ
22% đến 32%. Trị số P rất nhỏ (2.2e-16).
Tương tự, so sánh tỉ suất năm 2014 và 2012:
>
poisson.test(c(6207, 3995), c(9*92.55, 9*88.77),
alternative=c("two.sided"))
P-value
< 2.2e-16
rate ratio: 1.49 (95 percent confidence interval:
1.43, 1.55)
Tỉ
suất nhập viện vì đánh nhau năm 2014 cao hơn năm 2012 đến
1,49 lần, và khoảng tin cậy 95% dao động từ 1.43 đến
1.55 lần. Một lần nữa, trị số P cũng rất thấp.
Nói
tóm lại, nếu giả thuyết “bình thường” là đúng thì
xác suất mà chúng ta quan sát tỉ suất năm 2014 so với
các năm trước là rất rất thấp. Nói cách khác, số
liệu thực tế cho thấy sự khác biệt về tỉ suất số
ca nhập viện vì ẩu đả nhau trong thời gian 2012-2014 là
không phải do yếu tố dao động thống kê, mà có sự
khác biệt thật sự. Do đó, giả thuyết “bình thường”
bị loại bỏ.
Để
kết luận, xét trên 2 tiêu chí (so sánh theo thời gian và
so sánh với số ca tai nạn giao thông) đều cho thấy số
ca nhập viện vì ẩu đả nhau trong thời gian nghỉ Tết
vừa qua là quá cao. Trong 3 năm liên tiếp, số ca nhập
viện vì ẩu đả liên tục gia tăng. Do đó, nhận định
“6.200
người nhập viện vì đánh nhau là bình thường”
chẳng những rất sai lầm mà còn rất … bất bình
thường. Một Bộ chuyên lo quản lí sức khỏe của một
nước mà có thể thốt lên rằng 6000 ca nhập viện vì ẩu
đả là "bình thường" thì quả thật người dân
cũng có lí do để quan tâm đến cảm xúc (empathy) của Bộ
đó. Có lẽ Gs Trần Ngọc Thêm nói đúng, “Bởi
vì hiện nay, theo cảm nhận của nhiều người có kinh
nghiệm, sự sa đọa của những phẩm chất con người,
của văn hóa đã xuống chạm đáy rồi,” nên
một sự kiện kinh hoàng đối với thế giới thì lại
bình thường ở VN.
tuanvannguyen.blogspot.com/
====
(3)
Gọi biến phản ảnh số ca nhập viện là X, và x là số
ca nhập viện, luật phân bố Poisson phát biểu rằng P(X =
x) = e^(-m)*m^x / x! Có thể dùng rpois(n, lambda) trong R để
mô phỏng số ca nhập viện rất dễ dàng.
Theo: tuanvannguyen.blogspot.com/
Bình luận