Nhận diện địa phương “học giỏi” nhất
Nếu lấy ngưỡng 70% là tín hiệu của “bệnh thành tích” thì có thể nói rằng hầu hết các tỉnh thành đều có triệu chứng này không phải chỉ năm 2010 mà trong 4 năm qua.
Một trong những câu hỏi mà có lẽ công chúng muốn biết là trong số 63 tỉnh thành, địa phương nào có tỉ lệ tốt nghiệp trung học phổ thông (THPT) cao nhất? Đây cũng là một câu hỏi chiếm khá nhiều thời lượng suy nghĩ của tôi. Nhận diện những địa phương có thành tích tốt (và những địa phương có kết quả kém) có thể dẫn đến những nghiên cứu chuyên sâu tìm hiểu căn nguyên và yếu tố liên quan, từ đó tìm biện pháp giảm những khoảng cách về chất lượng GD giữa các địa phương, là điều cần thiết.
Dễ mà không đơn giản!
Có lẽ đối với nhiều người, câu trả lời quá đơn giản: Chỉ cần tìm tỉ lệ tốt nghiệp THPT của một năm nào đó (như năm 2010 chẳng hạn), sắp xếp tỉ lệ tốt nghiệp từ cao xuống thấp, và nhận diện địa phương có tỉ lệ tốt nghiệp cao nhất. Thật ra, đây cũng chính là phương pháp mà các quan chức trong Bộ GD và ĐT từng làm. Phương pháp này có lợi thế là đơn giản, dễ hiểu, ai làm cũng được, kể cả học sinh tiểu học cũng có thể dùng máy vi tính để xếp hạng.
Nhưng phương pháp đơn giản đó có ít nhất là 2 khiếm khuyết lớn: Chưa tính đến độ dao động trong từng địa phương qua các năm, và chưa điều chỉnh cho hiện tượng “hồi qui” (sẽ giải thích dưới đây). Để thấy sai lầm của phương pháp đơn giản đó, chúng ta có thể xem qua Biều đồ 1 dưới đây.
Đặc điểm quan trọng nhất của biểu đồ này là tỉ lệ tốt nghiệp dao động rất lớn trong mỗi địa phương. Chẳng hạn như tỉnh Sơn La (ID số 63, ô bên góc phải, dòng đầu tiên) có tỉ lệ tốt nghiệp tăng và giảm một cách vừa liên tục vừa bất thường; nhưng trong cùng thời gian có những địa phương (như TP Hồ Chí Minh, ID số 1, ô đầu tiên góc trái của dòng cuối cùng) thì không có khác biệt gì đáng kể giữa các năm.
Điểm thứ hai là trong mỗi năm, tỉ lệ tốt nghiệp rất khác biệt giữa các địa phương. Thật ra, phân tích kĩ cho thấy phương sai của tỉ lệ tốt nghiệp trong mỗi địa phương cao gấp 7 lần phương sai giữa các địa phương! Những sự thật này nói lên rằng không thể sử dụng số liệu của một năm để đánh giá và so sánh tỉ lệ tốt nghiệp THPT.
Biểu đồ 1. Tỉ lệ tốt nghiệp THPT của 63 tỉnh thành trong thời gian 2006 – 2010 |
Số trung bình đơn thuần không thể dùng để xếp hạng. Một cách khác để thấy khiếm khuyết của phương pháp xếp hạng dựa vào số trung bình có thể xem qua số liệu thực tế về tỉ lệ tốt nghiệp THPT của 2 tỉnh Quảng Nam và Phú Thọ trong 4 năm 2007 – 2010:
Địa phương |
Tỉ lệ tốt nghiệp 2007 |
Tỉ lệ tốt nghiệp 2008 |
Tỉ lệ tốt nghiệp 2009 |
Tỉ lệ tốt nghiệp 2010 |
Trung bình |
Quảng Nam |
63.8 |
67.5 |
84.5 |
94.9 |
77.7 |
Phú Thọ |
51.6 |
70.0 |
90.0 |
99.5 |
77.8 |
Tỉ lệ tốt nghiệp (trung bình) của Quảng Nam là 77.7%, và Phú Thọ là 77.8%. Nhìn vào bảng trên, chúng ta có thể kết luận rằng Phú Thọ tương đương, “học giỏi” như nhau? Cố nhiên là không. Bởi vì nếu nhìn kĩ, chúng ta sẽ thấy độ dao động của Phú Thọ cao hơn Quảng Nam. Thật vậy, phương sai của tỉnh Phú Thọ là 456, còn của Quảng Nam là 212.
Nói cách khác, tuy hai tỉnh có tỉ lệ tốt nghiệp tương đương, nhưng tỉ lệ của Quảng Nam đáng tin cậy (hiểu theo nghĩa dao động ít hơn) Phú Thọ. Do đó, không thể xếp hạng bằng cách đơn giản dựa vào tỉ lệ trung bình, và càng không thể dựa vào tỉ lệ tốt nghiệp của một năm, bởi vì độ dao động khá lớn giữa các năm trong một địa phương.
Một khía cạnh khác cũng có phần phức tạp hơn là mối tương quan giữa tốc độ tăng trưởng tỉ lệ tốt nghiệp và tỉ lệ tốt nghiệp năm 2007 (năm đầu khi Phó TT Nguyễn Thiện Nhân bắt đầu phong trào “Hai không”). Tính trung bình cho cả nước, tỉ lệ tốt nghiệp THPT tăng 9% mỗi năm (tôi gọi đó là “tốc độ tăng trường”). Nhưng không phải tỉnh thành nào cũng có cùng tốc độ tăng trưởng, mà tốc độ này dao động từ dưới 0 đến 25% mỗi năm!
Điều quan trọng hơn là tốc độ tăng trưởng có liên quan nghịch đảo với tỉ lệ tốt nghiệp năm 2007 (xem Biểu đồ 2 dưới đây). Theo biểu đồ này, những tỉnh có tỉ lệ tốt nghiệp thấp trong năm 2007 thì trong những năm sau tỉ lệ tốt nghiệp tăng rất nhanh. Ngược lại, những tỉnh có tỉ lệ tốt nghiệp cao (như TPHCM, Nam Định) thì tốc độ tăng trưởng khá chậm.
Đây còn gọi là hiện tượng “regression toward the mean effect”, tức là ảnh hưởng hồi qui trung bình. Một “triệu chứng” của hiện tượng hồi qui trung bình này là các địa phương có tỉ lệ tốt nghiệp quá thấp thường biến chuyển tăng dần gần tỉ lệ trung bình của cả nước, và những tỉnh khởi đầu với tỉ lệ quá cao có xu hướng giảm trong thời gian sau đó. Trong thực tế, chúng ta thấy hiện tượng này ở rất nhiều tỉnh thành trong thời gian qua. Đây là một đặc điểm quan trọng, vì nó gợi ý rằng phương pháp phân tích đơn giản không thể giải quyết được vấn đề phương sai.
Biểu đồ 2: Mối tương quan giữa tỉ lệ tốt nghiệp năm 2007 (trục hoành) và tốc độ tăng trưởng tỉ lệ tốt nghiệp trong thời gian 2007 – 2010. Biểu đồ cho thấy địa phương nào có tỉ lệ tốt nghiệp cao vào năm 2007 thì tỉ lệ tăng trưởng thấp hơn so với các tỉnh có tỉ lệ tốt nghiệp thấp. Đây là hiện tượng “regression toward the mean effect” rất phổ biến trong đo lường, và cần phải được điều chỉnh để so sánh giữa các tỉnh thành khách quan hơn. |
Phương pháp khách quan hơn
Do đó, phương pháp xếp hạng khách quan phải dựa vào hai chỉ số: Trung bình và phương sai. Một phương pháp xếp hạng dựa vào 2 chỉ số đó là mô hình mà giới thống kê học gọi là Empirical Bayes (EB), có lẽ tạm dịch là “Phương pháp Bayes thực tế” (nghe ngô nghê quá, nhưng ai hay chữ hơn, xin góp ý).
Thật ra, đây là phương pháp mà giới nghiên cứu về chất lượng GD và xếp hạng trường học thường hay sử dụng và kết quả rất thành công. Nhưng trong thực tế, chúng ta có đến 63 địa phương. Do đó, chúng ta có 63 giá trị thật, và 63 sai số. Chúng ta giả định rằng tập hợp các tỉ lệ thật tuân theo luật phân phối chuẩn với trung bình là m và phương sai là u, và tập hợp các sai số tuân theo luật phân phối chuẩn với trung bình 0 và phương sai v. Tôi dùng số liệu về tỉ lệ tốt nghiệp THPT của 63 tỉnh thành từ năm 2006 đến 2010 để ước tính các thông số m và u.
Theo phương pháp EB, tỉ lệ thật của một địa phương chính là một trọng số trung bình (weighted average) giữa tỉ lệ của địa phương đó và tỉ lệ toàn quốc, với trọng số là số đảo của phương sai của địa phương và phương sai của quần thể.
Theo cách tính này, những địa phương nào có phương sai cao (tức mức độ biến chuyển về tỉ lệ tốt nghiệp qua các năm) sẽ bị “phạt”, vì tỉ lệ trung bình kém tin cậy so với những địa phương có phương sai thấp. Chẳng hạn như trong ví dụ trên, tỉ lệ của tỉnh Quảng Nam có độ tin cậy cao hơn tỉ lệ của tỉnh Phú Thọ, mặc dù 2 tỉnh có tỉ lệ tốt nghiệp trung bình tương đương nhau.
Như vậy, mỗi địa phương sẽ có 2 thông số: Tỉ lệ trung bình về lâu về dài (tỉ lệ “thật”) và phương sai sau khi đã điều chỉnh cho hiện tượng hồi qui trung bình và độ dao động trong mỗi địa phương. Vấn đề kế tiếp là tìm một ngưỡng để xác định thứ hạng. Bởi vì tỉ lệ tốt nghiệp toàn quốc năm 2010 là 90%, nên tôi chọn ngưỡng 90% để so sánh tỉ lệ thật của một địa phương với “ngưỡng chuẩn” đó.
Gọi Ti là tỉ lệ “thật” của địa phương, và Wi là phương sai, tôi có thể tính một chỉ số (tạm gọi là Z90) như sau: Z90 = (Ti – 90) / sqrt(Wi). Chú ý kí hiệu “sqrt” là căn số bậc 2 (và căn số bậc 2 của phương sai là độ lệch chuẩn). Nói cách khác, công thức trên ước tính khoảng cách về tỉ lệ thật của một địa phương với ngưỡng chuẩn 90%, và đơn vị đo lường là độ lệch chuẩn của mỗi địa phương. Nếu địa phương có Z90 là số dương thì địa phương đó có tỉ lệ tốt nghiệp cao hơn ngưỡng chuẩn 90%; ngược lại, nếu địa phương có số âm thì tỉ lệ tốt nghiệp địa phương đó thấp hơn 90%.
Có sự mất cân đối nghiêm trọng
Tỉ lệ tốt nghiệp THPT của 63 tỉnh thành có thể xem qua Biểu đồ 1 ở phần đầu. Nếu dựa vào tỉ lệ tốt nghiệp (tính trung bình từ 2007 – 2010) thì 5 địa phương đứng đầu bảng là: Nam Định, 95.7%, kế đến là TPHCM 94.4%; Hà Nam 92.5%; Hải Phòng 89.9%; và Bắc Ninh 89.1%. 5 địa phương đứng cuối bảng là: Bắc Kạn 48.6%, Sơn La 52.3%, Cao Bằng 55.6%, Sóc Trăng 62.1%, và Yên Bái 62.6%. Tuy nhiên, như tôi trình bày trên, cách xếp hạng này không khách quan, vì chỉ dựa vào chỉ số trung bình, mà chưa tính đến độ dao động trong mỗi địa phương.
Kết quả phân tích theo phương pháp EB được trình bày trong Biểu đồ 3. Theo kết quả này, TPHCM được xếp hạng 1, và Nam Định xếp hạng 2. Mặc dù có tỉ lệ thực tế (trung bình 2007-2010) của Nam Định là 95.7%, cao hơn TPHCM (94.4%), nhưng vì phương sai của Nam Định là 17.75, cao hơn TPHCM (chỉ 0.59), cho nên tỉ lệ thật (hay tỉ lệ về lâu về dài) của Nam Định là 92.8%, thấp hơn TPHCM (94.3%).
Chú ý tỉ lệ thật của TPHCM không khác nhiều so với tỉ lệ thực tế, bởi vì độ dao động qua các năm của TPHCM quá thấp, và điều này chứng tỏ TPHCM không có bệnh thành tích như các nơi khác. Danh sách “top 10” và “bottom 10” có thể tóm lược trong bảng sau đây:
Top 10 |
Bottom 10 |
TP Hồ Chí Minh
Nam Định
Hà Nam
Thái Nguyên
Hải Phòng
Hải Dương
Bắc Ninh
Lâm Đồng
Vĩnh Phúc
Đà Nẵng |
Dak Lak
Đồng Tháp
Bến Tre
Bình Thuận
Sóc Trăng
Trà Vinh
An Giang
Kiên Giang
Tây Ninh
Ninh Thuận |
Điều thú vị là trong danh sách top 10, có đến 7 tỉnh từ miền Bắc, chỉ có 3 địa phương từ miền Trung và Nam (Đà Nẵng, Lâm Đồng và TPHCM). Trong khi đó, trong danh sách bottom 10 có đến 6 tỉnh từ Đồng bằng sông Cửu Long, 1 tỉnh thuộc vùng Tây Nguyên (Dak Lak), và đặc biệt không có tỉnh nào thuộc miền Bắc.
Tuy nhiên, bất cứ phương pháp xếp hạng nào cũng chỉ có giá trị khi số liệu được thu thập một cách tối ưu, và đáp ứng các giả định đặt ra. Như tôi đề cập trong phần đầu, những số liệu này chưa phải là tốt nhất, vì thiếu số liệu về số học sinh thi qua từng năm. Ngoài ra, một giả định rất quan trọng trong phân tích này là tỉ lệ tốt nghiệp trong mỗi tỉnh thành phải tuân theo luật phân phối chuẩn, nhưng chúng ta chưa có dữ liệu đầy đủ để kiểm tra xem giả định này đúng hay không.
Trong bối cảnh tỉ lệ tốt nghiệp đều tăng theo thời gian, chúng ta có thể đặt câu hỏi về vấn đề giả định. Tuy nhiên, vì số học sinh tham dự thi tuyển thường trên 1000 nên các tỉ lệ này có thể không bị ảnh hưởng bởi các yếu tố nhiễu, và kết quả trình bày trong phân tích này có thể xem là tín hiệu đáng tin cậy. Phương pháp tôi trình bày trong bài này thật ra có thể ứng dụng để xếp hạng các trường, nhưng số liệu đòi hỏi chi tiết hơn. Hi vọng rằng phương pháp này sẽ được sử dụng nhiều hơn nữa ở nước ta (thật ra thì các nước tiên tiến đều sử dụng phương pháp EB) để xếp hạng các trường hay tỉnh/thành một cách khách quan hơn.
Kết quả so sánh này cho thấy chỉ có 2 địa phương (TP Hồ Chí Minh và Nam Định) là có tỉ lệ tốt nghiệp trên 90% một cách nhất quán qua các năm, còn lại 61 tỉnh thành khác thì tỉ lệ tốt nghiệp đều dưới 90%. Mức độ khác biệt giữa địa phương có tỉ lệ tốt nghiệp thấp nhất và cao nhất lên đến 26%.
Mặc dù khác biệt giữa các địa phương là điều hoàn toàn có thể tiên đoán được, nhưng với một mức độ khác biệt đến 26% (tính trung bình) là một điều rất đáng quan tâm, vì điều này nói lên một thực tế là có sự mất cân đối nghiêm trọng trong “đầu ra” của ngành GD phổ thông giữa các địa phương.
Trong thực tế, chúng ta không biết tỉ lệ tốt nghiệp bao nhiêu là “chuẩn”. Cần nói thêm rằng bởi vì tỉ lệ tốt nghiệp còn tùy thuộc vào điểm chuẩn của từng môn học, và có khi điểm chuẩn thay đổi theo thời gian. Tuy nhiên, kinh nghiệm từ nước ngoài (như Úc chẳng hạn), có thể nói rằng một tỉ lệ tốt nghiệp 70% đã được xem là một tỉ lệ cao, và 80% là rất cao. Trong khi đó ở VN, 61/63 tỉnh thành đều có tỉ lệ (trung bình) tốt nghiệp THPT trên 70%, và 17/63 tỉnh thành có tỉ lệ trên 80%! Do đó, nếu lấy ngưỡng 70% là tín hiệu của “bệnh thành tích” thì có thể nói rằng hầu hết các tỉnh thành đều có triệu chứng này không phải chỉ năm 2010 mà trong 4 năm qua.
Thêm vào đó, chúng ta thấy trong số “bottom 10” hầu hết là các tỉnh có cùng đặc điểm nghèo và khó. Nghèo về kinh tế, khó khăn về cơ sở vật chất. Do đó, kết quả trên gợi ý rằng nhà nước cần phải quan tâm đến các tỉnh vừa nêu, nhất là Ninh Thuận (một tỉnh mà bất cứ chỉ tiêu nào về GD cũng đứng cuối bảng), để nâng cao chất lượng.
Ở nước ta vẫn còn cách cho điểm và đánh giá học sinh bằng đơn vị “nhị phân” như đậu hoặc rớt. Theo tôi, đây là cách đánh giá khá cổ điển và có thể không còn phù hợp trong thời đại ngày nay. Thật vậy, ở các nước tiên tiến (như Úc chẳng hạn), người ta đánh giá thành tích của học sinh qua điểm đạt được, và không có một chỗ nào trong chứng chỉ tốt nghiệp trung học viết hạng (ưu, trung bình, hay thấp), mà chỉ là điểm đạt được trong kì thi tốt nghiệp so với điểm tối đa.
Do đó, những kết quả phân tích trong bài này còn gợi ý rằng trong tương lai, nước ta nên tiến đến một cách đánh giá học sinh theo điểm hơn là phân loại tốt nghiệp hay không tốt nghiệp. Đứng trên phương diện lí thuyết đo lường, điểm tốt nghiệp cung cấp nhiều thông tin hơn và có độ tin cậy tốt hơn cách phân nhóm đậu và rớt.
Thủ tục pháp luật