Một nghiên cứu về phạm vi ảnh hưởng của bệnh ung thư thận trong 3.141 quận ở nước Mỹ đã phát hiện ra một mẫu bệnh đáng chú ý. Tại các quận này mức ảnh hưởng của căn bệnh ung thư thận ở mức thấp nhất phần lớn thuộc về vùng nông thôn, nơi có mật độ dân cư thưa và nằm ở những vùng lãnh thổ có truyền thống theo Đảng Cộng hòa thuộc miền Trung Tây, miền Nam và miền Tây của nước Mỹ. Bạn rút ra được gì từ kết luận này?
Trí não bạn đã rất nhạy bén trong vài giây vừa qua và đó chính là cách vận hành của Hệ thống 2. Bạn đã chủ động lục tìm trí nhớ và sắp xếp chúng có trật tự thành những giả thuyết. Một vài nỗ lực đã được dồn cả vào quá trình vận hành hệ thống; đồng tử của bạn giãn ra và nhịp tim của bạn đập quá nhanh. Nhưng Hệ thống 1 cũng đã chẳng “ăn không ngồi rồi”: Sự vận hành của Hệ thống 2 phụ thuộc vào những thực trạng và những gợi ý được gọi ra từ trí nhớ liên tưởng của bạn. Bạn có thể từ bỏ ý nghĩ rằng những công việc chính trị của Đảng Cộng hòa tạo ra đề kháng chống lại căn bệnh ung thư thận. Rất có khả năng, bạn kết luận bằng việc tập trung vào thực tế rằng những quận hạt có phạm vi ảnh hưởng từ bệnh ung thư thận thấp hầu như đều tập trung ở các vùng nông thôn. Từ ví dụ thú vị trên nhà thống kê hóm hỉnh Howard Wainer và Harris Zwerling, đã rút ra được kết luận: “Thật hấp dẫn và dễ dàng để suy luận rằng tỷ lệ bệnh ung thư thận thấp thực tế là do cuộc sống trong lành của vùng nông thôn không bị ô nhiễm không khí, không bị ô nhiễm nguồn nước và được sử dụng thực phẩm sạch mà không có thêm chất phụ gia.” Điều này hoàn toàn hợp lý.
Giờ hãy xem xét các quận hạt mà tại đó tầm ảnh hưởng của căn bệnh ung thư thận ở mức cao nhất. Những quận hạt “ốm yếu” này phần lớn là tập trung ở vùng nông thôn, nơi có mật độ dân cư thưa thớt và nằm tại các vùng lãnh thổ có truyền thống theo Đảng Cộng hòa tại miền Trung Tây, miền Nam, và miền Tây của nước Mỹ. Đúng là “cái lưỡi không xương,” Wainer và Zwerling bình luận: ”Thật dễ để suy ra rằng tỷ lệ ung thư cao của họ là do tình trạng nghèo đói ở vùng nông thôn, người dân không được tiếp cận dịch vụ y tế tốt, chế độ ăn giàu chất béo và quá nhiều chất cồn, quá nhiều thuốc lá.” Có một số sai lầm ở đây, dĩ nhiên vậy. Lối sống vùng nông thôn không thể lý giải cho cả phạm vi ảnh hưởng rất cao lẫn rất thấp của căn bệnh ung thư thận.
Yếu tố chính ở đây không phải là các quận hạt này là vùng nông thôn hay phần lớn dân số là người người theo Đảng Cộng hòa, mà là các quận hạt này có mật độ dân cư thưa thớt. Và bài học quan trọng được lĩnh hội đó không phải là về dịch tễ học, mà là về mối quan hệ phức tạp giữa trí não của chúng ta với con số thống kê. Hệ thống 1 vô cùng quen thuộc với một dạng thức tư duy được nhận diện một cách tự động và dễ dàng liên kết nhân quả giữa các biến cố, đôi lúc ngay cả khi mối liên kết này không xác thực. Khi nói về các quận hạt có phạm vi ảnh hưởng cao, bạn ngay lập tức thừa nhận rằng những quận hạt này khác với các quận hạt khác bởi một nguyên do, mà đó hẳn phải là một nguyên nhân để lý giải cho sự khác biệt này. Tuy nhiên, như chúng ta sẽ thấy, Hệ thống 1 trở nên lạc lõng khi đối mặt với những thực tại “thống kê đơn thuần”, nó thay đổi xác suất của các kết quả nhưng không là nguyên nhân khiến chúng xảy ra.
“Một biến cố ngẫu nhiên” theo định nghĩa không thể dùng làm sự lý giải nhưng những thu thập về các “biến cố ngẫu nhiên” lại vận hành theo một cách thức hết sức hợp lý. Hình dung ra rằng một Bình lớn chứa đầy những viên bi. Một nửa số viên bi đó là màu đỏ, nửa còn lại màu trắng. Tiếp đó, hình dung một người rất kiên nhẫn (hoặc một con rô-bốt) nhắm mắt nhặt ra khỏi bình 4 viên bi, ghi lại số những viên bi màu đỏ trong mẫu này, vứt những viên bi này trở lại trong chiếc bình và sau đó lặp lại hành động trên nhiều lần. Nếu bạn tính tổng các kết quả, bạn sẽ thấy rằng kết quả “2 đỏ, 2 trắng” sẽ xảy ra (gần như là chính xác) 6 lần mỗi lần có kết quả “4 đỏ” hoặc “4 trắng”. Mối liên hệ này trên thực tế là một phép tính của toán học. Bạn có thể dự đoán kết quả của việc lấy mẫu được lặp lại từ một chiếc bình với niềm tự tin như việc bạn có thể dự đoán điều gì sẽ xảy ra nếu bạn va quả trứng vào một chiếc búa. Bạn không thể dự đoán tường tận việc cái vỏ trứng sẽ vỡ tan như thế nào nhưng bạn có thể hiểu sơ sơ. Ở đây có một sự khác biệt: Cảm giác thỏa mãn của quan hệ nhân quả mà bạn trải nghiệm khi nghĩ về một chiếc búa đập vào một quả trứng lại hoàn toàn không tồn tại khi bạn nghĩ về việc lấy mẫu trong nghiên cứu.
Một thực tế thống kê có liên quan tới ví dụ về bệnh ung thư ở trên. Từ cùng một chiếc bình, hai người đếm bi rất kiên nhẫn thay phiên nhau đếm. Jack lấy ra 4 viên bi trong mỗi lần thử nghiệm, Jill lấy ra 7 viên. Cả hai người bọn họ đều ghi lại mỗi lần họ thu được một mẫu đồng nhất là tất cả các viên bi đều là màu trắng hoặc đỏ. Nếu họ tiếp tục công việc đủ lâu, Jack sẽ thu được những kết quả cực đoan luôn nhiều hơn Jill – bởi một thừa số là 8 (tỷ lệ phần trăm kỳ vọng là 12.5% và 1.56%). Thêm một lần nữa, không búa máy, không quan hệ nhân quả, nhưng là một thực tế mang tính toán học: Các mẫu gồm 4 viên bi gọi ra các kết quả cực đoan luôn nhiều hơn các mẫu gồm 7 viên thu được.
Giờ đây hãy hình dung rằng dân số nước Mỹ giống như là những viên bi trong một chiếc bình khổng lồ. Một số viên bi được đánh dấu UT- nghĩa là bệnh ung thư thận. Bạn nhặt các mẫu gồm nhiều viên bi và đưa tới từng quận hạt một theo tuần tự. Các mẫu ở vùng nông thôn nhỏ hơn so với các mẫu khác. Cũng giống như trò chơi của Jack và Jill, các kết quả cực đoan (những tỷ lệ ung thư thận rất cao và/hoặc rất thấp) gần như là có thể được tìm thấy trong các quận hạt có mật độ dân cư thưa thớt. Đó là tất cả những gì diễn ra trong câu chuyện này.
Chúng tôi đã bắt đầu từ một thực tế đòi hỏi một lời giải thích: Phạm vi ảnh hưởng của căn bệnh ung thư thận tới các quận hạt biến đổi một cách rộng rãi và khác biệt có hệ thống. Lời giải thích mà tôi đã đưa ra được trình bày bằng cách thống kê: Các kết quả cực đoan (cả tỷ lệ cao lẫn thấp) có khả năng được tìm thấy trong các mẫu nhỏ nhiều hơn so với trong các mẫu lớn. Lời giải thích này không mang tính nhân quả. Dân số nhỏ của một quận hạt không gây ra mà cũng không ngăn ngừa bệnh ung thư thận; nó chỉ đơn thuần cho phép phạm vi ảnh hưởng của bệnh ung thư thận trở nên lớn hơn nhiều (hoặc thấp hơn nhiều) so với nơi có dân số lớn hơn. Thực tại sâu xa đó chẳng có gì để giải thích ở đây cả. Phạm vi ảnh hưởng của bệnh ung thư không thực sự thấp hơn hoặc cao hơn so với thông thường tại một quận hạt với dân số nhỏ, nó chỉ có vẻ trở nên như vậy trong một năm cụ thể nào đó, bởi một sự cố trong việc chọn mẫu gây ra. Nếu chúng ta lặp lại phép phân tích này vào năm kế tiếp, chúng ta sẽ thu được cùng một hình mẫu chung đối với các kết quả cực đoan trong các mẫu nhỏ nhưng các quận hạt nơi bệnh ung thư Thận đã rất phổ biến vào năm ngoái sẽ không nhất nhiết có một sức ảnh hưởng cao vào năm nay. Nếu đây chính là trường hợp đó, các khác biệt giữa các quận hạt đông đúc với các quận hạt nông thôn sẽ không thực sự có giá trị như là thực tại: Chúng là những thứ được các nhà khoa học gọi là những tiêu bản, các quan trắc được sản sinh ra hoàn toàn bởi một số khía cạnh của phương pháp nghiên cứu, còn trong trường hợp này là bởi những khác biệt trong kích cỡ mẫu.
Câu chuyện mà tôi đã kể ra đây có thể khiến bạn ngạc nhiên, nhưng đó không phải là một việc được phát hiện. Từ lâu bạn đã biết được rằng các kết quả từ các mẫu lớn đáng tin tưởng hơn nhiều so với những mẫu nhỏ hơn và ngay cả những người vốn mù tịt với kiến thức thống kê cũng từng nghe được về quy luật của những con số lớn. Nhưng “việc biết” lại không phải là chuyện có hay không và bạn có thể thấy rằng những tình huống sau đây có thể đúng với mình:
- Đặc trưng “mật độ dân số thưa” đã không ngay lập tức đưa ra lý giải cho nguyên nhân gây ra vấn đề dịch tễ học này.
- Chí ít bạn cũng đã hơi ngạc nhiên bởi sự khác biệt giữa các mẫu gồm 4 và các mẫu gồm 7 viên bi.
- Thậm chí là bây giờ, bạn cần phải vận dụng một số nỗ lực tinh thần để thấy rằng hai tình huống sau đề cập tới cùng một việc:- Các mẫu lớn chính xác hơn nhiều so với các mẫu nhỏ.- Các mẫu nhỏ đưa ra các kết quả cực đoan luôn nhiều hơn so với các mẫu lớn.
Tình huống thứ nhất có một tiếng chuông báo đúng rành rọt nhưng cách diễn đạt của tình huống thứ hai tạo ra ý nghĩa về trực giác, bạn vẫn chưa hề thực sự hiểu được cái thứ nhất.
Dòng cuối cùng: Vâng, bạn đã biết được rằng các kết quả từ các mẫu lớn là chính xác hơn, nhưng giờ đây bạn có thể nhận ra rằng bạn đã chẳng hề hiểu một cách tường tận về nó. Không phải chỉ có mình bạn có suy nghĩ như vậy. Nghiên cứu đầu tiên mà Amos và tôi tiến hành cùng nhau đã chỉ ra rằng ngay cả các nhà nghiên cứu lão luyện cũng có những trực giác tồi tệ và một hiểu biết lơ mơ về các hiệu ứng chọn mẫu.
QUY LUẬT SỐ NHỎ
Việc hợp tác của tôi với Amos vào đầu những năm 1970 khởi đầu bằng một cuộc thảo luận với lời khẳng định: Những người vốn dĩ không có trình độ thống kê lại là “những nhà thống kê trực quan” giỏi. Ông ấy nói với tôi và nhóm tham dự hội thảo gồm các nhà nghiên cứu tại trường Đại học Michigan như vậy, nhìn chung những người này lạc quan về những thống kê trực quan. Tôi đã rất ấn tượng về tuyên bố đó, nó đã khiến tôi nhìn lại bản thân mình: Tôi không phải là một “nhà thống kê trực quan" giỏi và tôi đã không tin rằng mình tệ hơn những người khác.
Đối với một nhà nghiên cứu Tâm lý học, sự biến đổi trong hoạt động chọn mẫu không phải là điều gì lạ lẫm, đó là một sự phiền toái và là một trở ngại tốn kém, nó khiến mục đích của mọi dự án nghiên cứu thành một trò may rủi. Giả sử bạn muốn xác thực giả thiết cho rằng vốn từ vựng trung bình của một bé gái sáu tuổi lớn hơn vốn từ vựng trung bình của một bé trai ở cùng độ tuổi. Giả thuyết này đúng trong tổng thể, đúng là vốn từ vựng trung bình của các bé gái lớn hơn các bé trai ở cùng độ tuổi. Tuy nhiên, các bé gái và bé trai khác biệt nhau rất nhiều, và với sự may mắn của lượt rút thăm, bạn có thể lựa chọn một mẫu mà trong đó sự khác biệt này vẫn còn bỏ lửng, hoặc thậm chí có một số bé trai thực sự ghi điểm cao hơn. Nếu bạn là nhà nghiên cứu, kết quả này thật tai hại phải hao tốn thời gian và nỗ lực. Bạn đã thất bại trong việc kiểm định một giả thuyết mà trong thực tế giả thuyết này đúng. Việc sử dụng một lượng mẫu đủ lớn là cách duy nhất nhằm giảm thiểu rủi ro này. Các nhà nghiên cứu chọn một lượng mẫu quá nhỏ nghĩa là họ phó mặc nghiên của mình cho sự may rủi.
Rủi ro của một lỗi có thể được tính toán với bất kể kích cỡ mẫu nào được đưa ra bởi một quy trình khá đơn giản. Tuy nhiên, theo truyền thống, các nhà tâm lý học không dùng tới những phép tính để quyết định một kích cỡ mẫu, mà họ sử dụng sự đoán định của mình để lý giải cho thứ thường vẫn chưa hoàn thiện. Một bài báo tôi đã từng đọc ngay trước khi tranh luận với Amos đã chứng minh sai lầm mà các nhà nghiên cứu phạm phải (họ sẽ vẫn phạm phải) bởi một nhận định gây tranh cãi. Tác giả đã chỉ ra rằng các nhà tâm lý học thường chọn các mẫu quá nhỏ, đến nỗi họ đã tự đẩy bản thân vào một nguy cơ 50% thất bại trong việc xác thực những giả thiết đúng của mình! Không một nhà nghiên cứu nào trong bán cầu não phải lại có thể chấp nhận một nguy cơ thất bại như thế. Một lời giải thích hợp lý đó là quyết định của các nhà tâm lý học về kích cỡ mẫu đã phản ánh những quan niệm trực giác phổ biến sai lầm về phạm vi của sự biến đổi trong hoạt động lấy mẫu.
Bài báo này đã gây ngạc nhiên cho tôi, bởi nó đã lý giải một số vấn đề mà tôi đã từng mắc phải trong chính nghiên cứu của mình. Giống như hầu hết các nhà nghiên cứu Tâm lý học, tôi đã chọn các mẫu theo thói quen thông thường, đó là số mẫu quá nhỏ vì thế thường thu được những kết quả chẳng có ý nghĩa gì. Giờ tôi đã hiểu tại sao: Các kết quả kỳ lạ này chính là những giả định từ phương pháp nghiên cứu của tôi. Sơ suất của tôi đặc biệt đáng hổ thẹn bởi tôi đã giảng dạy về thống kê trong nhiều năm và biết cách tính toán kích cỡ mẫu để có thể giảm thiểu nguy cơ sai số chọn mẫu ở một mức độ có thể chấp nhận được. Nhưng tôi đã chẳng bao giờ lựa chọn một kích cỡ mẫu dựa trên tính toán cả. Giống như những đồng nghiệp của mình, tôi đã tin vào phương pháp truyền thống và trực giác của tôi trong việc lên kế hoạch cho những thử nghiệm của mình và chưa từng suy nghĩ một cách nghiêm túc về vấn đề này. Khi Amos tới dự buổi hội thảo, tôi đã thực sự đi đến một kết luận rằng những trực giác của mình là không đầy đủ và trong quá trình diễn ra buổi hội thảo, chúng tôi đã nhanh chóng đồng thuận rằng những gã lạc quan người Michigan đã sai.
Amos và tôi đã bắt tay vào việc kiểm định giả thuyết: Liệu tôi là gã ngô nghê duy nhất hay là một thành viên trong một đám đông ngờ nghệch, bằng việc kiểm tra xem liệu rằng các nhà nghiên cứu Toán học có thể sẽ phạm phải những sai lầm tương tự hay không. Chúng tôi đã phát triển một bảng câu hỏi miêu tả những tình huống nghiên cứu thực tế, bao gồm các lặp lại của những thí nghiệm thành công. Nó đòi hỏi các nhà nghiên cứu phải lựa chọn các kích cỡ mẫu và lý giải cho việc ra quyết định có khả năng dẫn đến nguy cơ thất bại và khuyến cáo những nghiên cứu sinh cho việc lên kế hoạch nghiên cứu của họ. Amos đã thu thập phản hồi của một nhóm những người tham gia có kinh nghiệm (bao gồm các tác giả của hai cuốn sách giáo khoa về thống kê) tại một buổi họp của Hiệp hội Tâm lý Toán học. Các kết quả đã thật rõ ràng: Tôi đã không phải là gã ngờ nghệch duy nhất. Mọi nhầm lẫn mà tôi đã mắc phải cũng gặp ở phần lớn những người tham gia trả lời câu hỏi của chúng tôi. Điều đó là rõ ràng ngay cả với các chuyên gia đã không mấy chú tâm vào kích cỡ mẫu.
Amos và tôi đã gọi bài báo viết chung đầu tiên của chúng tôi là “Niềm tin vào quy luật số nhỏ.” Chúng tôi giải thích một cách biện chứng rằng “những khả năng trực giác về việc lấy mẫu ngẫu nhiên có vẻ thỏa mãn quy luật số nhỏ, cũng như nó khẳng định rằng quy luật số lớn ứng dụng vào nghiên cứu quy luật số nhỏ cũng y như vậy.” Chúng tôi cũng đã gộp cả một lời nhận định được bày tỏ mạnh mẽ rằng các nhà nghiên cứu đánh giá “những khả năng trực giác thống kê của mình với sự hoài nghi đúng đắn và thay thế sự hình thành ấn tượng ấy bởi sự tính toán bất kể khi nào có thể.”
MỘT SAI LỆCH VỀ SỰ tự TIN CHẮC VƯỢT QUA SỰ HỒ NGHI
Một cuộc thăm dò qua điện thoại gồm 300 người cao tuổi mà 60% trong số đó bầu cho tổng thống.
Nếu bạn phải tổng kết thông điệp của tuyên bố này trong vẻn vẹn ba từ, liệu chúng có thể là gì? Gần như chắc chắn bạn sẽ chọn “Người già ủng hộ Tổng thống” (Elderly support President). Những từ này đưa ra lý do chính cho câu chuyện. Chi tiết bị bỏ qua trong cuộc bầu cử, vốn được tiến hành qua điện thoại với một mẫu là 300 người, đó là không quan tâm tới bản thân những người già; họ cung cấp thứ thông tin nền tảng không mấy cuốn hút. Tổng kết của bạn có thể sẽ tương tự vậy nếu kích cỡ mẫu trở nên khác biệt. Dĩ nhiên, một con số vô lý nào đó hoàn toàn có thể thu hút được sự quan tâm của bạn (“một cuộc bầu cử qua điện thoại đối với 6 [hoặc 60 ngàn] cử tri già yếu…”). Tuy nhiên, trừ khi bạn là một chuyên gia, bạn không thể tác động trở lại một cách khác biệt với một mẫu gồm 150 người và với một mẫu gồm 3.000 người. Đây chính là ý nghĩa của lời tuyên bố rằng “con người không đủ nhạy bén với kích cỡ mẫu.”
Thông điệp về cuộc bầu cử này bao gồm thông tin thuộc hai dạng: Câu chuyện và nguồn gốc của câu chuyện. Hiển nhiên là, bạn tập trung vào câu chuyện hơn là vào tính đáng tin cậy của các kết quả. Tuy nhiên, khi tính đáng tin cậy này thấp một cách rõ ràng, thông điệp sẽ bị nghi ngờ. Nếu bạn được bảo rằng “một nhóm người ủng hộ đã tiến hành một cuộc thăm dò không đầy đủ và thiên lệch nhằm chỉ ra rằng người già ủng hộ tổng thống…”, dĩ nhiên bạn sẽ bác bỏ những phát hiện về cuộc thăm dò và chúng sẽ không trở thành một phần của điều mà bạn tin tưởng. Thay vào đó, nhóm người ủng hộ thăm dò và các kết quả sai lệch của nó sẽ trở thành một câu chuyện mới về những dối trá chính trị. Bạn có thể lựa chọn không tin vào một thông điệp trong những trường hợp rõ ràng như thế này. Nhưng bạn có phân biệt được chính xác giữa “tôi đọc trên tờ Thời báo New York …” với “Tôi nghe đồn rằng …” hay không? Hệ thống 1 của bạn có thể phân biệt được các cấp độ niềm tin? Nguyên tắc WYSIATI chỉ ra rằng điều đó là không thể.
Như tôi đã miêu tả trước đó, Hệ thống 1 không đa nghi. Nó loại bỏ sự mơ hồ và tự động tạo ra các câu chuyện mạch lạc nhất có thể. Trừ khi thông điệp đó ngay lập tức bị phủ nhận, các liên tưởng mà nó gợi ra sẽ lan truyền như thể thông điệp đó là sự thật. Hệ thống 2 lại có chiều hướng hoài nghi, bởi nó có thể duy trì những khả năng xung đột nhau trong cùng một thời điểm. Tuy nhiên, hoạt động duy trì sự hoài nghi này khó khăn hơn việc chuyển vào trạng thái chắc chắn. Quy luật của những con số nhỏ là một biểu hiện về một sai lệch chung, thiên về sự chắc chắn hơn là sự hoài nghi, chúng sẽ lộ diện dưới nhiều hình thức khác trong các chương kế tiếp.
Sai lệch rõ rệt hướng đến sự tin tưởng ở các mẫu nhỏ giống hệt với ví dụ về mật độ dân số để từ đó chúng được phác họa cũng là một phần của một câu chuyện lớn hơn: Chúng dễ dàng thổi phồng tính nhất quán và sự cố kết của những gì chúng ta thấy. Niềm tin bị thổi phồng của các nhà nghiên cứu vào thứ có thể được rút ra từ một vài lời nhận xét có quan hệ mật thiết với hiệu ứng hào quang, khả năng phán đoán mà chúng ta thường có khi chúng ta nghĩ về một người mà thực sự chúng ta hiểu rất ít về họ. Hệ thống 1 chạy trước thực tế trong hoạt động tạo lập một hình ảnh sống động dựa trên sự phiên giải của những dấu hiệu rời rạc. Một cách vô thức đối với việc đi tới các kết luận sẽ diễn ra như thể nó đã tin vào quy luật số nhỏ. Tổng quát hơn, nó sẽ sản sinh ra một hình dung về thực tại điều này có ý nghĩa rất lớn trong tình huống này.
NGUYÊN NHÂN VÀ THỜI CƠ
Cơ chế liên kết tìm kiếm những nguyên nhân. Trở ngại mà chúng ta có với những nguyên tắc của thống kê đó là chúng cần đến một phương pháp khác biệt. Thay vì tập trung vào các biến cố chắc chắn, thì nguyên tắc của thống kê lại liên kết biến cố này với điều có thể vừa mới xảy ra. Nói cụ thể thì không điều gì có thể khiến nó trở thành thứ mà nó vốn những phương án thay thế cho nó.
Dự đoán của chúng tôi về hoạt động tư duy nhân quả đẩy chúng tôi đến những sai lầm nghiêm trọng trong việc đánh giá tính ngẫu nhiên của các biến cố diễn ra ngẫu nhiên thực sự. Ví dụ, thu thập giới tính của sáu đứa trẻ được sinh ra theo tuần tự ở cùng một bệnh viện. Chuỗi các bé trai và các bé gái rõ ràng là ngẫu nhiên, các biến cố này độc lập với nhau, và số các bé trai và bé gái được sinh ra trong bệnh viện tại thời điểm vài giờ trước đó không hề tác động gì tới giới tính của những đứa trẻ sinh ra sau đó. Giờ hãy xem xét ba chuỗi có thể xảy ra:
TTTGGG
GGGGGG
TGTTGT
Các chuỗi này có thể xảy ra không? Câu trả lời trực giác “dĩ nhiên là không!” là hoàn toàn sai. Bởi các biến cố diễn ra độc lập, bởi các kết quả T và G có thể xảy ra trường hợp bằng (xấp xỉ) nhau, bởi thế mà bất cứ chuỗi gồm 6 ca sinh có thể xảy ra nào cũng có khả năng xảy ra tương đương với những chuỗi khác. Thậm chí ngay cả bây giờ khi bạn biết được rằng kết luận này là đúng, nó vẫn mâu thuẫn với trực giác, bởi chỉ có chuỗi thứ ba là có vẻ ngẫu nhiên. Như đã được dự tính, chuỗi TGTTGT được cho là có khả năng xảy ra nhiều hơn so với hai chuỗi còn lại. Chúng ta là những người tìm kiếm mẫu mực, những tín đồ của một thế giới gắn kết, tại đó các quy tắc (ví dụ như một chuỗi gồm sáu bé gái) xuất hiện không bởi sự tình cờ mà giống như là một kết quả của phép nhân quả máy móc hoặc từ ý định của một ai đó. Chúng ta không hy vọng quy tắc được sinh ra bởi một quy trình ngẫu nhiên và khi chúng ta nhận ra thứ có vẻ như là một quy luật, chúng ta nhanh chóng loại bỏ ý niệm rằng quy trình ấy thực sự là ngẫu nhiên. Các quy trình ngẫu nhiên sinh ra rất nhiều các chuỗi thuyết phục người ta rằng quy trình này xét cho cùng thì không hề ngẫu nhiên. Bạn có thể thấy tại sao việc thừa nhận phép nhân quả đã có thể đạt tới những lợi ích mang tính tiến hóa. Đó là một phần của sự thận trọng nói chung mà chúng ta đã được kế thừa từ tổ tiên. Một cách bản năng chúng ta vào vai người bảo vệ trước nguy cơ môi trường bị biến đổi. Loài sư tử có thể xuất hiện ở vùng đồng bằng vào những thời điểm ngẫu nhiên nhưng có thể sẽ là an toàn hơn khi cảnh báo và phản ánh trước một sự gia tăng rõ rệt về tỷ lệ xuất hiện đông đảo nhất của sư tử, ngay cả khi thực sự là do những dao động của một quy trình ngẫu nhiên gây ra.
Đôi lúc sự hiểu lầm một cách phổ quát về tính ngẫu nhiên mang lại những hệ quả to lớn. Trong một bài báo của chúng tôi về tính đại diện, Amos và tôi đã trích dẫn William Feller, nhà thống kê học, người đã minh chứng rằng người ta tìm thấy những khuôn mẫu ở nơi không hề có con người tồn tại. Trong vụ ném bom tập trung ở London trong Thế chiến thứ II, hầu hết người ta đã tin rằng việc ném bom không thể là ngẫu nhiên bởi bản đồ các điểm trúng bom đã lộ ra những khoảng trống đáng chú ý. Một số người đã ngờ rằng các điệp viên của Đức đã ẩn mình tại các vùng không bị tấn công. Một phép phân tích thống kê cẩn trọng đã khám phá ra rằng việc rải bom trúng các điểm là một chu trình ngẫu nhiên điển hình và cũng điển hình như trong việc gợi lên một ấn tượng sâu sắc rằng đó không phải là ngẫu nhiên. “Đối với con mắt trần tục,” Feller nhận định “tính ngẫu nhiên có vẻ như là một quy tắc hoặc xu hướng bầy đàn/đám đông.”
Tôi đã nhanh chóng có được cơ hội để ứng dụng điều mà tôi đã lĩnh hội được từ Feller. Cuộc chiến Yom Kippur nổ ra vào năm 1973 và đóng góp đáng kể duy nhất của tôi vào kết quả của cuộc chiến đó là đã cố vấn cho các quan chức cấp cao trong Không lực Israel đình chỉ một cuộc điều tra. Cuộc không chiến ban đầu diễn biến khá tồi tệ đối với Israel, khả năng chiến đấu tốt đến không ngờ của tên lửa đất đối không của Ai Cập. Tổn thất là vô cùng lớn và tên lửa có vẻ như được rải không đồng đều. Tôi đã được thông báo về hai phi đội cất cánh từ cùng một căn cứ, một phi đội đã hy sinh bốn chiến cơ trong khi phi đội còn lại không tổn thất gì. Một cuộc điều tra đã được mở ra với hy vọng rút ra được chính xác phi đội không may kia đã phạm phải sai lầm gì. Không hề có lý do nào trước đó để tin rằng một trong số những phi đội này hoạt động hiệu quả hơn so với số phi đội còn lại và không có bất cứ khác biệt mang tính vận hành nào được tìm thấy nhưng dĩ nhiên cuộc sống của các phi công lại khác biệt theo nhiều cách ngẫu nhiên, bao gồm như tôi nhớ lại, họ thường bao lâu mới trở về nhà giữa các nhiệm vụ và một vài điều gì đó về hoạt động thẩm vấn. Lời khuyên của tôi đó là người chỉ huy nên chấp nhận rằng các kết quả khác biệt là bởi sự ăn may, rằng hoạt động thẩm tra các viên phi công nên dừng lại. Tôi đã nêu ra lý do rằng may mắn là câu trả lời có khả năng nhất trong tình huống này, để kiếm tìm một nguyên nhân khó xác định là việc làm vô ích, rằng trong khoảng thời gian khốn khổ ấy các viên phi công trong phi đội đã phải chịu đựng những tổn thất mà họ không cần thiết phải mang thêm bởi gánh nặng mình mắc lỗi.
Một vài năm sau, Amos và các sinh viên của mình là Tom Gilovich và Robert Vallone đã gây ra một sự chấn động bằng nghiên cứu của họ về những nhận thức sai lầm về tính ngẫu nhiên trong môn bóng rổ. “Sự thực” là các cầu thủ đạt ngưỡng cự phách vẫn thường được thừa nhận bởi các cầu thủ, huấn luyện viên và người hâm mộ. Kết luận này không thể chối cãi được: Một cầu thủ ném bóng trúng ba hoặc bốn lần vào rổ trong một lượt ném bóng và bạn không thể dừng việc hình thành một nhận định nhân quả rằng cầu thủ này hiện tại đang ở phong độ thi đấu tốt để ghi bàn. Các cầu thủ ở cả hai đội cũng thừa nhận với nhận định này là các cầu thủ cùng đội càng có nhiều khả năng vượt qua cầu thủ đang ở phong độ thi đấu tốt và cầu thủ phòng ngự thì càng có nhiều khả năng để phòng thủ hai kèm một. Bảng phân tích hàng ngàn lượt ném bóng đã dẫn tới một kết luận gây thất vọng: Không hề có thứ kiểu như là một tay cự phách trong bóng rổ nhà nghề, hoặc ném bóng từ ngoài vạch ném phạt hoặc ghi điểm từ vạch phạm lỗi. Dĩ nhiên, một số cầu thủ ném chính xác hơn các cầu thủ khác, nhưng lượt ném bóng thành công và ném bóng lỗi đều thỏa mãn các bài kiểm tra về tính ngẫu nhiên. Tay ném cự phách hoàn toàn chỉ có trong mắt của các khán giả, những người trước sau đều quá nóng vội để nhận biết trật tự và nguyên nhân của tính ngẫu nhiên. Tay ném cự phách là một ảo tưởng về nhận thức hàng loạt và phổ quát.
Phản ứng của công chúng trước nghiên cứu này là một phần của câu chuyện. Phát hiện này đã được khơi dậy bởi cánh báo chí từ kết luận gây ngạc nhiên của nó và phản ứng của họ thường là không tin vào kết luận này. Khi vị huấn luyện viên tiếng tăm của đội Boston Celtics, Red Auerbach, nghe về Gilovich và nghiên cứu của ông, ông đã phản pháo, “Quý ngài đó là ai? Vậy mà ông ta vẽ ra một cuộc nghiên cứu cơ đấy. Tôi không thể bận tâm hơn được.” Xu hướng phát hiện ra những hình mẫu trong tính ngẫu nhiên là thứ không thể cưỡng lại được, chắc chắn nó gây ấn tượng nhiều hơn là một quý ngài nào đó vẽ ra một nghiên cứu.
Sự ảo tưởng về hình mẫu chuẩn tác động tới đời sống bên ngoài sân bóng rổ của chúng ta theo nhiều cách khác. Bạn nên chờ đợi ít nhất bao nhiêu năm trước khi đi đến kết luận rằng một viên cố vấn đầu tư cực kỳ khôn ngoan? Cần phải có bao nhiêu vụ sáp nhập thành công để cho ban giám đốc tin rằng CEO có sự tinh nhạy khác thường đối với những hợp đồng như vậy? Câu trả lời đơn giản cho những câu hỏi này đó là nếu bạn tuân theo trực giác của mình, bạn sẽ luôn luôn phạm sai lầm bởi việc nhận dạng sai một biến cố ngẫu nhiên như là một biến cố có hệ thống. Chúng ta rất sẵn sàng để loại bỏ niềm tin rằng rất nhiều điều mà chúng ta thấy được trong cuộc sống là ngẫu nhiên.
Tôi đã bắt đầu chương này với ví dụ về phạm vi ảnh hưởng của căn bệnh ung thư thận dọc nước Mỹ. Ví dụ này có ở một cuốn sách dành cho các giáo viên ngành thống kê, nhưng tôi đã lĩnh hội được điều này từ một bài báo thú vị được viết bởi hai nhà thống kê học mà tôi đã trích dẫn ở trên, Howard Wainer và Harris Zwerling. Bài luận của họ đã tập trung vào một khoản đầu tư lớn, khoảng 1.7 tỉ đô-la, đây là khoản tiền mà Quỹ Gates đã bỏ ra nhằm theo đuổi những phát hiện gây chú ý về đặc trưng của các trường học thành công nhất. Nhiều nhà nghiên cứu đã cố tìm kiếm bí mật của nền giáo dục thành công bằng việc định danh các trường học thành công nhất với hy vọng khám phá ra điều khác biệt giữa họ với các trường khác. Một trong số các kết luận từ nghiên cứu này đó là các trường học thành công nhất, tính trung bình, đều là những trường nhỏ. Trong một cuộc khảo sát 1.662 trường học tại Pennsylvania, ví dụ, 6 trường trong top 50 đều là những trường nhỏ. Những số liệu này đã khuyến khích Quỹ Gates bỏ ra một khoản đầu tư đáng kể cho việc thành lập các trường học nhỏ, đôi lúc qua hoạt động chia tách các trường học lớn thành các trường nhỏ hơn. Ít nhất có tới nửa tá các cơ quan uy tín khác, ví dụ như Quỹ Annenberg và Pew Charitable Trust, đã tham gia vào nỗ lực này, như đã làm ở chương trình Giáo dục Cộng đồng nhỏ hơn của Bộ Giáo dục Mỹ.
Khả năng này tạo ra ý thức về trực giác cho bạn. Thật dễ để tạo nên một câu chuyện nhân quả để lý giải việc các trường học nhỏ có khả năng mang đến nền giáo dục tốt hơn như thế nào và do vậy nó đào tạo ra những học sinh có thành tích cao bằng việc quan tâm và khích lệ hơn những gì các em học sinh này có thể nhận được tại các trường học lớn hơn. Thật không may, phép phân tích nhân quả này là không hiệu quả bởi những lập luận này hoàn toàn sai. Nếu các nhà thống kê vốn chịu trách nhiệm trước quỹ Gates từng được hỏi về những đặc trưng của các trường học tồi nhất, họ sẽ phát hiện ra rằng các trường yếu kém cũng thường là các trường nhỏ hơn. Sự thực là các trường học nhỏ chẳng khá gì hơn các trường ở mức trung bình; chúng đơn giản chỉ là biến thiên hơn. Nếu bất cứ thứ gì lớn, nói theo cách Wainer và Zwerling, có xu hướng sản sinh ra các kết quả tốt hơn, đặc biệt là các cấp học cao hơn thì tại đó có một loạt các phương pháp giảng dạy có giá trị.
Nhờ có những tiến bộ gần đây trong ngành Tâm lý nhận thức, chúng ta giờ có thể thấy rõ ràng điều mà Amos và tôi đã chỉ có thể thoáng nhận ra: “Quy luật số nhỏ” là một phần của hai câu chuyện lớn hơn về các vận hành của trí não.
- Niềm tin được phóng đại vào những mẫu nhỏ chỉ là một ví dụ về một ảo tưởng phổ quát hơn. Chúng ta chú tâm nhiều tới nội dung của thông điệp hơn là tới thông tin về tính tin cậy của chúng, và khi một kết quả kết thúc bằng một quan niệm về thế giới xung quanh ta, nó đơn giản hơn và gắn kết hơn so với dữ liệu phân tích. Việc vội vàng chấp nhận các kết luận là một biến dị trong thế giới tưởng tượng của chúng ta, nó an toàn hơn so với trong thực tại.
- Các phép thống kê sản sinh ra nhiều lời nhận xét mà chúng có vẻ như trông chờ ở những sự lý giải nhân quả nhưng bản thân chúng lại không thích hợp với những lý giải kiểu như vậy. Nhiều sự kiện của thế giới diễn ra là bởi sự ngẫu nhiên, bao gồm cả những sự tình cờ trong việc lấy mẫu. Các lý giải nhân quả về các biến cố ngẫu nhiên là hoàn toàn sai.
BÀN VỀ QUY LUẬT SỐ NHỎ
“Vâng, xưởng đã có được 3 bộ phim thành công kể từ khi tân CEO tại vị. Nhưng vẫn còn quá sớm để phán rằng ông ta là một tay cự phách.”
“Tôi sẽ không tin rằng thương nhân mới nổi này là một thiên tài trước khi một nhà thống kê được mời tới để hỏi ý kiến, người mà có thể ước lượng khả năng có thể xảy ra đối với vận mệnh của vị thương nhân kia là một biến cố ngẫu nhiên.”
“Mẫu của các kết luận kia quá nhỏ để đưa ra bất cứ kết luận nào. Đừng có tuân theo quy luật số nhỏ.”
“Tôi dự định giữ bí mật các kết quả thử nghiệm cho tới khi chúng ta có được một mẫu đủ lớn. Hoặc không thì chúng ta sẽ đối mặt với sức ép đạt tới một kết luận vội vàng.”
No comments:
Post a Comment