[Fragments of Science #2]

English

Giả sử một ngày nào đó bạn vừa đi ra khỏi nhà và bỗng nhiên giẫm trúng phải thứ gì đó và ngã chỏng quèo. Bạn quay lại và xem “thủ phạm” là ai, thì trước mặt bạn là một tờ tiền mà ai đó đã đánh rơi.

Bạn hoàn toàn có thể nói là bạn đã “may mắn”. Nói một cách khoa học hơn, bạn vừa gặp một chuỗi sự kiện ngẫu nhiên với kết quả có lợi cho bạn. Và với mỗi chúng ta, có lẽ việc gặp phải những chuỗi sự kiện như thế này đã trở thành việc thường tình, và thậm chí một số đã gặp phải các chuỗi sự kiện lặp lại đó nhiều hơn là một lần.

Vậy ta đặt ra câu hỏi: Liệu các chuỗi sự kiện này có thật sự “ngẫu nhiên”? Có cách nào có thể giải thích được chúng hay không? Và hơn thế nữa, làm thế nào để tối ưu hóa vận may của bản thân? Hôm nay chúng ta sẽ cùng cố gắng giải đáp các câu hỏi đó nhé!

Trước khi ta đến với phân tích, 2 câu hỏi đầu tiên có thể dễ dàng được trả lời. Các chuỗi sự kiện như trên thực sự là ngẫu nhiên, tuy vậy chúng không phải là “từ trên trời rơi xuống”. Thực tế, luôn có một khả năng rất nhỏ được đặt ra cho sự kiện. Vì vậy, khi nói tới vận may, thực ra ta đang nói đến khả năng này, và khi nói đến ‘tối ưu hóa vận may’, ta có thể hiểu theo 1 trong 2 cách: hoặc là cải thiện khả năng này hết mức có thể, hoặc là dự đoán với độ chính xác nhất khả năng này để có thể đưa ra quyết định đúng đắn nhất.

Vậy ta hãy lấy ví dụ cho một sự kiện bất kì với các trường hợp đầu ra phân biệt. Mỗi trường hợp này có một khả năng nhất định cho xảy ra, và khả năng này được định nghĩa là số lần đạt được kết quả mong muốn chia cho tổng số lần thử với điều kiện là số lần thử phải rất lớn. Lẽ dĩ nhiên, tổng khả năng của các trường hợp phân biệt phải bằng 1, hay 100%. 

Vậy có phải là ta chỉ cần tham khảo các lần thử trước đó để rút ra khả năng xảy ra của sự việc, rồi quyết định có nên làm hay không? Về lý thuyết thì điều này đúng hoàn toàn, tuy vậy để có thể áp dụng được cách làm này, ta trước hết phải đảm bảo các điều kiện trùng khớp nhau. Giả dụ như cùng một bài kiểm tra, nếu bạn khoanh bừa tất cả các câu, thì bạn có khả năng bằng nhau cho tất cả các số điểm từ 0 đến 10; tuy nhiên nếu bạn học chăm chỉ thì khả năng nhận điểm kém sẽ giảm đi đáng kể. Rõ ràng sự khác biệt trong điều kiện, cụ thể là lượng kiến thức, đã gây nên sự thay đổi trong phân bố khả năng của các trường hợp.

Trên thực tế, rất khó tìm được mẫu sự việc đủ lớn với điều kiện trùng khớp hoàn toàn để có thể thực hiện so sánh đúng tuyệt đối. Chính vì thế, các nhà thống kê đã quyết định sáng chế ra độ lệch chuẩn, nói nôm na có thể hiểu là biên độ của sự “may mắn” của bạn. Với một trường hợp bất kì, có 68% khả năng là nó nằm trong bán kính 1 độ lệch chuẩn từ trung bình và 95% khả năng nó nằm trong bán kính 2 độ lệch chuẩn từ trung bình. Để hiểu thêm về phần này, các bạn có thể đọc thêm về phân phối chuẩn trong đường dẫn cuối bài.

Vậy giả dụ bạn chơi ném phi tiêu ở hội chợ 20 lần và có thống kê rằng trong rất nhiều người ném 20 lần trước bạn, số lần ném trúng trung bình là 5 với độ lệch chuẩn là 2. Vậy bạn có thể yên tâm là khả năng bạn trượt hoàn toàn 20 lần là rất khó – có đến 95% bạn sẽ ném trúng từ 1 đến 9 lần.

Như các bạn thấy, ngay cả may mắn cũng có giới hạn của nó.

Vậy cuối cùng, ta có thể “tối ưu hóa vận may” của mình thế nào? Theo cách hiểu thứ nhất, ta phải cải thiện tối đa các yếu tố liên quan, qua đó cải thiện khả năng tổng thể. Điều này nhiều khi đồng nghĩa với việc giảm thiểu các yếu tố có hại. Giả dụ như trò tung đồng xu – bạn sẽ muốn giảm bề dày đồng xu càng nhiều càng tốt để làm giảm đi khả năng đồng xu dựng đứng (mặc dù rất nhỏ), qua đó cải thiện khả năng chiến thẳng của mình. Một điều đáng chú ý là các hình thức chơi xấu cũng thuộc loại tối ưu hóa vận may thứ nhất, bởi vì chúng giúp cải thiện khả năng thắng của bản thân qua việc tác động các yếu tố có lợi.

Theo cách nhìn thứ hai, ta phải tăng lượng dữ liệu đang có, qua đó làm giảm độ lệch chuẩn và có một ước lượng chính xác hơn về “khoảng may mắn” của chúng ta. Một khái niệm khá quan trọng trong việc tính toán khả năng này chính là khoảng tin cậy, trong đó một khoảng giá trị được tính toán trước có tỉ lệ cao chứa khả năng cần tìm. Giả sử bạn không biết máy trò chơi này có tỉ lệ thắng là bao nhiêu, nhưng nếu khoảng tin cậy mức độ 95% của nó là từ 0.2 đến 0.4, điều đó nghĩa là khả năng chiến thẳng mà máy đã định trước có đến 95% khả năng sẽ nằm từ 0.2 đến 0.4. Nói cách khác, bạn luôn thua nhiều hơn thắng, và do đó không nên chơi. Một lưu ý quan trọng là độ rộng của khoảng tin cậy tỉ lệ nghịch với căn của số mẫu, chính vì thế chúng ta có càng nhiều dữ liệu thì ước tính khoảng này càng chính xác.  

Với 2 cách làm trên, mỗi người chúng ta đều có thể quản lý các rủi ro trong cuộc sống tốt hơn, hay trở nên “may mắn” hơn!

Tài liệu tham khảo cho bài viết:

Nguyễn Văn Xuân (14-01-2018). Phân phối chuẩn trong thống kê và ý nghĩa trong thực tế, giáo dục. http://pup.edu.vn/index.php/news/Nghien-cuu-Trao-doi/Phan-phoi-chuan-trong-thong-ke-va-y-nghia-trong-thuc-te-giao-duc-1259.html

Math Is Fun Advanced. (2017). Confidence Intervals. https://www.mathsisfun.com/data/confidence-interval.html

_______________

[FRAGMENTS OF SCIENCE # 2] – LUCK – STATISTICS

Supposing one day you just walked out of your house and suddenly stepped on something and fell. When turning back to see who the “culprit” is, you suddenly faced a bill that someone has dropped.

You could totally say that you were “lucky”. More scientifically saying, you have just come across a series of random events whose results are positive to you. Actually, for each of us, perhaps encountering these series of events has become normal, and even some have encountered such repetitive series of events more than once.

So one question is asked: Are these series of events truly “accidental”? Is there any way to explain them? Moreover, how to optimize your luck? Let’s try to find the answer today!

Before we get to the analysis, the first two questions can easily be answered. These sequences are random, however, not “falling from heaven”. In fact, there is always a very small possibility set for each event. So when it comes to luck, actually we’re talking about this possibility, and when it comes to “optimizing luck”, we can understand it in one of two ways: either to improve it as much as possible or to predict this possibility most accurately to make the best decision.

Let’s take the example of a random event with different output cases. Each of these cases has a certain likelihood to occur, and this likelihood (or how we call it, “possibility”) is defined as the number of times we can get the desired result divided by the total number of tests, provided that the number of attempts has to be very large. Of course, the total possibility of different cases must be 1, or 100%.

So do we just need to refer to previous attempts to conclude the possibility of the incident, then decide whether or not to do it? Theoretically, this is completely true, but to apply this approach, we must first ensure all the conditions coincide. Assuming in the same test, if randomly circling all the sentences, you are then equally likely to have any mark from 0 to 10; however, if you study hard, the possibility you receive a bad mark will decrease significantly. Clearly, the difference in conditions, namely the amount of knowledge, has caused a change in the probability distribution of cases.

In fact, it is extremely difficult to find a sufficiently large sample of events with conditions that completely coincide so that an absolute true comparison can be made. Therefore, statisticians have decided to invent the standard deviation, which can be roughly interpreted as the amplitude of your “luck”. In any case, there is a 68% chance that it is within a radius of 1 standard deviation from the mean and 95% probability it is within a radius of 2 standard deviations. To know more about this, please kindly refer to the webpage on normal distribution in the references below.

So if you play a dart-throwing game at a fair 20 times, and statistics have shown that previous 20-turn players hit the target an average of 5 times with a standard deviation of 2 times, then you can rest assured that there is very low chance that you will not hit any of your shots – 95% of the time you will hit between 1 and 9 shots.

As you can see, even luck has its limits.

So in the end, how can we “optimize” our luck? According to the first understanding, we must improve the relevant factors, thereby improving the overall possibility. This in most cases is synonymous with reducing harmful factors. For example, in the coin-tossing game, you would like to reduce the width of the coin as much as possible to reduce the chance of it standing upright and resulting in neither heads nor tails, thereby improving your own chances of winning. It is worth mentioning that dirty plays also belong to this category of luck-improvement, as it improves your chances of winning by putting in beneficial factors.

By the second perspective, we have to increase the amount of data we have, thereby reducing the standard deviation and having a more accurate estimate of our “range of luck”. A relatively important concept regarding this is the confidence interval, which is basically a calculated interval with a high chance of containing the true probability. Let’s say, for instance, there is a game machine that we don’t know the winning probability, but if the 95% confidence interval is from 0.2 to 0.4, then there is 95% chance that this probability will fall from 0.2 to 0.4. In other words, don’t play, because you will be likely to lose more than you win. An important notice is that the confidence interval is inversely proportional to the square root of the sample size, therefore the more data we gather, the more accurate our prediction would be.

With these two ways, each of us can manage the risks in life better, or become “luckier”!

References for the article:

Nguyễn Văn Xuân (14-01-2018). Phân phối chuẩn trong thống kê và ý nghĩa trong thực tế, giáo dục. http://pup.edu.vn/index.php/news/Nghien-cuu-Trao-doi/Phan-phoi-chuan-trong-thong-ke-va-y-nghia-trong-thuc-te-giao-duc-1259.html

Math Is Fun Advanced. (2017). Confidence Intervals. Retrieved from https://www.mathsisfun.com/data/confidence-interval.html

Trả lời

Mời bạn điền thông tin vào ô dưới đây hoặc kích vào một biểu tượng để đăng nhập:

WordPress.com Logo

Bạn đang bình luận bằng tài khoản WordPress.com Đăng xuất /  Thay đổi )

Google photo

Bạn đang bình luận bằng tài khoản Google Đăng xuất /  Thay đổi )

Twitter picture

Bạn đang bình luận bằng tài khoản Twitter Đăng xuất /  Thay đổi )

Facebook photo

Bạn đang bình luận bằng tài khoản Facebook Đăng xuất /  Thay đổi )

Connecting to %s