Liên quan đến khái niệm cơ bản về thống kê - dự báo (Phần 1)

Liên quan đến các khái niệm cơ bản về thống kê - dự báo

Liên quan đến khái niệm cơ bản về thống kê - dự báo (Phần 1)

1 Thống kê
Từ “Thống kê” được hình thành từ tiếng Lating là “Status” hoặc từ tiếng Italia “Statista” được từ tiếng Đức “Statistik”, mỗi từ đó đều có ý nghĩa là “hình thái chính trị” hoặc “trạng thái hiện tượng”.
Các tác giả dùng từ “Thống kê” theo các ý nghĩa khác nhau. Tuy vậy, trong bài viết này, từ “Thống kê” được nhìn nhận với hai nghĩa sau:
- Nó được dùng để chỉ số liệu về một chủ đề nào đó như một lời khẳng định. Chẳng hạn, một vị Bộ trưởng khi giải trình trước Quốc hội đã trích dẫn số liệu để nói rằng, nền kinh tế việt nam tăng trưởng trong năm 2003 là 7,3%. Trong trường hợp này, từ “Thống kê” được sử dụng với ý nghĩa số lớn.
- Từ “Thống kê” còn là tên gọi của một ngành khoa học gắn với việc thu thập và phân tích số liệu thực tế. Thống kê nghiên cứu mặt lượng trong mối liên hệ với mặt chất của các hiện tượng, quá trình kinh tế - xã hội và tự nhiên.
Khoa học thống kê thực sự phát triển từ cuối thế kỷ XIX. Nó được ứng dụng vào hầu hết các lĩnh vực khoa học như: Vật lý, Sinh học, Nông nghiệp, Kế hoạch, Tâm lý, Ngôn ngữ, Kinh tế, Tài chính, Ngân hàng... Các phương pháp thống kê được dùng nhiều trong nghiên cứu khoa học, là công cụ hữu hiệu cho việc lập kế hoạch, xây dựng chính sách của chính phủ và Nhà nước.
Bản chất của khoa học thống kê liên quan tới những khái niệm sau:

2 Cá thể và tổng thể
Cũng như khái niệm tập hợp và phần tử trong toán học, khái niệm tổng thể và cá thể không được định nghĩa, gắn liền với nhau như hình với bóng. Khái niệm này có thể mô tả qua một số minh hoạ đơn giản sau.
Minh hoạ 1: Giả sử bạn đang tiến hành một cuộc điều tra về các hộ gia đình thường trú tại thành phố Hồ Chí Minh (tại một thời gian nhất định), thu thập tài liệu mỗi hộ gia đình các thông tin về các đặc tính sau đây:

Số thứ tự hộ

Nhận dạng (tên chủ hộ, địa chỉ...)

Dân tộc của chủ hộ

Loại hộ

Thu nhập hàng tháng của hộ (đơn vị tính)

1

Trần Dạo Dực

Kinh

A

1.000.000 đồng

2

Nguyến Tiến Tùng

Kinh

D

200.000. đồng

...

Trong biểu trên, mỗi dòng liên quan tới các quan sát về một hộ nhất định. Lưu ý rằng, bạn chỉ quan tâm nghiên cứu về tập hợp các hộ gia đình thường trú tại thành phố Hồ Chí Minh (tại một thời gian nhất định), chứ không quan tâm nghiên cứu về một hộ gia đình cụ thể nào cả.
Minh hoạ 2: Chúng ta xem xét một cuộc điều tra các doanh nghiệp tư nhân trong một thành phố nào đó. Giả thiết đã sử dụng một hệ thống các khái niệm thích hợp và thông dụng. Qua kiểm tra, đã thu thập được một số đặc tính của toàn bộ các doanh nghiệp đang hoạt động tại một thời điểm cụ thể trong thành phố.

Số TT doanh nghiệp

Nhận dạng (địa chỉ, tên giám đốc...)

Loại ngành

Số lượng công nhân

Lợi nhuận của năm trước (đơn vị tính)

1

2

...

Ở đây, mỗi dòng là các quan sát về một doanh nghiệp tư nhân nhất định. Chúng ta sẽ nghiên cứu, tập hợp các doanh nghiệp tư nhân trong thành phố nói trên.
Các minh hoạ nói trên đã làm sáng tỏ khái niệm tổng thể và cá thể.
Cá thể là một phần tử hoặc một đơn vị, một yếu tố... mà dựa vào đó có thể quan sát, ghi chép, đo lường một số đặc tính cụ thể. Trong minh hoạ 1 cá thể là một hộ gia đình, trong minh hoạ 2 thì cá thể lại là một doanh nghiệp tư nhân.
Tổng thể là một tập hợp các cá thể có cùng một số đặc tính nào đó. ở minh hoạ 1 tổng thể là tập hợp các hộ gia đình thường trú tại thành phố Hồ Chí Minh trong một khoảng thời gian cụ thể, còn ở minh hoạ 2 tổng thể là tập hợp các doanh nghiệp tư nhân trong một thành phố tại một thời điểm cụ thể.

--PageBreak--
3 Tiêu thức và chỉ tiêu
Qua hai minh hoạ ở mục 1.2, người ta nghiên cứu các đặc tính của tổng thể thông qua đặc tính trên từng cá thể. Trong minh hoạ 1, các đặc tính đó bao gồm: dân tộc của chủ hộ, loại hộ, thu nhập hàng tháng của mỗi hộ. Còn trong minh hoạ 2, bao gồm: loại ngành nghề, số công nhân, lợi nhuận năm trước của doanh nghiệp tư nhân. Tất nhiên, việc lựa chọn những đặc tính nào để thu thập thông tin là tuỳ thuộc vào mục đích nghiên cứu.
Để làm rõ khái niệm đặc tính của tổng thể, đặc tính của cá thể, có thể xem xét một số ví dụ khác.
- Khi nghiên cứu kiến thức sau một năm học của một nhóm sinh viên. Mỗi sinh viên là một cá thể xem xét, toàn bộ sinh viên trong nhóm là tổng thể nghiên cứu. Quan sát mỗi sinh viên các đặc tính sau: tuổi, giới tính, độ thông minh, điểm thi của từng môn học, hiện trạng kinh tế gia đình... Từ đó có thể tính được các đặc tính của tổng thể: tuổi trung bình mỗi sinh viên trong nhóm, điểm thi trung bình từng môn học của nhóm sinh viên...
- Khi nghiên cứu về hiện tượng sinh đẻ của toàn bộ các cặp vợ chồng trong một thành phố, một cặp vợ chồng là một cá thể, tổng thể nghiên cứu là toàn bộ các cặp vợ chồng trong thành phố đó. Hiện tượng sinh đẻ của tổng thể được nghiên cứu thông qua các đặc tính về mỗi cặp vợ chồng: tuổi kết hôn, số con (đã sinh và hiện còn sống), khoảng cách giữa các lần sinh kế tiếp nhau. Từ đó, hiện tượng sinh đẻ của tổng thể được phản ánh qua các đặc tính chung của tổng thể: tuổi kết hôn trung bình, số con trung bình, khoảng cách trung bình giữa 2 lần sinh kế tiếp của mỗi cặp vợ chồng trong làng.
Đến đây có thể trình bày ngắn gọn khái niệm tiêu thức và chỉ tiêu thường được dùng trong thống kê.
- Tiêu thức là đặc tính của từng cá thể của tổng thể.
- Chỉ tiêu là đặc tính chung của toàn bộ tổng thể.
Để phân biệt các khái niệm này và mối liên hệ giữa chúng, chúng ta trở lại minh họa 1. Giả sử chúng ta đã thu thập được số liệu về các hộ gia đình ở thành phố Hồ Chí Minh và đã tính được số trung bình cộng của toàn bộ số liệu ở cột thu nhập hàng tháng của hộ gia đình, giả sử tính được một con số là A (giá trị cụ thể ở đây không quan trọng). Một câu hỏi đặt ra: số A có cho biết vấn đề gì về một hộ gia đình cụ thể hay không? Xin trả lời: - Không. Tuy nhiên, số A cho biết thông tin hữu ích về thu nhập hàng tháng nói chung của toàn hộ gia đình thường trú tại thành phố Hồ Chí Minh (ở một khoảng thời gian cụ thể). Như vậy, chỉ tiêu nói lên một ý niệm bao trùm và khái quát về một tổng thể. Theo cách nhìn bao quát thì nó trái ngược với một thông tin về một cá thể. Tương tự, theo cột dân tộc của chủ hộ, chúng ta tính được B (đơn vị %) chủ hộ là dân tộc Kinh thì biết một khía cạnh về toàn bộ tổng thể chứ không phải về một hộ cụ thể nào cả.

4 Phân loại tiêu thức
Các số liệu bao gồm các con số nhận được qua quan sát, hoặc đo lường, hoặc tính toán. Các số liệu đó được phân loại thông qua phân loại các đặc tính của nó, và trước tiên thông qua phân loại tiêu thức.
Trong mục 3, các đặc tính được phân làm hai loại: chỉ tiêu và tiêu thức. Trong mục này các tiêu thức lại được phân loại một cách chi tiết hơn (xem sơ đồ).

Liên quan đến khái niệm cơ bản về thống kê - dự báo (Phần 1) ảnh 1

- Đối với các tiêu thức định tính hay thuộc tính, phân chia chi tiết hơn bao gồm: tiêu thức định tính không thể sắp tự được, tiêu thức định tính có thể sắp tự được.
- Giới tính, dân tộc... là những ví dụ về tiêu thức định tính không thể sắp tự được.
Nhưng tiêu thức định tính “khả năng hiểu biết” của sinh viên có thể phân hạng theo các mức độ: giỏi, khá, trung bình, kém (theo một trật tự giảm dần).
- Các tiêu thức định lượng như tuổi, điểm thi, thu nhập, số con của một cặp vợ chồng... có thể đo lường bằng những đơn vị thích hợp. Chúng còn có thể gọi là những biến số.
Những biến số được dùng trong thống kê, phổ biến là những biến số rời rạc. Chẳng hạn, số con của một cặp vợ chồng, thu nhập hàng tháng của một hộ gia đình...
Tuy nhiên, các biến số như chiều cao, cân nặng của một người... lại có thể mang giá trị lấp đầy một khoảng xác định, bao gồm cả phần thập phân. Chính vì vậy, có thể quan niệm chúng là những biến số liên tục. Đây thật sự là cầu nối giữa thực tiễn thống kê với toán học. Chẳng hạn, một nhóm 11 người mẫu có chiều cao lần lượt là 160cm, 161 cm... 170 có thể xem là một biến số ngẫu nhiên liên tục có phân phối đều, có hàm mật độ:
Liên quan đến khái niệm cơ bản về thống kê - dự báo (Phần 1) ảnh 2
Từ đó chiều cao trung bình hoàn toàn phù hợp với cách tính đơn giản trực tiếp.

Liên quan đến khái niệm cơ bản về thống kê - dự báo (Phần 1) ảnh 3
Phân loại tiêu thức có ý nghĩa quan trọng trong việc lựa chọn phương pháp thống kê thích hợp khi phân tích số liệu. Chẳng hạn, người ta chỉ tính giá trị chỉ tiêu trung bình cộng đối với các biến số, không dùng nó đối với các tiêu thức thuộc tính.

--PageBreak--
5 Phân loại tổng thể
Tổng thể thống kê là hiện tượng kinh tế - xã hội số lớn, gồm những cá thể (hoặc phần tử, hiện tượng) cá biệt cần được quan sát, phân tích mặt lượng của chúng. Chẳng hạn, toàn bộ nhân khẩu nước ta vào một thời điểm nào đó là một tổng thể. Toàn thể các trường đại học nước ta vào một thời gian xác định cũng là một tổng thể...
Trường hợp các cá thể cấu thành tổng thể có thể thấy được bằng trực quan, như các tổng thể nhân khẩu và trường đại học nêu trên, gọi là tổng thể hiện. Tổng thể các cá thể cấu thành nó, không thể nhận biết được bằng trực quan gọi là tổng thể tiềm ẩn, như tổng thể những người ưa chuộng nghệ thuật sân khấu, tổng thể những người mê tín dị đoan, tổng thể những người trung thành với Tổ quốc...
Các cá thể của tổng thể có thể giống nhau một số đặc điểm. Do đó, tuỳ theo mục đích nghiên cứu mà phân biệt tổng thể đồng chất hay không đồng chất. Tổng thể đồng chất bao gồm các cá thể giống nhau về một số đặc điểm chủ yếu có liên quan tới mục đích nghiên cứu. Tổng thể không đồng chất bao gồm các cá thể khác nhau về các đặc điểm, các loại hình. Tổng thể các cơ sở sản xuất công nghiệp của toàn quốc hay của một địa phương là tổng thể đồng chất, nếu mục đích nghiên cứu là tìm hiểu kết quả hoạt động chế biến và sản xuất sản phẩm vật chất. Nó là tổng thể không đồng chất, nếu mục đích nghiên cứu là tìm hiểu kết quả hoạt động chế biến và sản xuất sản phẩm vật chất theo các hình thức sở hữu.
Tổng thể bao gồm tất cả các đơn vị thuộc phạm vi nghiên cứu là tổng thể chung.
Xác định tổng thể để đáp ứng mục đích nghiên cứu thống kê phải trên cơ sở phân tích lý luận kinh tế, chính trị hoặc xã hội, định nghĩa rõ tổng thể. Định nghĩa tổng thể không những phải giới hạn về thực thể (tổng thể là gì) mà còn phải giới hạn về thời gian và không gian (tổng thể tồn tại vào thời gian nào, ở đâu). Xác định tổng thể chính xác không dễ dàng, vì có những hiện tượng có thể tương tự về hình thức, nhưng lại khác hẳn về nội dung. Chính vì vậy, phải phân tích lý luận để thấy rõ nội dung của hiện tượng. Xác định tổng thể thống kê không chính xác sẽ lãng phí sức người và tiền của trong nghiên cứu.
Định nghĩa tổng thể làm rõ đặc trưng cơ bản chung của hiện tượng kinh tế - xã hội số lớn phù hợp với mục đích nghiên cứu. Thông qua việc phân tích lý luận của thực tế phải làm rõ tổng thể gồm những hiện tượng (phần tử) cá biệt nào: hiện tượng cá biệt này là cá thể. Tất cả các cá thể chỉ giống nhau trên một số mặt, còn các mặt khác không giống nhau. Cho nên, trong thực tế phải nêu rõ ràng những hiện tượng cá biệt nào được kể là cá thể. Ví dụ: hiệu cà phê, hiệu bán kem, hiệu bán sữa, quán bán thức ăn nhẹ (Fast Food), toa dành cho ăn uống trên xe lửa, quán giải khát, căng tin của xí nghiệp có phải là những cá thể thuộc tổng thể “tiệm ăn” hay không? Trong những trường hợp khó khăn cho việc giới hạn, người ta phải lập một danh mục các cá thể hoặc trong giải thích cần xác định rõ phạm vi nào của các cá thể thuộc tổng thể.
Cá thể bao giờ cũng có số đo phù hợp. Xác định cá thể là việc cụ thể hoá tổng thể. Cá thể là xuất phát điểm của quá trình nghiên cứu thống kê: vì nó cho mặt lượng mà ta cần nghiên cứu. Cho nên, xác định cá thể cũng quan trọng như xác định tổng thể.

6. Các thước đo lường
Việc đo lường biểu hiện của các tiêu thức, trong đó có các tiêu thức định tính, mang ý nghĩa định lượng, khẳng định ưu thế của phương pháp tiếp cận thống kê, với ba mục tiêu chính như sau:
- Một là, người ta muốn sắp xếp các cá thể theo một trật tự nào đó, điều này có thể thấy trong các cuộc thi hoa hậu. Do đó, mỗi cá thể phải tương ứng với một số đo, số đo này được hình thành thông qua biểu hiện một số đặc tính của từng cá thể.
- Hai là, đo lường để kiểm nghiệm một giả định. Chẳng hạn, các nhà nghiên cứu muốn kiểm nghiệm giả định: tình trạng kinh tế - xã hội ngày càng tốt thì việc chấp nhận chương trình kế hoạch hoá gia đình ngày càng cao. Nhưng, để có được một số tình trạng kinh tế - xã hội thì các nhà nghiên cứu phải xây dựng các thang đo về tình trạng kinh tế - xã hội.
- Ba là, đo lường để thẩm định lại số liệu cần khai thác. Chẳng hạn, trước khi khai thác các số liệu báo cáo về kết quả học tập của học sinh trong các trường phổ thông, các nhà nghiên cứu cần thẩm định lại việc cho điểm giữa các trường phổ thông có lệch nhau không? ở đây không có giả định để kiểm nghiệm, song có thể đưa ra một giả định mới.
Muốn có số đo thì phải có thước đo. Sau đây chúng ta sẽ trình bày về bốn loại thước đo: thước đo danh nghĩa, thước đo sắp tự, thước đo khoảng và thước đo tỷ lệ.

(Phạm Văn Khánh & Bùi Tiến Sỹ) 

≥ Phần 2: Liên quan đến khái niệm cơ bản về thống kê - dự báo