Tiêu chuẩn kỹ thuật dữ liệu thống kê và dữ liệu dùng chung

Sáng kiến chia sẻ dữ liệu thống kê và dữ liệu dùng chung (SDMX) được Ngân hàng Thanh toán quốc tế, Ngân hàng Trung ương châu Âu, Cơ quan Thống kê châu Âu, Quỹ Tiền tệ quốc tế, Tổ chức phát triển và hợp tác kinh tế, Liên hiệp quốc và Ngân hàng thế giới đề xuất và đồng tài trợ.

Ảnh minh họaẢnh minh họa

Mục đích xây dựng sáng kiến này nhằm phát triển và thúc đẩy chuẩn về công nghệ và các công cụ thực hiện để đạt được hiệu quả cao và giảm gánh nặng báo cáo trong việc trao đổi thông tin thống kê.

Tiêu chuẩn SDMX đã được Tổ chức tiêu chuẩn hóa Quốc tế (ISO) thông qua, về mặt nguyên tắc, SDMX cũng được Uỷ ban Điều phối thống kê gồm 25 tổ chức quốc tế xác nhận. Chuẩn SDMX, nguyên tắc sử dụng và các công cụ cung cấp một nền tảng đáp ứng các hoạt động thống kê. Tất cả 7 nhà tài trợ đều cam kết triển khai SDMX trong công tác biên soạn, công bố số liệu thống kê, các hoạt động này cũng liên quan tới việc phối hợp với các cơ quan thống kê quốc gia trên toàn cầu. Việc mời các cơ quan thống kê của các quốc gia tham gia vào cộng đồng này là một ưu tiên quan trọng và cũng đã được thảo luận công khai tại các cuộc gặp gỡ các chuyên gia thống kê.

SDMX là chuẩn về trao đổi dữ liệu và siêu dữ liệu thống kê (Statistical Data and Metadata eXchange). Tiêu chuẩn SDMX hỗ trợ cho việc trao đổi các dữ liệu và siêu dữ liệu thống kê sử dụng công nghệ thông tin hiện đại, trọng tâm hướng vào gói dữ liệu  lớn.

- Thông tin, Dữ liệu bao gồm dạng số có cấu trúc và không có cấu trúc như văn bản, thư từ, báo cáo, luật, các bản vẽ, hình ảnh, v.v…(khi cả hai thuật ngữ được sử dụng trong một cụm như nhu cầu thông tin và dữ liệu, thì thông tin chỉ thông tin không có cấu trúc và dữ liệu chỉ thông tin dạng số có cấu trúc hoặc thông tin được mã hóa).

- Siêu dữ liệu (metadata) là một dạng dữ liệu để mô tả các dữ liệu khác (bản thân nó không chứa đựng các dữ liệu thực tế như các bản ghi hay các quan hệ trong mô hình cơ sở dữ liệu quan hệ). Con người hay máy tính dùng các thông tin này để giải thích thêm và làm sáng tỏ các dữ liệu thực mà mình hiện có. Nói khác đi, metadata là một hay nhiều bảng tóm tắt về dữ liệu thực tế mà mình có giúp người đọc hiểu rõ hơn, chi tiết hơn, tìm kiếm nhanh hơn, khai thác hiệu quả hơn dữ liệu thực của mình.

Trong công tác quản lý thông tin, dữ liệu và siêu dữ liệu, việc thu thập, lưu trữ và xử lý tốt các thông tin, dữ liệu và siêu dữ liệu sẵn có sẽ tạo điều kiện tốt nhất thúc đẩy hiệu suất và hiệu quả của các quá trình công tác. Nó chỉ ra cách thức mà các đầu vào thông tin và dữ liệu được thu thập, lưu giữ và truy cập, kết quả của các đầu ra được trình bày, và nó chỉ ra siêu dữ liệu đi kèm thông tin và dữ liệu.

Tiêu chuẩn SDMX  đóng vai trò quan trọng trong Khung Quản lý Dữ liệu và chất lượng, là cơ sở hạ tầng quan trọng, cung cấp điều kiện cho việc tích hợp, hỗ trợ cho việc trao đổi thông tin, dữ liệu và siêu dữ liệu.

Phiên bản đầu tiên của SDMX được phê chuẩn bởi Tổ chức Tiêu chuẩn hóa quốc tế (ISO) vào tháng 4/2005, được công bố có tên ISO/TS 17369:2005 SDMX V1.0 với những nội dung chủ yếu sau:

- Tập trung vào những hoạt động chuyên môn thực tiễn liên quan tới thông tin thống kê, hỗ trợ hiệu quả cho các quá trình trao đổi và chia sẻ dữ liệu và siêu dữ liệu.

- Tự động hóa công tác trao đổi dữ liệu thống kê và siêu dữ liệu để nâng cao hiệu quả nhờ công nghệ tiên tiến.

- Tạo khuôn mẫu để xây dựng và lập báo cáo siêu dữ liệu như: khung chất lượng, phương pháp luận.

- Hỗ trợ các dòng dữ liệu/siêu dữ liệu sử dụng cấu trúc đã được chấp thuận. 

Tiêu chuẩn kỹ thuật SDMX phiên bản 2.0 đã được mở rộng phạm vi để bao hàm cả siêu dữ liệu bổ sung nhằm tăng cường công tác xử lý dữ liệu. Đây là phiên bản mới nhất, cung cấp đặc điểm kỹ thuật cho sự trao đổi của dữ liệu và siêu dữ liệu trong nền tảng một mô hình thông tin chung. Phạm vi của mô hình này sẽ xác định khuôn khổ trao đổi của tập hợp các siêu dữ liệu và dữ liệu thống kê cần thiết nhằm hiểu rõ cấu trúc của dữ liệu. Trọng tâm chính trên dữ liệu được trình bày như các chuỗi thời gian. 

Việc xây dựng các hướng dẫn định hướng theo SDMX đang được triển khai bên ngoài khuôn khổ ISO. Các hướng dẫn này được áp dụng cho tất cả các lĩnh vực có liên quan đến chủ đề thống kê để tạo ra các bộ dữ liệu và siêu dữ liệu hoạt động liên thông sử dụng các tiêu chuẩn kỹ thuật SDMX, đồng thời tập trung làm hài hòa các khái niệm và các thuật ngữ chuyên ngành cần thiết để khuyến khích việc trao đổi thông tin thống kê tương ứng. Việc xây dựng hướng dẫn cũng gặp phải những thách thức đáng kể, vì chúng đòi hỏi có sự thống nhất và hài hòa của các khái niệm thống kê và các phân loại.

Tiêu chuẩn kỹ thuật dữ liệu thống kê và dữ liệu dùng chung ảnh 1

Sơ đồ mô hình SDMX

Theo sơ đồ cho thấy, từ người cung cấp dữ liệu, các dữ liệu được tập hợp thành các bộ dữ liệu hoặc siêu dữ liệu, sau đó chuyển đến hệ thống trung tâm của SDMX tạo thành các dòng dữ liệu hoặc siêu dữ liệu để xử lý. Từ đây các hợp đồng cung cấp được ký để thỏa thuận về các vấn đề liên quan đến việc cung ứng dữ liệu; cùng với hệ thống phân loại các dữ liệu sẵn có đưa ra các phân loại dữ liệu cụ thể và tại hệ thống này, dữ liệu/siêu dữ liệu được cấu trúc lại sau đó được tổng hợp thành các định nghĩa. Các định nghĩa này được tập hợp thành hệ thống các định nghĩa, liên kết lại và mã hóa thành các mã khác nhau tương ứng với mỗi bộ dữ liệu/siêu dữ liệu khác nhau, tạo thành danh sách các mã. Các mã này được phân loại có phân cấp. Các dữ liệu/siêu dữ liệu được phân cấp sẽ được chia sẻ trong hệ thống. Việc sử dụng sản phẩm cuối cùng của quá trình trên sẽ phụ thuộc vào mục đích sử dụng thông tin và tầm quan trọng đối với người sử dụng.

Tiêu chuẩn kỹ thuật SDMX được nghiên cứu và phổ biến trong khuôn khổ Hợp phần 5 - Phân tích thống kê và công cụ chính sách, Chương trình Hỗ trợ kỹ thuật của Châu Âu cho Việt Nam, giai đoạn 2 (ETV2). Đây là một chương trình tổng thể góp phần vào công cuộc chuyển đổi sang nền kinh tế thị trường do Ủy ban Châu Âu (EC) và Chính phủ Việt Nam phối hợp tài trợ với tổng số vốn viện trợ của EC là 11.034.800 Euro. Mục đích của dự án ETV2 là hỗ trợ 3 Bộ (Bộ Tài chính, Bộ Kế hoạch và đầu tư và Bộ Khoa học và Công nghệ) của chính phủ Việt Nam trong công cuộc cải cách thuộc khuôn khổ Chiến lược về Kinh tế xã hội giai đoạn 2001 - 2010 và theo định hướng của Chiến lược tổng thể về Tăng trưởng và Giảm nghèo. Dự án ETV2 được khởi động vào cuối năm 2005 và dự kiến được thực hiện đến hết năm 2008.

ETV2 củng cố việc hoạch định chính sách cũng như thiết lập và áp dụng các công cụ thực hiện. Trọng tâm của chương trình là 3 lĩnh vực chính trong công cuộc cải cách hiện thời. Liên quan tới tổng thu nhập, ETV2 sẽ thúc đẩy chương trình cải cách chính sách tài chính và các vấn đề về thuế và hải quan. Hai là, ETV2 sẽ tăng cường các công tác thiết lập chuẩn mực kế toán và kiểm toán, xây dựng bảo hiểm và kiểm soát ngành bảo hiểm. Ba là, ETV2 sẽ củng cố công tác chuẩn bị số liệu thống kê, phản ánh những thay đổi nhanh chóng ảnh hưởng tới môi trường kinh tế Việt Nam.

Hợp phần 5 nhằm cải thiện quy trình quản lý thông tin, số liệu và chất lượng; xây dựng và triển khai Kế hoạch tổng thể về Công nghệ Truyền thông và Thông tin; cải thiện cơ sở hạ tầng công nghệ truyền thông, thông tin; thiết kế và xây dựng các ứng dụng cơ sở dữ liệu mới; cải thiện quy trình theo dõi, phân tích và dự báo; nâng cao tri thức và kỹ năng cho đội ngũ cán bộ trong các lĩnh vực trên.

Đây là một tiêu chuẩn mới trên thế giới, do đó cần thành lập các nhóm công tác để xây dựng và xúc tiến ứng dụng về tiêu chuẩn với các thành viên tham gia từ các bộ ngành, các chính quyền địa phương, các doanh nghiệp Nhà nước và tư nhân, các Viện, các tổ chức Phi chính phủ và các trường Đại học. Đối với các dự án có áp dụng tiêu chuẩn này, cần triển khai thực hiện thí điểm. Về phía Chính phủ, nghiên cứu và ban hành các nghị định nhằm đảm bảo các vấn đề liên quan đến việc áp dụng tiêu chuẩn. Ngoài ra, cần tổ chức các lớp tập huấn về ứng dụng tiêu chuẩn, nhằm mục đích sớm đưa tiêu chuẩn áp dụng vào điều kiện thực tế của Việt Nam để Việt Nam sớm tham gia vào công tác trao đổi, cung cấp số liệu thống kê với các nước và các tổ chức trên thế giới một cách hiệu quả nhất.

(Đặng Hồng Sơn - tham khảo: http://www.sdmx.org)