Hội tụ và chia sẻ tri thức

Kiến thức thông tin trong thư viện số

Trong thư viện số, thông tin được lưu trữ dưới dạng những đơn vị thông tin số cơ bản như bản đồ số hóa, một đoạn văn bản, một trang web hay một bức ảnh quét … Các tài liệu số thường liên hệ với các tài liệu khác theo quan hệ bộ phận – toàn thể hay theo quan hệ trật tự. Chẳng hạn, một văn bản được số hóa có thể bao gồm các trang, chương, bảng mục lục, ví dụ minh họa, …

Trong thư viện số, thông tin được lưu trữ dưới dạng những đơn vị thông tin số cơ bản như bản đồ số hóa, một đoạn văn bản, một trang web hay một bức ảnh quét … Các tài liệu số thường liên hệ với các tài liệu khác theo quan hệ bộ phận – toàn thể hay theo quan hệ trật tự. Chẳng hạn, một văn bản được số hóa có thể bao gồm các trang, chương, bảng mục lục, ví dụ minh họa, …

Trong hệ thống mạng toàn cầu (www), một văn bản tương tự có thể bao gồm nhiều trang văn bản với hình đi kèm và đường dẫn tới các thông tin khác. Theo phương thức này, tài liệu được chia thành những tập hợp. Đó có thể là những tập hợp thông tin theo nghĩa đen, những nhóm thông tin do các nhà xuất bản cung cấp hay có thể là những trang tin được người chủ trang web đưa lên.Những thông tin cùng loại được lưu dưới nhiều dạng khác nhau. Đôi lúc những định dạng này hoàn toàn tương thích và có thể chuyển đổi dễ dàng từ dạng này sang dạng khác, nhưng cũng có khi một loại thông tin lại được chứa trong những định dạng khác hẳn nhau.Do tính năng dễ thay đổi nên các sản phẩm số thường xuyên phải thay phiên bản (chúng ta có thể thấy rõ điều này qua các trang web của một số tổ chức – họ thay đổi trang chủ của mình nhiều lần trong một tháng). Khi một tài liệu được chuyển đổi sang dạng số thì các định dạng của nó cũng được chuyển đổi nhiều lần. Ví dụ như một bức ảnh quét có thể có 3 phiên bản: bản lưu trữ có độ phân giải cao, một phiên bản chất lượng trung bình, và một hình ảnh dạng phác thảo (thumbnail).Mỗi một yếu tố của thông tin số có chức năng và quyền truy cập khác nhau, phụ thuộc vào kích cỡ tài liệu và đặc điểm của hệ thống máy tính và mạng. Kiến trúc thông tin được mô tả ở đây cung cấp cách tiếp cận chung để tổ chức thông tin trong thư viện số theo cách hiệu quả, giúp cho các chương trình máy tính có thể hiểu được cấu trúc của tài liệu và tiến hành các tương tác theo mong muốn của người sử dụng.* Các nguyên tắc cơ bảnKiến trúc thông tin được tổ chức theo các nguyên tắc cơ bản sau:Người sử dụng và các chương trình ứng dụng của họ cần phải linh hoạt. Do người sử dụng có thể khai thác thông tin theo những cách thức khác nhau nên thông tin cần được tổ chức linh hoạt, không lệ thuộc quá nhiều vào cách thức truy cập, trình độ chuyên môn hay trình tự truy cập của họ.Bộ sưu tập tài liệu cần được quản lý theo cách đơn giản. Cũng giống như các thư viện khác, một số cán bộ làm việc trong thư viện số mặc dù có chuyên môn tương đối thấp vẫn phải quản lý một bộ sưu tập tài liệu rất lớn. Do vậy, thông tin cần phải được kiến trúc theo cách thức đơn giản, cho phép các cán bộ thư viện tập trung vào những lĩnh vực họ cần phụ trách chứ không ôm đồm quá nhiều việc cùng lúc.Kiến trúc thông tin phải phản ánh được cơ cấu kinh tế xã hội và pháp lý của sự phát triển hạ tầng thông tin. Cụ thể những đặc tính đó là: có giá trị, phụ thuộc vào thời gian và các điều kiện khách quan, được truyền đạt thông qua các hệ thống mạng không bảo mật của các quốc gia.* Loại dữ liệu, siêu dữ liệu cấu trúc và siêu đối tượngThông tin được cấu trúc dựa trên ba khái niệm cơ bản: Loại dữ liệu, siêu dữ liệu có cấu trúc và siêu đối tượng. – Loại dữ liệu mô tả những đặc tính của thông tin như loại định dạng hay phương thức xử lý thông tin. – Siêu dữ liệu có cấu trúc là loại siêu dữ liệu mô tả phiên bản, các mối quan hệ và các đặc tính khác của tài liệu số. – Siêu đối tượng là đối tượng cho phép tham chiếu đến một tập hợp các đối tượng số. Theo cách hiểu đơn giản thì siêu đối tượng là danh mục liệt kê các nhóm đối tượng khác. Chẳng hạn như trong một tuyển tập thơ, mỗi một bài thơ là một đối tượng số và tuyển tập thơ đó được gọi là một siêu đối tượng. Cũng có lúc một siêu đối tượng chính là đối tượng số liệt kê các phiên bản đã được chuyển đổi của cùng một dữ kiện cụ thể.

Nguồn: www.dlib.org

Tin cùng chuyên mục