VI | EN
26. Đôi nét về cơ sở dữ liệu thư mục phông sách tiếng Việt của phòng TT-TL-TV Viện Nghiên cứu Hán Nôm. (TBHNH 1998)
TBHNH 1998

ĐÔI NÉT VỀ CƠ SỞ DỮ LIỆU THƯ MỤC PHÔNG SÁCH TIẾNG VIỆT CỦA PHÒNG TT-TL-TV VIỆN NGHIÊN CỨU HÁN NÔM

CHU TUYẾT LAN

Viện Nghiên cứu Hán Nôm

Trong thời đại bùng nổ thông tin ngày nay, cách mạng khoa học kỹ thuật đang chiếm vị trí then chốt, mọi người đang hướng tới một xã hội thông tin thì khái niệm thư viện truyền thống đang dần khép lại, nhường chỗ cho thư viện điện tử hay còn gọi là thư viện ảo, thư viện số - một kiểu thư viện không mái không tường – nhưng lại giúp cho bạn đọc tìm kiếm thông tin dễ dàng và nhanh chóng hơn nhiều lần so với thư viện truyền thống. Nắm bắt được sự tiện lợi và tính hiệu quả của loại hình thư viện nói trên, Giám đốc Trung tâm KHXH & NVQG đã có công văn số 1586/KHXH ngày 2/11/1996, yêu cầu các phòng TT-TL-TV trong trung tâm từng bước thực hiện công tác tự động hóa trong thư viện.

Thực hiện chủ trương nói trên, phòng TT-TL-TV, Viện Nghiên cứu Hán Nôm bước đầu đã sử dụng hệ quản trị cơ sở dữ liệu CDS/ISIS version 3.07, một phần mềm miễn phí của UNESCO để xây dựng cơ sở dữ liệu thư mục cho phông sách tiếng Việt của Viện.

I/MỘT SỐ NÉT VỀ HỆ QUẢN TRỊ CƠ SỞ DỮ LIỆU CDS/ISIS

CDS/ISIS là hệ thống lưu trữ và tìm kiếm thông tin tổng hợp mà người sử dụng có thể thao tác dễ dàng qua menu. Nó được thiết kế chủ yếu để quản trị các cơ sở dữ liệu dạng văn bản có cấu trúc. Phần mềm này được sử dụng rộng rãi ở các nước trong khu vực vì đã khẳng định được nhiều đặc tính ưu việt trong hoạt động thông tin tư liệu và hơn thế nữa đây là phần mềm miễn phí, cho phép thực hiện tự động hóa ngay cả khi nguồn kinh phí chưa thật dồi dào. Những thông số về khả năng của hệ như nêu dưới đây, cho thấy phù hợp với những nhu cầu về tự động hóa của thư viện ta:

* Số cơ sở dữ liệu không hạn chế;

* Số biểu ghi (record) tối đa trong một cơ sở dữ liệu: 16 triệu;

* Độ dài tối đa của một biểu ghi: 8000 ký tự:

* Số trường tối đa trong bảng xác định trường (FDT): 200;

* Độ dài tối đa trong một trường: 1650 ký tự;

* Số trường tối đa trong bảng chọn trường cho File đảo (FST): 200;

* Số trường tối đa trong một trang Worksheet: 19;

* Số trang tối đa trong một Worksheet: 20;

* Độ dài tối đa của format trình bày: 4000 ký tự;

II. VỀ CƠ SỞ DỮ LIỆU PHÔNG SÁCH TIẾNG VIỆT CỦA PHONG TT-TL-TV, VIỆN NGHIÊN CỨU HÁN NÔM

Do tính đặc thù kho tư liệu phông sách tiếng Việt của Viện Nghiên cứu Hán Nôm, chủ yếu là sách tra cứu phục vụ chính cho chuyên ngành nghiên cứu Hán Nôm, được nhập về từ hai nguồn chính: 1, Sách xuất bản ở Sài Gòn và Hà Nội trước giải phóng như “Lịch triều hiến chương loại chí” của Phan Huy Chú, “Thành ngữ điển tích – Danh nhân từ điển” của Trịnh Văn Thanh, “Đại Việt thông sử” của Lê Quý Đôn, “Truyện Hoa Tiên” của Nguyễn Huy Tự, “Cổ thi trích dịch” của Phan Mạnh Danh, “Việt sử thông giám cương mục”, v.v…; 2, Sách xuất bản sau giải phóng: “Gia phả khảo luận và thực hành” của Nguyễn Đức Dụ, “Di sản Hán Nôm Việt Nam thư mục đề yếu” công trình hợp tác Việt Pháp đồng chủ biên GS. Trần Nghĩa – Prof. Fracsois Gros, “Các nhà khoa bảng Việt Nam” chủ biên GS. Ngô Đức Thọ, “Nho giáo xưa và nay” Quang Đạm, “Từ ngữ văn Nôm” Nguyễn Thạch Giang, “Quốc triều hương khoa lục” Cao Xuân Dục, “Văn bia Hà Tây” công trình phiên dịch, khảo cứu của nhóm soạn giả Viện Hán Nôm, v.v… Ngoài ra còn có các công trình chưa xuất bản ở dạng bản thảo, các công trình dịch thuật (tài liệu đánh máy hoặc chép tay), các luận án khoa học thuộc chuyên ngành Hán Nôm của các nhà nghiên cứu trong và ngoài viện. Chúng tôi đã xây dựng một Worksheet để nhập dữ liệu mang tính đặc thù gồm 36 trường, thể hiện cơ bản những nội dung cần miêu tả.

Hiện tại phòng TT-TL-TV của viện có 2 cơ sở dũe liệu (CSDL), CSDL Hồi CốCSDL Sách Mới với khoảng 3.000 biểu ghi, phản ánh nội dung của 4.797 đơn vị tài liệu, nội dung của từng biểu ghi được thể hiện qua 36 trường mô tả như đã nói ở phần trên, đặc biệt là các trường nói về chủ đề, từ khóa và nội dung tóm tắt của tài liệu. Những trường này giúp độc giả hiểu thấu đáo hơn về tài liệu để việc lựa chọn thông tin được dễ dàng và chính xác.

III. KHẢ NĂNG TÌM, CHIA SẺ VÀ TRAO ĐỔI THÔNG TIN

Khác với cách tìm thủ công, truyền thống trước đây, muốn tiếp cận được với tài liệu bạn đọc phải nhớ ít nhất một trong những yếu tố cơ bản của tài liệu như; tên tác giả, tên tài liệu, ký hiệu kho,… Thì giờ đây người đọc có thể tìm tin ngay khi họ không nhớ chính xác các yếu tố cơ bản nói trên, hoặc chỉ nhớ mang máng nội dung. Vì ngoài 7 vùng miêu tả cơ bản tài liệu theo như phương pháp truyền thống, hiện nay từng đơn vị tư liệu được thể hiện qua các biểu ghi với việc mô tả nội dung bằng hệ thống từ khóa, chủ đề và đặc biệt hơn là phần tóm tắt nội dung. Phương pháp này giúp cho nguồn tài liệu chúng ta đang quản lý có được địa chỉ chính xác hơn, giúp bạn đọc dễ dàng tiếp cận.

1, Cơ sở dữ liệu cho phép tìm tin theo 2 cách chính như sau:

a, Tìm theo từ điển

Để đảm bảo tim tin nhanh chóng, CDS/ISIS xây dựng một từ điển các thuật ngữ tìm gọi là file đảo. Sở dĩ gọi là file đảo vì thông tin nhập vào cơ sở dữ liệu theo trật tự ngẫu nhiên, khi tổ chức từ điển, CDS/ISIS đảo lại trật tự các thuật ngữ so với khi nhập. Trong từ điển mỗi thuật ngữ chỉ xuất hiện một lần kèm theo các định vị của nó trong các cơ sở dữ liệu. Quy tắc xây dựng từ điển này do người quản trị cơ sở dữ liệu quy định và có thể thay đổi dễ dàng theo yêu cầu của người sử dụng. Sử dụng từ điển có thể tìm theo yêu cầu đơn hay theo yêu cầu kết hợp.

* Tìm đơn: Theo từng thuật ngữ, ví dụ theo một tác giả, một tên sách, từ khóa hay một chủ đề… Ví dụ: muốn tìm theo chủ đề văn học, ta chỉ việc đưa yêu cầu “Văn học” hoặc tìm theo từ khóa thơ Nôm ta chỉ việc đưa yêu cầu tìm “Thơ Nôm”.

* Tìm kết hợp: Tìm theo nhiều thuật ngữ một lúc, dùng các toán tử +, * và ^ trong biểu thức tìm tin, ngoài ra còn có thể dùng các toán tử tìm ở mức trường và vùng lân cận, điều này rất tiện lợi cho việc tìm theo ngôn ngữ tự nhiên.

* Để thoả mãn một trong những điều kiện đặt ra cho việc tìm tin ta dùng toán tử +. Ví dụ trong cơ sở dữ liệu ta muốn tìm các thông tin có liên quan đến các tác giả Nguyễn Du và Nguyễn Trãi, ta chỉ việc đưa yêu cầu “Nguyễn Du + Nguyễn Trãi” vào biểu thức tìm rồi nhấn Enter, thì tất cả những tài liệu liên quan đến hai tác giả này đều xuất hiện trên màn hình, lúc này độc giả chỉ việc lựa chọn để in ra những thông tin mình cần.

* Để thỏa mãn đồng thời tất cả những điều kiện đặt ra ta dùng toán tử *. Ví dụ muốn tìm 2 tác giả cùng có công đóng góp xây dựng tài liệu như Nguyễn Du và Nguyễn Văn Vĩnh, ta đánh vào biểu thức tìm Nguyễn Du * Nguyễn Văn Vĩnh. Thì tất cả những tác phẩm nào liên quan đến hai tác giả đều hiện trên màn hình và độc giả sẽ lựa chọn những thông tin mình cần để in ra.

* Để thỏa mãn những điều kiện ở phía trái của biểu thức tìm mà không thoả mãn điềukiện phía bên phải ta dùng toán tử ^, phương pháp này gọi là phương pháp loại trừ.

Ví dụ: nếu cần tìm tất cả sách xuất bản ở các địa phương trừ Hà Nội, ta chỉ việc đánh vào biểu thức tìm 1997^H. Thì tất cả sách xuất bản năm 1997 (ở khắp mọi nơi trừ Hà Nội) có ở cơ sở dữ liệu sẽ xuất hiện trên màn hình.

Ngoài trong trường hợp bạn đọc không nhớ chính xác tên tài liệu cũng có thể tìm được theo cách sau: nếu bạn đọc muốn tìm một tài liệu nói về lễ hội truyền thống, nhưng không nhớ chính xác mà chỉ nhớ mang máng tài liệu đó có 2 từ lễtruyền thì đánh 2 từ đó có dấu * ngăn cách giữa chúng, trên màn hình sẽ xuất hiện tất cả những biểu ghi nói về lễ hội truyền thống hay lễ hội cổ truyền.

Trong thực tế, một thuật ngữ có thể mang những yêu cầu thông tin khác nhau. Ví dụ: với một tên người có thể là tác giả cũng có thể là chủ đề. Đôi khi cần phải phân biệt trong tìm tin, ví dụ: có thể có yêu cầu tìm các tác phẩm viết về một tác giả chứ không cần tìm tác phẩm của chính tác giả đó. CDS/ISIS cho phép làm điều này qua việc định vị trường khi đưa yêu cầu tìm tin.

Ví dụ: - Nguyễn Trãi/ (210) là để tìm Nguyễn Trãi với tư cách là tác giả vì trường 210 là trường quản lý tác giả.

- Nguyễn Trãi/ (316) là để tìm Nguyễn Trãi với tư cách là đối tượng nghiên cứu vì trường 316 là trường quản lý từ khóa nhân vật.

b, Cách tìm tự do: Như trên đã trình bày, để đảm bảo tìm tin nhanh chóng, CDS/ISIS tạo ra một từ điển. Tuy nhiên để hạn chế độ lớn của từ điển, chỉ nên đưa vào đây những thông tin mà người sử dụng hay yêu cầu. Những thông tin còn lại sẽ được tìm kiếm theo phương pháp tìm tự do. Tìm tự do cho phép tìm kiếm thuật ngữ trong một trường bất kỳ của cơ sở dữ liệu hay tìm theo một tiêu chuẩn nào đó như tìm tài liệu xuất bản trong một giai đoạn nhất định.

Khi nhận được yêu cầu tìm tự do CDS/ISIS sẽ đọc từng biểu ghi như ta lần tìm theo mục lục và đánh dấu những biểu ghi thỏa mãn yêu cầu. Công việc này có chậm hơn so với phép tìm theo từ điển, nhưng cũng không mất bao nhiêu thời gian vì việc tìm tin do máy tính xử lý, đặc biệt là với các máy tính hiện đại có tốc độ cao.

Phương pháp tìm tự do là một đặc tính riêng của CDS/ISIS, nó cung cấp cho người sử dụng khả năng tìm kiếm thông tin phong phú, đa dạng. Ví dụ biểu thức tìm sau đây cho phép lựa chọn những tài liệu xuất bản trong thời gian từ năm 1981 đến năm 1990.

?Val (v260)>=1981 anh Val (v260)<=1990

ở đây trường 260 là trường quản lý năm xuất bản

2, Khả năng chia sẻ và trao đổi thông tin

Mạng truyền thông máy tính là một mạng liên kết các đầu mối (điểm mút) với các nguồn máy tính và các máy tính, tạo điều kiện dễ dàng cho việc truyền thông tin qua các thiết bị liên kết chuyển đổi. Người dùng tin có thể truy nhập vào mạng, thông qua các trạm đầu cuối (đặt tại các điểm mút) và các thông điệp chuyển trên mạng qua các nút chuyển. Mạng cục bộ là tất yếu trong hệ thống thông tin thư viện tự động hóa, nó cho phép chia sẻ và trao đổi thông tin, tổ chức các dịch vụ cho độc giả bằng việc ứng dụng công nghệ thông tin.

Trước mắt khi chưa có mạng, ta chưa thể trao đổi thông tin trực tuyến ở trên mạng được, nhưng ta cũng có thể chia sẻ và trao đổi thông tin với các cơ quan hữu quan và các cá nhân bằng đĩa mềm, truyền tệp qua hệ thống Email (thư điện tử), trả lời những yêu cầu tìm tin của độc giả qua Telephone hay bằng Fax.

3, Sản phẩm đầu ra

Từ cơ sở dữ liệu ta có thể in phiếu mục lục, phiếu thư mục chủ đề, thư mục thông báo sách mới, sử dụng nhiều phương tiện của CDS/ISIS và một số chương trình khác nữa như chuyển mã, tạo khuôn biểu ghi,… Kết nối với phần mềm FoxPro để kiểm tra sách trùng sách thiếu - một công việc nếu làm bằng con đường thủ công như trước đây thì tốn rất nhiều thời gian và công sức mà độ chính xác lại không cao. Với các tiện ích của CDS/ISIS như đã trình bày ở trên, từ nay các cán bộ thư viện sẽ phải thay đổi phương thức làm việc của mình để phục vụ độc giả với một chất lượng cao hơn. Như vậy cùng với sự bùng nổ thông tin, sự phát triển nguồn tri thức chung của nhân loại, kỹ thuật máy tính và kỹ thuật thông tin cũng đã và đang làm cho lĩnh vực khoa học thông tin thư viện có những bước thay đổi lớn lao, có thể nói lịch sử thư viện đã sang trang.

Tóm lại từ nay cho đến những năm 2000, việc sử dụng phần mềm CDS/ISIS là cách tiếp cận hợp lý và ít tốn kém trong việc tin học hóa thư viện, vì phần mềm này đã được các chuyên gia tin học Việt Nam phát triển, cài bộ chữ tiếng Việt đưa vào sử dụng rộng rãi để quản trị dữ liệu trong toàn mạng lưới thông tin khoa học, đặc biệt là trong việc tự động hóa mọi hoạt động của thư viện, hơn nữa nó được cập nhật thường xuyên, ta không mất tiền nâng cấp. Phần mềm này hiện nay đã được UNESCO phát triển để sử dụng trong môi trường Windows, nếu điều kiện kinh phí cho phép và được viện quan tâm hơn, chúng tôi sẽ tiếp tục hoàn thiện việc xây dựng CSDL và chuyển đổi dữ liệu từ CDS/ISIS chạy dưới DOS sang Windows trong một tương lai gần. Đứng trước thực tế là nhu cầu giao tiếp và trao đổi thông tin ngày càng cao, tính khoa học trong thư viện cần phải được lưu tâm đặc biệt, cụ thể là ứng dụng công nghệ thông tin vào việc phát triển thư viện theo hướng hiện đại hóa.

TÀI LIỆU THAM KHẢO

1. Kỷ yếu hội nghị ngành Thông tin – Tư liệu Khoa học và Công nghệ: Đà Lạt, ngày 6-7 tháng 8 năm 1998. – H.: Trung tâm Thông tin Tư liệu Khoa học và Công nghệ Quốc gia, 1998. -218 tr.

2. Mô tả các trường và hướng dẫn điền phiếu nhập tin cho các cơ sở dữ liệu tư liệu sử dụng chương trình CDS/ISIS. – H.: Trung tâm Thông tin Tư liệu Khoa học và Công nghệ Quốc gia, 1995. -127 tr.

Thông báo Hán Nôm học 1998 (tr.226-234)

Chu Tuyết Lan
Thống kê truy cập
  • Đang online: 1
  • Hôm nay: 1
  • Trong tuần: 1
  • Tất cả: 1
VIỆN HÀN LÂM KHOA HỌC XÃ HỘI VIỆT NAM - VIỆN NGHIÊN CỨU HÁN NÔM

Địa chỉ: 183 Đặng Tiến Đông - Đống Đa - Hà Nội
Email: hannom.vass@gmail.com
Tel: 84 24. 38573194
Chịu trách nhiệm nội dung: Viện Nghiên cứu Hán Nôm