VI | EN
41. Mấy suy nghĩ về công tác ứng dụng tin học vào nghiệp vụ Hán Nôm (TBHNH 1997)
TBHNH 1997

MẤY SUY NGHĨ VỀ CÔNG TÁC ỨNG DỤNG

TIN HỌC VÀO NGHIỆP VỤ HÁN NÔM

NGUYỄN VĂN NGUYÊN

Viện Nghiên cứu Hán Nôm

Thế giới khi bước sang năm thứ tám trong thập kỷ cuối cùng của thế kỷ 20 này, đối với mọi người, kể cả người dân ở một nước chưa phát triển như Việt Nam, đều không chỉ còn là dự đoán, mường tượng, ước mơ, mà thực sự đã cảm nhận thấy sự rục rịch chuẩn bị thiết thực cho cái điều gọi là “Thế kỷ bùng nổ thông tin” đang tới gần. Cũng giống như trong công nghiệp hóa, việc đầu tiên là phải chuẩn bị sẵn cơ sở hạ tầng, với công cuộc phát triển tin học hóa, cái cơ sở hạ tầng đó chính là hệ thống “xa lộ thông tin”. Công việc chẩn bị này, ở các nước công nghiệp phát triển họ đã bắt đầu tiến hành từ những năm cuối thập kỷ 80, đầu thập kỷ 90; các nước đang phát triển như Ấn Độ, Mêhicô, Inđônêxi. Trung Quốc, Hàn Quốc, Đài Loan… có chậm hơn vào khoảng dăm ba năm lại đây. Ở Việt Nam ta, sau khi có quyết định thành lập Ủy ban xây dựng Xa lộ thông tin Quốc gia năm 1996, đến năm ngoái chúng ta đã chính thức hòa mạng với internet quốc tế. Bầu không khí sôi động đó đã tác động mạnh mẽ đến mọi ngành khoa học, kinh tế, xã hội, trong đó kể cả Viện Nghiên cứu Hán Nôm, một cơ sở khoa học mà thoạt nhìn vào tính chất và đối tượng nghiên cứu của nó dễ gây ra cảm giác có một khoảng cách khá lớn về thời gian và khả năng tiếp cận với tin học. Và các “nhà nho tân thời” cũng đang đứng trước một vấn đều thiết thực là Hán Nôm phải làm thế nào để ứng dụng được tin học vào nghiệp vụ của mình?

Tin học Hán Nôm, tuy không thể coi là một môn khoa học độc lập, nhưng với đặc điểm giống như những khoa học ứng dụng khác, nó nằm ở ranh giới giữa hai ngành khoa học: Hán Nôm học và Tin học. Nói chính xác hơn là trong nó bao hàm hai thành phần thuộc cả hai lĩnh vực. Do tính chất của công trình ứng dụng, quan hệ giữa hai thành phần này phải là mối quan hệ chính phụ, và sự ứng dụng phải có hướng xác định tùy theo quan hệ đó. Cụ thể trong Tin học Hán Nôm, thành phần Hán Nôm được coi là thành phần chính, còn Tin học là thành phần phụ trợ. Khái niệm chính phụ ở đây không phải là nói về sự hơn kém của vị trí, vai trò hay sự nặng nhẹ trong thái độ nhìn nhận; cũng không nhằm chỉ phân lượng khác nhau về các khoản đầu tư trí tuệ hay đầu tư tài chính, mà quan hệ chính phụ này cần được hiểu là quan hệ giữa một bên là đối tượng nhiệm vụ nghiên cứu với một bên là công cụ trợ giúp để thực hiện nhiệm vụ chính đó.

Do vậy, khi ứng dụng công nghệ tin học vào Hán Nôm chúng ta xuất phát từ những đặc điểm, điều kiện riêng của mình để tìm ra những công cụ thích hợp phục vụ cho chuyên môn. Vì nhiệm vụ của Viện là quản lí và khai thác di sản Hán Nôm, rõ ràng công tác này có mang một nét đặc thù rõ rệt là phải xử lý một khối lượng lớn thông tin bằng chữ Hán và chữ Nôm. Tin học muốn phục vụ đắc lực cho công tác Hán Nôm cũng phải có khả năng xử lí tốt những thông tin loại này. Đối với tin học, xử lý thông tin thuộc hệ thống chữ Anh (hay các hệ thống chữ cái ghi âm nói chung) là chuyện thường, vì số mã kí tự thường thỏa mãn với khuôn khổ 256 chữ cái và ký hiệu cơ bản trong bản Mã trao đổi thông tin tiêu chuẩn ASCII(1) của các hệ điều hành máy tính hiện đại. Vấn đề sẽ khác đi khi xem xét xử lý thông tin chữ Hán là thứ chữ tượng hình không phải từ những chữ cái ghép lại, do mỗi mã chữ (Code) ở đây phải được xử lí như một chữ cái (character), mà như chúng ta biết, số lượng chữ Hán rất lớn, không chỉ hàng nghìn mà là hàng vạn chữ. Xử lí được chữ Hán trên máy tính là cả một vấn đề chuyên môn phức tạp, khó hiểu đối với ngay cả những chuyên viên tin học thông thường. Chỉ biết rằng người ta phải ghép hai mã của hệ thống mã “một bai” SBCS(2) lại với nhau để tạo ra hệ thống mã chữ “hai bai” DBCS(3) mới đủ để hiện chữ Hán(4) (đó cũng là phương thức được sử dụng trong hệ mã của Unicode), đồng thời phải xử lý những mâu thuẫn xảy ra khi ghép hệ mã này với mã cơ bản của hệ điều hành. Ngày nay, các nhà tin học ở nước ngoài như Trung Quốc, Đài Loan… đã tạo ra nhiều hệ thống chữ Hán khá thuần thục có thể xử lí loại thông tin trên mọi chương trình máy tính, thuận lợi không kém gì so với hệ thống chữ cái Latin tiếng Anh. Ở những nước đang sử dụng chữ Trung Quốc, các chương trình máy tính có xử lí chữ Hán đương nhiên chỉ được coi là những chương trình tin học thông thường, nhưng đối với ta chúng không chỉ là một công cụ cần thiết để phục vụ cho chuyên môn của Viện, mà hơn nữa, có sử dụng những chương trình chữ Hán này còn là một đặc điểm độc đáo riêng của các công trình Tin học Hán Nôm của Viện. Như vậy là trong thành phần công cụ. Tin học Hán Nôm còn bao gồm thêm một bộ phận quan trọng là các chương trình xử lí thông tin chữ Hán.

Với công cụ mạnh mẽ như vậy đã đủ mở ra một chân trời rộng lớn, nếu không nói là vô tận, cho những ứng dụng tin học vào nghiệp vụ Hán Nôm. Từ những chương trình soạn thảo thông thường như Winword, Ventura, Amipro, Page-Make có thể giúp chúng ta biên soạn, chế bản những văn bản, sách vở, tài liệu nghiên cứu, tạp chí rất đẹp về hình thức, thể hiện được cả những nội dung đặc biệt mà ấn phẩm tài liệu chuyên ngành đòi hỏi, trong đó có thể đồng thời xuất hiện các thông tin chữ Việt, chữ Hán, chữ Nôm, chữ Anh, chữ Pháp v.v… Và nếu khéo sử dụng khai thác tính năng của những chương trình phần mềm này ta có thể nâng cao giá trị khoa học của sách bằng các loại bảng biểu, danh mục sắp xếp, sơ đồ, hình ảnh, cộng với những phần công cụ tra cứu được làm tự động như chú thích, mục lục, thống kê, sánh dẫn, chỉ dẫn, thuyết minh tham chiếu… tạo ra các dạng văn bản đặc biệt không chỉ nhằm cho mục đích cuất bản mà cònm dùng cho nhiều mục đích nghiên cứu, tham khảo, học tập khác. Về quản trị và khai thác dữ liệu cũng có nhiều chương trình mạnh như Foxpro, Access, Excell có thể giúp ta quản lý các loại tư liệu trong kho di sản Hán Nôm. Một chương trình chuyên dụng cho thư viện OPAC có thể quản lý và trợ giúp tra cứu nhanh chóng cho cả một thư viện hàng triệu đầu sách, nếu được sử dụng trong nền Trung Vaă nó có thể giúp ta đổi mới hoàn toàn phương thức truyền thống trong quản lý sách và phục vụ bạn đọc của thư viện Hán Nôm. Một chương trình xử lý bản đồ (ví dụ Mapinfo) không chỉ giúp ta phục vụ chế lại những tấm bản đồ cổ mà đi sâu khai thác, ta có thể dựa trên bản đồ để quản lý tra cứu đủ mọi thông tin lịch sử, văn hóa liên quan theo lịch đại của các địa phương như địa giới, địa danh, đơn vị hành chính, nhân khẩu, di tích đình chùa, số lượng bia đá và di sản Hán Nôm các loại. Tại Đài Loan, người ta đã sử dụng hệ thống tra cứu tư liệu toàn văn chữ Hán (CTP/FTMS) để nhập dữ liệu cổ tịch Nhị thập ngũ sử, Chư tử, Thập tam kinh, Đại Tạng kinh, Trung Quốc sử sự nhật chí v.v… tổng cộng dung lượng lên tới trên 115 triệu chữ Hán phục vụ cho tra cứu tư liệu tại chỗ và trên mạng Internet rất nhanh chóng, thuận tiện với tốc độ xử lý 25 vạn chữ trong 1 giây. Hoàn toàn có thể học tập cách làm này cho kho di sản thư tịch cổ của ta. Tại Việt Nam cũng đã có những công trình sử dụng chương trình Multimedia nguồn (như Adobe Acrobat. Director) để xây dựng các hệ thống giới thiệu, tra cứu dữ liệu hình ảnh, âm thanh và tài liệu chữ Việt, chữ Hán của cả một viện bảo tàng hay một bộ tạp chí rất linh hoạt, gọn nhẹ chứa vừa trên một đĩa CD mà vẫn có thể phục vụ rộng rãi mọi đối tượng, không đòi hỏi phải cài đặt chương trình chữ Việt, chữ Hán trên máy tính của người sử dụng. Rồi với một máy chụp ảnh số kết hợp với chương trình xử lý ảnh, phần mềm Pals2 hay Photoshop chẳng hạn, có thể cho ra những tấm ảnh màu vô cùng rõ nét cả chữ lẫn hoa văn những thác bản văn bia hay bản thân các di vật có khắc chữ này để cung cấp cho công tác nghiên cứu, xuất bản và lưu trữ văn bản tư liệu Hán Nôm. Cũng liên quan đến bảo quản, lưu trữ văn bản, công nghệ tin học hiện còn cung cấp nhiều chủng loại vật chứa thông tin phong phú, từ các loại đĩa mềm ZIP, LS-120, JAZ đến đĩa quang MO, CD-R, CVD với dung lượng lớn, giá rẻ, giúp chúng ta thay đổi hoàn toàn phương thức lưu trữ truyền thống. Còn rất nhiều chương trình máy tính phong phú giầu tiềm năng khác có thể lợi dụng vào công tác Hán Nôm đem lại nhiều hiệu quả rất cao mà người viết bài này mới chỉ có thể dựa vào quản kiến nông cạn của mình đơn cử ra một vài như trên, đó thực chẳng khác gì phần nổi của tảng băng vậy.

Tin học Hán Nôm, chỉ rêing việc tìm hiểu, lựa chọn và học cách sử dụng có hiệu quả những tính năng cho phép của các chương trình đó vào cuông việc của mình đã “đủ mệt”. Ở đây, chúng ta cần có sự trợ giúp từ phía tin học. Các chuyên gia tin học sẽ giới thiệu cho chúng ta những chương trình máy tính và công nghệ tin học liên quan, cho ý kiến cố vấn trong việc lựa chọn phần mềm, thiết bị thích hợp, truyền thụ kiến thức tin học cơ sở, hướng dẫn cách sử dụng và khai thác chương trình máy tính, phụ trách những phần việc thuộc về chuyên môn tin học trong các chương trình hợp tác, giúp xử lý những sự cố trục trặc trong quá trình vận hành v.v.. Những đóng góp của phái tin học là to lớn và rất quan trọng, nhưng cũng giống như trường hợp ứng dụng tin học ngân hàng, bưu điện hay bất cứ ngành nào khác, tác dụng quyết định vẫn phải là thuộc về chuyên viên Hán Nôm. Một công trình được coi là của Tin học Hán Nôm khi trong sản phẩm của nó có hàm chứa một phân lượng đáng kể những yếu tố thuộc về trí thức Hán Nôm. Điều này cũng có nghĩa là công trình đó, phải xuất phát từ nhu cầu thực tế của Hán Nôm, có sự tham gia đóng góp thực hiện của các chuyên viên Hán Nôm và sau đó có tác dụng trở lại phục vụ cho nghiệp vụ Hán Nôm hoặc các ngành khoa học liên quan. Chính những yếu tố này sẽ làm phân biệt sự khác nhau giữa công trình ứng dụng Tin học của Hán Nôm với chương trình phục vụ Hán Nôm của Tin học. Trong quá triìnhlàm việc quả sẽ có những lúc Viện Hán Nôm rất cần đến sự giúp đỡ của giới Tin học, họ với kiến thức chuyên môn của mình sẽ căn cứ vào yêu cầu, đặc điểm riêng của công tác Hán Nôm mà thiết kế cho những chương trình hoặc cung cấp cho những công nghệ, thiết bị đặc biệt để giải quyết một vấn đề, một nhu cầu cụ thể nào đó, ví như thiết kế phần mềm tạo chữ đủ mạnh để giải quyết nhu cầu về chữ Nôm hoặc giải quyết những trở ngại về mã chữ, công nghệ quét ghi và tra cứu tư liệu Hán Nôm trên đĩa CD… Các công việc này tuy liên quan đến Hán Nôm, nhưng bản chất chủ yếu lại là những giải pháp tin học, rõ rằng vượt quá tầm khả năng giải quyết của Hán Nôm, tuy nhiên rất cần thiết cho công tác của Viện, do đó cũng cần phải đưa về coi như sự chuyển giao mua sắm chương trình phần mềm, trang thiết bị, nâng cấp công cụ để phục vụ công tác chuyên môn. Riêng phần tin học liên quan đến chữ Hán, vì là một lĩnh vực khá đặc biệt của tin học mà ở đây sở trường lại thuộc về các nhà tin học nước ngoài (Trung Quốc, Đài Loan…) nên ngoài việc phải cố gắng sưu tầm tài liệu sách vở hướng dẫn liên quan để tự tham khảo học hỏi ra, đối với những vấn đề quá khó khăn đối với cả tin học trong nước thì cần mở rộng hợp tác, giao lưu khoa học với bên ngoài, không loại trừ khả năng phải sang nước bạn học tập, hoặc khi cần thiết, mời chuyên gia bạn sang giúp đỡ. Sẽ là lãng phí và bất hợp lý khi yêu cầu tin học trong nước phải nghiên cứu, thiết kết từ đầu một chương trình liên quan đến chữ Hán nào đó trong khí đó đã được những chuyên gia chuyên về lĩnh vực này giải quyết hoàn hảo từ trước mà do thiếu thông tin ta chưa biết tới. Càng là vô lí khi Viện Hán Nôm lại đi vào mày mò nghiên cứu thử nghiệm để lập những chương trình phần mềm để tự phục vụ cho mình.

Trong xu thế tin học hóa của toàn xã hội, rồi đây chẳng cứ Hán Nôm mà tất cả mọi ngành đều sẽ phải tiếp cận và sử dụng phương tiện hiện đại. Không phải ai khác ngoài những chuyên viên Hán Nôm sẽ là người trực tiếp tham gia chủ yếu của những công trình Tin học Hán Nôm, bởi như trên đã nói, tri thức Hán Nôm sẽ là một tiêu chí cho những công trình ứng dụng tin học vào Hán Nôm. Để có thể triển khai những công trình này cần phải có sự chuẩn bị, mà trước hết là chuẩn bị cho những người Hán Nôm biết sử dụng công cụ máy tính. Điều này không chỉ nhằm vào thực hiện các công trình ứng dụng tin học mà xa hơn còn là chuẩn bị để sử dụng những sản phẩm của nó sau này. Nếu như phổ cập kiến thức tin học cơ sở nói chung để việc sử dụng máy tính không còn là “đặc quyền” của một số người, thì việc phổ biến học tập thao tác với chương trình liên quan đến chữ Hán, chí ít là đối với số cán bộ nghiên cứu, lại là sự phát huy một mặt mạnh đặc thù, một ưu thế nghề nghiệp mà các cơ sở khác không dễ gì có được.

Chú thích:

1. Viết tắt của thuật ngữ American Standard Information Interchange.

2. Viết tắt của thuật ngữ Single Byte Code System.

3. Viết tắt của thuật ngữ Double Byte Code System.

4. Chữ Quốc ngữ tiếng Việt trong một số trường hợp cũng sử dụng mã hai bai này, nhưng vì số lượng chữ cái ít nên vấn đề đơn giản hơn rất nhiều so với chữ Hán.

Thông báo Hán Nôm học 1997 (tr.414-422)

Nguyễn Văn Nguyên
Thống kê truy cập
  • Đang online: 1
  • Hôm nay: 1
  • Trong tuần: 1
  • Tất cả: 1
VIỆN HÀN LÂM KHOA HỌC XÃ HỘI VIỆT NAM - VIỆN NGHIÊN CỨU HÁN NÔM

Địa chỉ: 183 Đặng Tiến Đông - Đống Đa - Hà Nội
Email: hannom.vass@gmail.com
Tel: 84 24. 38573194
Chịu trách nhiệm nội dung: Viện Nghiên cứu Hán Nôm