VI | EN
39. Suy nghĩ bước đầu thực hiện ứng dụng Tin học Hán Nôm (TBHNH 1998)
TBHNH 1998

SUY NGHĨ TỪ BƯỚC ĐẦU THỰC HIỆN DỰ ÁN

ỨNG DỤNG TIN HỌC HÁN NÔM

NGUYỄN VĂN NGUYÊN

Viện Nghiên cứu Hán Nôm

Trong niềm phấn khởi chung của toàn thể Viện Hán Nôm khi hay tin “Dự án tổng thể” sau bao tháng ngày phấn đấu, mong đợi, cuối cùng đã được cấp trên phê duyệt, nhóm công trình ứng dụng Tin học chúng tôi cũng chia sẻ những lo lắng, trăn trở của Lãnh đạo Viện và Ban điều hành trong kế hoạch thực hiện mảng công tác này của dự án. Mục tiêu của dự án thì đã rõ, nhưng cụ thể sẽ triển khai như thế nào để đảm bảo sự chuẩn xác trong định hướng phát triển và tính hiệu quả thiết thực của công trình ứng dụng mới mẻ này. Xét trên thực tế, đặc biệt là từ tình hình khách quan và chủ quan hiện tại, khi mà Việt Nam cũng như các nước khác trên thế giới đang bước gần sát bản lề thế kỉ 21, thế kỉ của bùng nổ thông tin, mọi ngành đều ồ ạt đi vào tìm kiếm lợi ích của mình từ những ứng dụng thiết thực của Tin học, ngành Hán Nôm chúng ta cũng không thể đứng ngoài lề chờ đợi. Đặc biệt là Nhà nước, bằng nguồn kinh phí cấp cho mảng công tác này trong dự án, tuy không phải là quá rộng rãi nhưng cũng rất đáng kể trong điều kiện đất nước còn nhiều khó khăn hiện nay, đã chứng tỏ một mối quan tâm và khuyến khích chúng ta triển khai công việc. Nhưng cũng chính vì thế mà càng phải nghiêm túc thận trọng, cân nhắc, đặc biệt là ở những bước đi ban đầu của dự án.

Có thể sẽ có hai cách nhìn nhận thể hiện ra hai thái cực đối lập nhưng lại cũng giống nhau ở chỗ phi hiện thực của chúng. Quan niệm thứ nhất cho rằng, công nghệ thông tin học ngày nay đã phát triển rất nhanh đến mức thần kỳ, đủ đáp ứng một cách dễ dàng tất cả những nhu cầu ứng dụng cho mọi lĩnh vực, mọi ngành nghề khác nhau. Ở đâu đó đã và sẽ có những chương trình phần mềm rất siêu việt, được tiêu chuẩn hóa cao độ để có thể trực tiếp đem áp dụng rộng rãi cho rất nhiều đối tượng cùng sử dụng. Về phần mình, các chuyên viên Hán Nôm, vì đã đi vào một chuyên ngành KHXH mang nhiều tính chất, đặc điểm chuyên môn khác biệt quá xa với kĩ thuật tin học, nên không thể và không cần thiết tìm tòi nghiên cứu vào lĩnh vực này, mà chỉ nên bỏ công tìm kiếm, hoặc đơn giản hơn là hãy đợi rồi ắt sẽ có chương trình cần thiết kiểu “mì ăn liền” để đem vào sử dụng. Rõ ràng đây là thái độ thụ động và có phần tiêu cực. Không ai có thể phủ nhận phẩm chất và giá trị sử dụng tuyệt vời của những chương trình cơ bản mang tính chất phổ cập được sản xuất đại trà bởi các hãng phần mềm mà tên tuổi và uy tín của họ đã là một đảm bảo chắc chắn cho chất lượng của chúng. Nhưng chính tính chất phổ cập đại trà này lại hạn chế rất nhiều khả năng cung cấp những tính năng, công dụng đặc biệt để đáp ứng được đầy đủ những yêu cầu chuyên môn của chúng ta. Thực tiễn sử dụng những chương trình máy tính thông dụng kiểu như bộ Microsoft Office hay một số chương trình xử lí chữ Trung Quốc đã cho thấy chúng mặc dù đã được thiết kế để cho các nhu cầu sử dụng hết sức rộng rãi, nhưng nếu không qua nghiên cứu xử lý, cải tiến ít nhiều (và đôi khi cả bằng áp dụng những mẹo vặt nghề nghiệp nữa) thì cũng khó thực hiện được những đòi hỏi đặc biệt trong chuyên môn Hán Nôm. Do vậy phải cần đến những chương trình máy tính chuyên biệt. Ở đây cũng lại có cái khó là yêu cầu càng chuyên biệt bao nhiêu, càng hiếm có phần mềm thoả mãn được cho nhu cầu đó. Không phải là các chuyên gia tin học không đủ khả năng xử lý bài toán, mà vấn đề ở chỗ họ không đủ thông tin về nhu cầu đặc biệt của chúng ta để từ đó tìm cách giải quyết nó. Để cung cấp cho họ những thông tin đó một cách đầy đủ và chính xác, chúng ta vẫn phải đi vào nghiên cứu những nhu cầu cụ thể của chuyên môn ngành mình, đồng thời tìm hiểu càng sâu càng tốt những khả năng đáp ứng thực tế của phía tin học, từ đó mới đặt ra cho họ những đơn hàng khả thi và mang lại những công cụ đắc dụng. Như vậy dù đối với chương trình phần mềm phổ cập hay chuyên biệt, chúng ta đều cần phải nghiên cứu ứng dụng một cách chủ động.

Ngược chiều với quan niệm trên, một xu hướng thứ hai có thể do quá say sưa với những khả năng kì diệu của công nghệ tin học hiện đại hoặc bị cuốn hút bởi trào lưu thời thượng hiện thời nên luôn luôn muốn hướng ứng dụng tin học Hán Nôm vào những vấn đề mũi nhọn của tin học hiện đại. Quan niệm nóng vội này đôi khi còn sa đà đến mức quên đi cái gốc Hán Nôm hiểu theo hai khía cạnh: nhu cầu phát triển thực tế trước mắt của ngành và khả năng thực hiện của con người Hán Nôm, từ đó đề ra những mục tiêu thâm nhập sâu vào lĩnh vực chuyên môn của tin học, để vươn tới các ứng dụng cao cấp như dịch máy, nhận dạng, truyền thông… những đề tài có thể chỉ thấy xuất hiện trong kế hoạch phát triển của những trung tâm tin học tầm cỡ quốc gia. Rất khó cưỡng lại sức lôi cuốn của những ứng dụng này bởi sự hấp dẫn của nó, nhưng vô hình trung, bằng cách đó chúng ta sẽ xa rời khỏi mục đích ứng dụng mà đi vào lãnh địa phát triển của Tin học, một lĩnh vực chuyên môn mà không một chuyên viên nào của Viện Hán Nôm hiện tại dám tự nhận là đã am tường đủ mức. Tất nhiên có thể phát triển với sự trợ giúp của các chuyên gia Tin học, nhưng như chúng tôi đã có dịp đề cập tới sự phân biệt hai loại sản phẩm ứng dụng là sản phẩm Hán Nôm có ứng dụng công nghệ Tin học và sản phẩm Tin học dùng cho ứng dụng Hán Nôm, đó không phải là lối chơi chữ thông thường, mà suy ngẫm kĩ một chút sẽ thấy được tính mục đích và phạm vi ranh giới của kế hoạch phát triển công trình ứng dụng của Viện. Rõ ràng cần phải chú trọng hướng tới loại sản phẩm thứ nhất bởi nó sẽ trực tiếp phục vụ cho yêu cầu nghiệp vụ thiết thực của mình và còn vì nó nằm trong tầm khả năng thực hiện của chúng ta, để từ đó khẳng định giá trị khoa học của những tri thức Hán Nôm mà chúng ta có thể đưa được vào trong sản phẩm. Cũng không loại trừ khả năng phát triển loại sản phẩm thứ hai, những vấn đề đó có thể sẽ được đặt ra trong chiến lược phát triển lâu dài của ngành Hán Nôm trong tương lai, nhưng ở dự án mà nhà nước đặc biệt ưu tiên cho chúng ta nhằm cấp bách bảo tồn và khai thác di sản Hán Nôm hiện tại thì không.

Tản mạnh đôi chút trên để thấy được những suy tính cân nhắc của lãnh đạo viện trong bước khởi đầu thực hiện dự án. Mặc dù ở điểm xuất phát này chúng ta không có được những điều kiện thuận lợi cần thiết về cơ sở tiền đề cũng như môi trường thực hiện, tuy nhiên không nên coi là bước thử nghiệm mà phải cố gắng tạo ra được hiệu quả thực tế tương xứng với đầu tư kinh phí của dự án. Mặt khác, tuy nhằm vào một nhiệm vụ cụ thể của năm đầu nhưng cũng phải xem xét coi đó là một bộ phận trong kế hoạch phát triển nhiều năm tới dự án ứng dụng Tin học. Từ những phương châm đó, cuối cùng Viện đã xác định được công tác đầu tiên để triển khai dự án là sao lưu dữ liệu thư tịch cổ Hán Nôm trên đĩa CD-ROM nhằm chủ yếu vào mục đích bảo quản. Và nhiệm vụ đó được giao cho nhóm công trình chúng tôi gồm 6 thành viên huy động từ các phòng chuyên môn khá nhau thực hiện.

Kể từ tháng 9 năm 1998, nhóm công trình nhận nhiệm vụ đi vào chuẩn bị triển khai công tác hoàn toàn mới mẻ này trong điều kiện hầu như bắt đầu từ tay trắng. Từ việc thiết kế, đặt hàng hệ thống thiết bị mạng máy tính vừa đủ trang bị cho mục đích sao quét, xử lí và quản lý ảnh số, đồng thời không quá phô trương để tránh lãng phí trong tình hình thiết bị tin học rât nhanh chóng bị trở thành lạc hậu; đến việc hợp tác với bên đối tác tin học cùng nghiên cứu thiết kế một phần mềm chuyên dụng cho mục đích sao lưu và quản lý sử liệu thư tịch Hán Nôm trên đĩa quang. Chính trong phần mềm này chúng tôi đã xuất phát từ những đặc điểm, yêu cầu riêng biệt của chuyên môn Hán Nôm để cung cấp cho chuyên gia tin học những chỉ tiêu kĩ thuật và tính năng cần thiết mà chương trình phải thoả mãn, như về chủng loại, tính chất, thực trạng, kích thước dung lượng… của các loại tài liệu Hán Nôm cần số hóa lưu trữ. Đặc biệt là tuy nhằm vào mục đích lưu trữ bảo quản là chính, nhưng bằng vào thực tiễn thường ngày của người làm công tác chuyên môn Hán Nôm, chúng tôi đã đề xuất bổ sung hàng loạt tính năng, công dụng đặc thù vào chương trình để phát huy triệt để những ưu thế của công nghệ tin học, tạo ra thuận lợi tối đa có thể được, không chỉ có công tác quản lí lưu trữ mà phần nào cả cho việc truy cập khai thác dữ liệu của người nghiên cứu, qua đó khuyến khích sử dụng phương tiện dữ liệu điện tử, một cách gián tiếp bảo quản tư liệu nguyên bản.

Việc quét ảnh số hóa tài liệu, mặc dù công nghệ tin học hiện đại đã cung cấp những thiết bị phần cứng và phần mềm cần thiết đảm bảo khá thuận tiện cho sử dụng, nhưng vấn đề vấp phải là ở chỗ chúng tôi hoàn toàn không có những nghiệm thực hiện. Đã từng có công trình quét lưu tương tự của đơn vị bạn được tiến hành từ trước vài năm nay, nhưng vì tính chất tài liệu của họ có nhiều điểm khác với ta, nên cũng không học hỏi được nhiều. Hơn nữa do đã tự đặt ra thêm một mục đích phục vụ truy cập khai thác dữ liệu ảnh số nên chúng tôi phải tham khảo sách vở, mày mò nghiên cứu, thử nghiệm để xây dựng nên một phương án được coi là qui trình sao lưu số hóa thư tịch cổ phục vụ cho lưu trữ, quản lí, truy cập tư liệu Hán Nôm, trong đó đề ra từng bước công việc cụ thể, từ khâu lập phiếu mô tả chi tiết kết cấu hình thức và nội dung tài liệu; dùng thiết bị scan để ảnh số hóa dữ liệu; tạo lập hệ thống từ khóa cho từng bộ sách để nhập vào chương trình quản lí với đầy đủ 9 yêu tố về tên chỉ mục bằng chữ Hán nguyên bản và chữ Việt phiên âm, cấp độ thư mục, số thứ tự của trang tài liệu trong kết cấu tập sách cũng như số tờ a/b truyền thống trên nguyên bản và những thông tin về địa chỉ và tên file ảnh liên kết… cho đến bước biên tập, sắp xếp dữ liệu cùng với chương trình phần mềm quản lí liên quan để sao lưu lên từng đĩa CD-ROM. Trong từng khâu như vậy đều có xác định những chỉ tiêu cụ thể như về dạng thức và số lượng cấp độddd mục từ cho quản lý và truy cập, các thông số kĩ thuật về định dạng format của ảnh quét sao cho đáp ứng nhu cầu lưu trữ thông tin trung thực về trang tài liệu nguyên bản đồng thời kiêm cố cả yêu cầu truy cập nhanh chóng cho dịch vụ khai thác duyệt đọc. Và đi kèm sau tất cả mỗi bước, chúng tôi đề duy trì khâu kểm tra, hiệu đính để đảm bảo sự chuẩn xác và chất lượng.

Tập thể nhóm công trình đã dựa theo qui trình này mà triển khai công việc. Hầu hết thành viên của nhóm vốn đều là cán bộ của các phòng nghiên cứu tập hợp lại, khả năng cũng như bề dày tiếp cận với kỹ thuật tin học đương nhiên đều rất non kém. Hầu hết các phần mềm sử dụng cho công việc như hệ điều hành mạng Windows NT, Windows 98, trình quét ảnh, trình xử lí ảnh PhotoShop, chương trình quản lý, khai thác dữ liệu ảnh… đều là những chương trình mới mẻ mà anh em mới lần đầu tiếp xúc. Cho nên thời gian mấy tháng tiến hành công trình đồng thời cũng là quá trình chúng tôi mày mò học hỏi để hướng tới làm chủ và sử dụng công cụ tin học. Nhờ vậy, có thể nói mọi bước công việc từ A đến Z đều được anh em trong nhóm trực tiếp tiến hành. Ngược lại, với vốn kiến thức và kinh nghiệm thực tiễn nghề nghiệp, chúng tôi đã cố gắng phát huy mặt mạnh về chuyên môn để kết tinh ở mức cao nhất những tri thức Hán Nôm vào trong sản phẩm.

Sau mấy tháng khẩn trương, tích cực làm việc, đến nay nhóm công trình ưng dụng tin học chúng tôi đã có thể cho ra đời loạt sản phẩm đầu tiên, gồm hơn chục đĩa CD-ROM sao lưu ngót một vạn trang ảnh số hóa của 20 bộ thư tịch Hán Nôm thuộc nhiều chủng loại. Những tư liệu này, vừa hàm chưa một phiên bản điện tử trung thực của nguyên bản gốc để đưa vào bảo quản lưu trữ lâu dài, đồng thời cũng độc lập là một chương trình quản lí dữ liệu thư tịch Hán Nôm sẵn sàng phục vụ cho người nghiên cứu và bạn đọc sử dụng. Chương trình này, ngoài chức năng truy cập và hiển thị với mọi tỉ lệ khác nhau lần lượt từng trang của tài liệu kèm theo các yếu tố thư viện của chúng ra, chúng tôi đã thêm vào những công năng khác nhằm trợ giúp người sử dụng truy cập đến trang sách cần thiết một cách thuật tiẹn và nhanh chóng, như khả năng nhảy tới trang (hoặc tờ) cần thiết, tra tìm trên hệ thống sơ đồ kết cấu tư liệu với nhiều tầng lớp logic và hình thức, tra tìm bằng từ khóa (cả chữ Việt và chữ Hán), công năng in ấn với các tùy chọn khác nhau v.v.. Đặc biệt là chương trình đã cố gắng thể hiện toàn bộ những thông tin về nguyên bản đồng thời bằng hai thứ văn tự Hán Việt (phiên âm) trên chương trình quản lý dữ liệu hoạt động trong môi trường của hệ điều hành 32 bit, thậm chí ngay cả trên những máy tính không có cài đặt chương trình chữ Hán, nhờ vậy có thể mở rộng rất nhiều phạm vi sử dụng của chương trình.

Chưathể nói đã là hoàn hảo và chắc chắn còn nhiều điểm hạn chế tồn tại cùng với những sai sót khó tránh tạo ra bởi trình độ có hạn của nhóm thực hiện công trình, cũng như những lúng túng, bỡ ngỡ tất yếu trong bước khởi đầu. Dù sao, những đĩa dữ liệu đầu tay này đã thể hiện nhiệt tình dám nghĩ làm của cán bộ Hán Nôm trước thách thức mới của khoa học. Còn quá sớm để có thể đưa ra những nhận định hay bài học kinh nghiệm mang tính tổng quát ra những nhận định hay bài học kinh nghiệm mang tính tổng quát, tuy nhiên từ thực tế thời gian đầu thực hiện dự án vừa qua có thể rút ra một điều rằng, chỉ cần có hướng đi đúng đắn xuất phát từ nhu cầu thiết thực và khả năng hiện thực của chuyên môn, các cán bộ Hán Nôm hoàn toàn có thể sử dụng những công cụ mà công nghệ tin học hiện đại cung cấp để tạo ra hiệu quả ở những sản phẩm Hán Nôm có giá trị khoa học nhằm đáp ứng từng bước những nhu cầu mới của thời đại.

Thông báo Hán Nôm học 1998 (tr.320-328)

Nguyễn Văn Nguyên
Thống kê truy cập
  • Đang online: 1
  • Hôm nay: 1
  • Trong tuần: 1
  • Tất cả: 1
VIỆN HÀN LÂM KHOA HỌC XÃ HỘI VIỆT NAM - VIỆN NGHIÊN CỨU HÁN NÔM

Địa chỉ: 183 Đặng Tiến Đông - Đống Đa - Hà Nội
Email: hannom.vass@gmail.com
Tel: 84 24. 38573194
Chịu trách nhiệm nội dung: Viện Nghiên cứu Hán Nôm