This page is READ-ONLY. It is generated from the old site.
All timestamps are relative to 2013 (when this page is generated).
If you are looking for TeX support, please go to VietTUG.org

Gõ tiếng Việt trong TeX

Để gõ tiếng Việt trong TeX, bạn cần phải có trình soạn thảo hỗ trợ tiếng Việt. Hai yêu cầu đối với editor đó là nó hỗ trợ Input_Encoding (bảng mã nhập) và Input_Method (phương pháp nhập) thích hợp cho tiếng Việt.

Input Encoding (bảng mã nhập)

Nếu bạn không quen thuộc với thuật ngữ này, có thể hình dung ngắn gọn như sau: Mỗi phím trên bàn phím được tương ứng với một chữ. Máy tính không hiểu các chữ cái mà nó chỉ hiểu các con số. Bảng gán mỗi chữ cái với con số được gọi là bảng mã nhập.

Một trong các bảng mã nhập cho người Việt được dùng phổ biến là VISCII. Sự ra đời và phổ biến của bảng mã này xuất phát từ việc các chương trình máy tính chỉ hỗ trợ chủ yếu cho tiếng Anh và Mỹ. Và vấn đề cũng xuất phát từ đây, khi chỉ có 256 ký tự được sử dụng trong bảng mã. Mặc dù con số đó đủ để biểu diễn tiếng Việt, nhưng lại không đáp ứng được nhu cầu trình bày văn bản đa ngôn ngữ.

Các tiếp cận tốt hơn là sử dụng bảng mã Unicode, cụ thể là UTF-8. Đây là bảng mã rất hiệu quả, hỗ trợ mọi hệ thống chữ viết trên thế giới. Nhờ đó, bạn có thể cùng lúc trình bày trong tài liệu của mình tiếng Việt, tiếng Ả Rập, Hàn Quốc, Ấn Độ,... Bảng mã UTF-8 là bảng mã của tương lai và thực tế đã được sử dụng rất nhiều tại Việt Nam, sau các khuyến cáo và chương trình tập huấn của chính phủ.

VnTeX hỗ trợ nhiều bảng mã nhập khác nhau như VISCII, TCVN, UTF-8, ...; tuy nhiên, không có hỗ trợ cho VNI. Và như vậy, bạn có thể sử dụng bảng mã nhập mình thích để gõ tiếng Việt trong TeX. Vấn đề còn lại là bạn sẽ nó cho TeX biết bạn dùng bảng mã nào. Hãy xem phần tiếp theo.

Font Encoding (bảng mã font)

Vấn đề ở trên cũng xảy ra một cách tương tự với font (phông chữ). Một font (phông) là tập hợp của các glyph (ký tự đồ họa). Một glyph là biểu diễn đồ họa của một ký tự, ví như là chữ A mà bạn dùng bút vẽ trên giấy. Với chữ cái a, có thể biểu diễn ở dạng đồ họa như là a, a, a hay a. Như vậy, phông chữ không bao giờ chứa các ký tự, mà nó chỉ chứa glyph, và đôi khi nhiều glyph cho cùng chữ cái. Thông thường, font chứa 256 glyph hoặc hơn, nhưng khả năng của TeX chỉ có thể sử dụng tối đa 256 ký tự cùng lúc. Bảng tương ứng chữ cái với glyph được gọi là bảng mã font.

Nếu bạn sử dụng LaTeX, một tên riêng được gán cho mỗi chữ cái đọc từ bàn phím (ví dụ, chữ Â được gán cho tên Acircumflex). Bằng cách đó, LaTeX có thể làm việc với số lượng bất kỳ chữ cái. Và cũng nhờ đó, bạn có thể dùng một hay nhiều bảng mã phông và LaTeX sẽ tự động nhận biết và chuyển đổi giữa các bảng mã phông một cách tự động. Trong hầu hết các trường hợp, bạn chỉ cần biết răng bảng mã font T1 hỗ trợ các ngôn ngữ Western European, và T5 hỗ trợ tiếng Việt.

Input Method (phương pháp nhập)

Trên bàn phím kiểu Mỹ, bạn chỉ thấy các chữ cái Latin, không thấy chữ cái tiếng Việt. Như vậy, xuất hiện vấn đề làm thế nào để đưa vào tài liệu trên máy tính các chữ cái tiếng Việt. Để trả lời, bạn dùng phương pháp nhập (cách nhập). Mỗi cách nhập cho phép bạn sử dụng các chữ cái không xuất hiện hoặc không hỗ trợ bởi bàn phím. Nếu bạn chọn phương pháp VIQR, bạn có thể lần lượt gõ Ha` No^.i trên bàn phím để cuối cùng thấy trên màn hình Hà Nội.

Tuy nhiên, phương pháp nhập phụ thuộc nhiều vào hệ thống (hệ điều hành). Nếu hệ thống không hỗ trợ cách nhập nào thích hợp, bạn phải tìm kiếm đến sự hỗ trợ của trình soạn thảo.

Tài liệu tham khảo

  1. Hàn Thế Thành, Reinhard Kotucha, "VnTeX - Typesetting Vietnamese", vntex.pdf from VnTeX 3.1.9 distribution
  2. Kỳ Anh, TeX ngừng hỗ trợ font Unicode, VietTUG's blog