Khoa học

Thúc đẩy nghiên cứu, phát triển các ứng dụng dựa trên nền tảng ngôn ngữ học máy tính

Công Chương 23/11/2023 - 11:53

Ngày 22/11, hội thảo khoa học "Ngôn ngữ học máy tính: Những vấn đề lý luận và thực tiễn" đã diễn ra tại Trường ĐH Ngoại ngữ - Tin học TP.HCM (HUFLIT). Hội thảo do HUFLIT và Hội Ngôn ngữ học Việt Nam đồng tổ chức, nhằm mục đích thúc đẩy hoạt động nghiên cứu, phát triển các ứng dụng dựa trên nền tảng ngôn ngữ học máy tính.

huflit-hoi-thao-ngon-ngu-may-tinh-1a.jpg
PGS.TS. Nguyễn Lân Trung, Chủ tịch Hội Ngôn ngữ học Việt Nam phát biểu tại sự kiện.

Nhiều tham luận hay, có giá trị học thuật cao... về ngôn ngữ học máy tính

Theo PGS.TS. Nguyễn Lân Trung, Chủ tịch Hội Ngôn ngữ học Việt Nam, đây là lần đầu tiên Hội Ngôn ngữ học Việt Nam phối hợp tổ chức hội thảo ngôn ngữ học máy tính. Hội thảo được tổ chức nhằm mục đích thúc đẩy hoạt động nghiên cứu, phát triển các ứng dụng dựa trên nền tảng ngôn ngữ học máy tính cho các nhà nghiên cứu, chuyên gia và cộng đồng ngôn ngữ học. Đồng thời, sự kiện cũng là cơ hội quý giá để trao đổi, học hỏi và chia sẻ kiến thức, kinh nghiệm trong lĩnh vực ngôn ngữ học máy tính, đồng thời giải quyết các vấn đề quan trọng và cập nhật về những xu hướng mới trong ngành.

“Hội thảo đã thu hút nhiều tham luận hay, có giá trị học thuật cao, nhiều trao đổi thú vị... về ngôn ngữ học máy tính. Chúng tôi sẽ tổ chức hội thảo khoa học Ngôn ngữ học máy tính thành hội thảo khoa học thường niên, mỗi năm 1 lần tại HUFLIT” - PGS.TS. Nguyễn Lân Trung chia sẻ.

huflit-hoi-thao-ngon-ngu-may-tinh-8.jpg
Đại diện nhà trường, PGS.TS Nguyễn Ngọc Vũ - Phó Hiệu trưởng HUFLIT cám ơn các diễn giả chính của Hội thảo.

Theo Ban tổ chức, hội thảo thu hút 30 báo cáo khoa học chia thành bốn chủ đề chính: (1) Ngữ nghĩa học máy tính (Computational Semantics): Tập trung vào xác định ý nghĩa của từ, xử lý cảm xúc trong văn bản, xử lý văn bản đa ngôn ngữ, xử lý câu hỏi và trả lời tự động; (2) Cú pháp học máy tính (Computational Syntax): Bao gồm các hướng tiếp cận mới trong cú pháp học máy tính, xây dựng ngân hàng dữ liệu cú pháp, gán nhãn từ loại, và biểu diễn cấu trúc câu; (3) Các mô hình xử lý ngôn ngữ tự nhiên: Giới thiệu các mô hình Transformer như BERT và GPT, túi từ, mô hình n-gram, phân bố Latent Dirichlet, và Mạng nơ-ron tuần hoàn; (4) Ứng dụng của ngôn ngữ học máy tính: Trình bày các ứng dụng trong giáo dục ngôn ngữ, dịch tự động, truy xuất thông tin, phân tích văn bản, phát triển chatbot, và kiểm tra lỗi chính tả tự động.

Thông qua các tham luận báo cáo tại Hội thảo cho thấy, trong bối cảnh lĩnh vực trí tuệ nhân tạo (AI) đang trải qua những bước phát triển vượt bậc, ngôn ngữ học máy tính đóng một vai trò không thể phủ nhận trong việc hình thành và cải tiến các công nghệ mới. Ngôn ngữ học máy tính, với sự kết hợp giữa lĩnh vực ngôn ngữ học và khoa học máy tính, đã mở ra nhiều khả năng mới cho việc xử lý và hiểu ngôn ngữ tự nhiên, qua đó giúp máy móc hiểu và tương tác với con người một cách tự nhiên và hiệu quả hơn.

huflit-hoi-thao-ngon-ngu-may-tinh-4.jpg
Các đại biểu tham gia đặt câu hỏi với báo cáo viên.

Một trong những ứng dụng rõ rệt nhất của ngôn ngữ học máy tính là trong việc phát triển các hệ thống trợ lý ảo và chatbot. Những hệ thống này sử dụng công nghệ xử lý ngôn ngữ tự nhiên để phân tích, hiểu và phản hồi các yêu cầu của người dùng. Điều này không chỉ giúp cải thiện đáng kể trải nghiệm người dùng mà còn tối ưu hóa việc cung cấp thông tin và dịch vụ trong nhiều lĩnh vực khác nhau, từ y tế đến tài chính và giáo dục.

Ngoài ra, ngôn ngữ học máy tính còn đóng một vai trò quan trọng trong việc phát triển công nghệ dịch máy. Công cụ dịch tự động ngày càng trở nên mạnh mẽ hơn, giúp xóa bỏ rào cản ngôn ngữ và tạo điều kiện thuận lợi cho giao tiếp và hợp tác quốc tế.

Không chỉ dừng lại ở việc hiểu và dịch ngôn ngữ, ngôn ngữ học máy tính còn góp phần trong việc phân tích cảm xúc và ý định người dùng. Công nghệ này có thể phân tích các mẫu văn bản lớn để nhận diện cảm xúc, quan điểm và ý định, mở ra khả năng ứng dụng rộng rãi trong các lĩnh vực như quản lý quan hệ khách hàng, giám sát truyền thông xã hội và nghiên cứu thị trường.

Vai trò của ngôn ngữ học máy tính càng trở nên quan trọng khi AI tiếp tục phát triển và tích hợp sâu hơn vào cuộc sống hàng ngày. Lĩnh vực nghiên cứu này không chỉ cải thiện khả năng giao tiếp giữa con người và máy móc mà còn mở ra những khả năng mới, từ việc tự động hóa các tác vụ đơn giản đến việc tạo ra những trải nghiệm tương tác phong phú và có ý nghĩa.

Ứng dụng trí tuệ nhân tạo trong nghiên cứu ngôn ngữ học

Với tham luận “Ứng dụng trí tuệ nhân tạo (AI) trong nghiên cứu ngôn ngữ học”, PGS.TS Đinh Điền - Giám đốc Trung tâm Ngôn ngữ học Tính toán, Trường ĐH Khoa học Tự nhiên - ĐH Quốc gia TP.HCM) đã nêu những luận điểm thú vị trong việc áp dụng các công nghệ của Trí tuệ nhân tạo, Học máy (ML: Machine Learning) để học cách thức gán nhãn ngôn ngữ từ các kho ngữ liệu tiếng Việt có chú thích (annotated corpora) để sau đó, máy tự động gán nhãn ngôn ngữ cho các văn bản tiếng Việt trong các kho ngữ liệu khác.

huflit-hoi-thao-ngon-ngu-may-tinh-3.jpg
PGS.TS Đinh Điền (Giám đốc Trung tâm Ngôn ngữ học Tính toán, Trường ĐH Khoa học Tự nhiên - ĐH Quốc gia TP.HCM) phát biểu tại sự kiện.

Theo PGS.TS Đinh Điền, chỉ khi gán nhãn ngôn ngữ, chúng ta mới có thể tiến hành thống kê, khai thác, khám phá quy luật của ngôn ngữ để giải một số bài toán thực tế có liên quan đến ngôn ngữ, như: Đo độ khó của văn bản, đo khoảng cách ngữ nghĩa của từ, đo độ tương đồng văn bản, so sánh đối chiếu ngôn ngữ… Từ các kết quả nghiên cứu này, chúng ta có thể ứng dụng vào các công việc thực tế, như: biên soạn từ điển, biên soạn sách giáo khoa, xây dựng ngân hàng đề thi, giảng dạy ngoại ngữ cho người Việt, giảng dạy tiếng Việt cho người nước ngoài, nhận dạng ảnh chữ Hán-Nôm, chuyển tự chữ Hán-Nôm sang chữ Quốc ngữ, dịch nghĩa các văn bản Hán cổ...

PGS.TS Đinh Điền kết luận: “Việc ứng dụng AI đã giúp các nhà ngôn ngữ học có thể gán nhãn ngôn ngữ một cách tự động và nhanh chóng cho các đơn vị ngôn ngữ khác nhau thuộc nhiều bình diện ngôn ngữ khác nhau cho những kho ngữ liệu rất lớn. Chính từ kho ngữ liệu lớn có chú thích ngôn ngữ phong phú này, chúng ta có thể khai thác để giải nhiều bài toán trong lĩnh vực ngôn ngữ học, chẳng hạn: phân tích độ khó văn bản, phân tích độ đo phong cách học văn bản, phân tích về mặt ngữ nghĩa của văn bản, so sánh giữa các văn bản về mặt ngữ nghĩa, về mặt độ khó, về mặt phong cách, phát hiện quy luật chuyển tự, chuyển vị, chuyển ngữ,…

Khi giải được các bài toán trên, chúng ta có thể ứng dụng các kết quả đó vào nhiều vấn đề trong thực tế, như: giảng dạy ngôn ngữ/ngoại ngữ, biên soạn sách giáo khoa, giáo trình, đề thi; xây dựng hệ thống phát hiện đạo văn, tìm tác giả của các tác phẩm nặc danh, tóm tắt văn bản, sinh văn bản, ngôn ngữ học đối chiếu xuyên ngữ (cross-lingual contrastive linguistic), dịch tự động, sinh văn bản, trả lời tự động,…

Qua đó, phần quan trọng nhất chính là kho ngữ liệu. Nếu chúng ta có kho ngữ liệu được xây dựng đúng theo các tiêu chí ngôn ngữ học ngữ liệu và được gán nhãn thông tin ngôn ngữ càng phong phú, thì các kết quả khai thác từ các kho đó càng chính xác và ứng dụng thực tế càng hiệu quả. Phần mô hình học chúng ta hoàn toàn có thể kế thừa từ các nghiên cứu của nước ngoài, nhưng phần kho ngữ liệu thì phải tự xây dựng vì nó mang các đặc thù của ngôn ngữ tiếng Việt...”.

huflit-hoi-thao-ngon-ngu-may-tinh-6a.jpg
PGS.TS Nguyễn Ngọc Vũ - Phó Hiệu trưởng HUFLIT phát biểu tại sự kiện.

Với tham luận “Các tiến bộ và ứng dụng của Ngữ pháp cấu trúc thành tố trong ngôn ngữ học máy tính”, PGS.TS Nguyễn Ngọc Vũ - Phó Hiệu trưởng HUFLIT và nhóm nghiên cứu cho rằng, qua phân tích mối quan hệ chặt chẽ giữa Ngữ pháp cấu trúc thành tố (CG) và lĩnh vực ngôn ngữ học máy tính. Nhóm nghiên cứu muốn làm sáng tỏ những cách thức đa dạng mà lí thuyết ngôn ngữ học này đã giao cắt và đôi khi biến đổi với nghiên cứu ngôn ngữ học máy tính.

“Qua những tiến bộ gần đây của CG, có thể đánh giá cao sự linh hoạt và khả năng thích ứng của CG, khi nó đã biến đổi và phát triển để đáp ứng những thách thức không ngừng thay đổi mà ngôn ngữ học máy tính đặt ra. Đồng thời, thông qua việc bàn đến các ứng dụng thực tế của CG trong một loạt các nhiệm vụ và quy trình ngôn ngữ học, cho thấy tầm quan trọng và ý nghĩa của nó trong bối cảnh rộng lớn hơn của ngôn ngữ học máy tính...” - PGS.TS Nguyễn Ngọc Vũ nhấn mạnh.

huflit-hoi-thao-ngon-ngu-may-tinh-9.jpg
Các đại biểu tham dự chụp hình lưu niệm.

PGS.TS Nguyễn Ngọc Vũ cũng cho biết hiện HUFLIT đang trong quá trình hoàn thiện kế hoạch đưa việc ứng dụng ngôn ngữ học máy tính vào trong chương trình giảng dạy của khoa Ngoại ngữ.

Công Chương