Thứ năm, 22/10/2020 | 04:56 - GMT+7

Bộ giải pháp dịch đa ngôn ngữ 6 trong 1 giúp tăng tốc xử lý các công việc dịch thuật gấp nhiều lần

Viện Công nghệ Thông tin (Đại học Quốc gia Hà Nội) được Vụ Khoa học và Công nghệ giao nhiệm vụ phát triển một phần mềm hỗ trợ dịch đa ngôn ngữ Anh - Việt - Trung nhằm cung cấp thêm cho các cơ quan nhà nước, cơ quan thông tấn một công cụ hỗ trợ hiệu quả cho những công việc liên quan.

21/09/2020 - 10:24
Trong môi trường làm việc toàn cầu ngày nay, tiếp xúc và làm việc với nhiều ngôn ngữ là điều bắt buộc. Tuy nhiên không phải ai cũng có khả năng thành thạo nhiều ngoại ngữ. Từ thực tế đó, các phần mềm hỗ trợ dịch thuật đã ra đời để giúp các công việc liên quan đến dịch thuật trở nên đơn giản hơn. 
Năm 2015, Viện Công nghệ Thông tin (Đại học Quốc gia Hà Nội) đã được Vụ Khoa học và Công nghệ (Bộ Công Thương) giao nhiệm vụ phát triển một phần mềm hỗ trợ dịch đa ngôn ngữ Anh - Việt - Trung nhằm cung cấp thêm cho các cơ quan nhà nước, cơ quan thông tấn một công cụ hỗ trợ hiệu quả cho những công việc liên quan. Phần mềm sau đó đã được chính thức được phát hành vào cuối năm 2017, trở thành công cụ đắc lực cho các nhân viên, công chức, người làm biên - phiên dịch.
Sản phẩm của đề tài bao gồm bộ giải pháp với 6 nhóm sản phẩm và dịch vụ chính: hệ thống hỗ trợ dịch câu đơn và đoạn văn, bộ từ điển 5 chuyên ngành, hệ thống chia sẻ dữ liệu dịch, tiện ích trò chuyện đa ngôn ngữ, tiện ích hỗ trợ dịch cabin và hệ thống nhận dạng chữ viết và mẫu biểu đa ngôn ngữ. 
Tiện ích dịch và dịch chat tự động của bộ giải pháp
Theo chia sẻ của PGS. TS. Nguyễn Ái Việt, chủ nhiệm đề tài nghiên cứu, hiện nay trên thị trường không thiếu các giải pháp và công cụ dịch, nhưng một công cụ tích hợp 6 trong 1, vừa giúp giải quyết các vấn đề dịch cabin và dịch qua văn bản, mẫu biểu thì chưa được ghi nhận.  "Tiện ích hỗ trợ dịch cabin bao gồm tiện ích hỗ trợ dịch tại chỗ và gỡ băng tiếng Anh. Ví dụ, người sử dụng đưa đầu vào là các file âm thanh với định dạng phù hợp bằng tiếng Anh, phần mềm sẽ quét và cho đầu ra là file dịch bằng tiếng Việt", PGS. TS. Nguyễn Ái Việt chia sẻ. "Tất nhiên độ chính xác của đầu ra sẽ tùy theo mức độ phức tạp của ngôn ngữ, chất lượng đầu vào của bản ghi. Nhưng về cơ bản công cụ này đã giúp việc gỡ băng, bóc băng của các phóng viên, biên tập viên trở nên đơn giản hơn rất nhiều."
Tiện ích từ điển chuyên ngành và nhận dạng mẫu biểu, chữ viết
Một điểm đặc biệt nữa của bộ giải pháp, như chủ nhiệm đề tài cho biết, đó là hệ thống phần mềm nhận dạng chữ viết và mẫu biểu đa ngôn ngữ. Theo đó, khi nhập một mẫu biểu có một phần chữ viết tay vào phần mềm sẽ hỗ trợ quét văn bản, số hóa và dịch ra ngôn ngữ đích. "Tiện ích này rất hữu ích cho những cơ quan cần dịch và số hóa nhiều văn bản, thư từ, biểu mẫu...", PGS. TS. Nguyễn Ái Việt chia sẻ. 
Cũng theo chia sẻ của PGS. TS. Nguyễn Ái Việt, bộ giải pháp sử dụng công nghệ lõi là phương pháp dịch thống kê (SMT) kết hợp với phương pháp dịch theo ví dụ (EBMT), dịch dựa trên quy tắc (RBMT). Phương pháp này đã chứng minh được tính hiệu quả cho các hệ thống dịch máy chất lượng cao khi các máy dịch SMT đã liên tục thắng thế trong các cuộc thi dịch máy hàng năm.
Hiện nhóm nghiên cứu đang tiếp tục phát triển bộ giải pháp theo xu hướng học máy và dần dịch chuyển sang mô hình hệ thống dịch máy sử dụng mạng nơ-ron nhân tạo (NMT).
PGS. TS. Nguyễn Ái Việt, chủ nhiệm đề tài
Được biết, đề tài đã được đánh giá thử nhiệm và hợp chuẩn các sản phẩm tại Viện Công nghiệp phần mềm - Nội dung số Việt Nam. Đồng thời cũng đã được chuyển giao công nghệ cho một số cơ quan thông tấn, cơ quan nhà nước nhằm hỗ trợ công cụ xử lý công việc bóc băng, dịch thuật hiệu quả hơn. 
Đề tài "Phát triển hệ thống dịch đa ngữ Anh – Việt - Trung" thuộc khuôn khổ Chương trình phát triển một số ngành công nghiệp công nghệ cao do Bộ Công Thương chủ trì, được thực hiện bởi Viện Công nghệ Thông tin, Đại học Quốc gia Hà Nội.
Hải Yến ghi

Xem thêm

Tổng số lượt truy cập :
  • 4
  • 8
  • 3
  • 0
  • 4
  • 5
  • 6