Dịch Máy (Machine Translation – MT) hay Dịch Tự Động là sự kết hợp giữa ngôn ngữ – dịch thuật – khoa học máy tính. Trong những năm gần đây, với sự xuất hiện của Dịch Máy Nơ-ron (NMT) cùng hệ thống dữ liệu đồ sộ nên các máy dịch đã cải thiện được khá nhiều về tính tự nhiên của ngôn ngữ. Tuy nhiên đầu ra của MT vẫn còn cách xa sự hoàn hảo và đòi hỏi có sự tham gia của con người vào quá trình sửa lỗi (Post-Editing) để có kết quả chất lượng cao. ISO 18587:2017 ra đời nhằm đưa ra các yêu cầu đối với quá trình Post-Editing hoàn chỉnh, có con người tham gia vào đầu ra của bản dịch máy cũng như yêu cầu về năng lực của người thực hiện.
Chính sự cải tiến nhanh chóng và những tiến bộ rõ rệt của Máy dịch đã khuyến khích Tổ chức Tiêu chuẩn Quốc tế tập trung vào khía cạnh thứ hai, cụ thể là Hiệu đính bản dịch máy.
ISO 18587:2017 mô tả các quy trình liên quan đến việc Hiệu đính bản Dịch máy bởi một nhà ngôn ngữ học có năng lực (post-editor), và thiết lập các yêu cầu về năng lực cần thiết cho người hiệu đính. Hiệu đính bản dịch máy là quá trình trong đó một nhà ngôn ngữ học sửa lại (đọc và sửa) bản dịch đầu ra MT thô.
Tiêu chuẩn chủ yếu đề cập đến thuật ngữ “hiệu đính bản dịch máy” và tập trung vào “người hiệu đính” thay vì người dịch. Theo nghĩa chặt chẽ, bất cứ khi nào văn bản đầu vào vượt qua quá trình kiểm tra của công cụ CAT ban đầu hoặc bất kỳ phân tích trước khi dịch hoặc xử lý nội dung nào được máy tính hỗ trợ, nó sẽ trở thành một bản dịch đầu ra của máy.
Trong ISO 18578, những người sửa lỗi được coi là các chuyên gia dịch thuật theo cùng một định nghĩa như trong ISO 17100, do đó một nhà cung cấp dịch vụ dịch thuật cần cung cấp bằng chứng rằng những người sửa lỗi bản dịch máy chứng minh được:
Sửa lỗi bản dịch máy cũng có những đặc tính riêng mà khi các dịch giả biến đổi thành người sửa lỗi bản dịch máy cũng cần phải bổ sung kỹ năng. Do máy móc được sử dụng nhiều trong quá trình dịch thuật nên việc chỉnh sửa đầu ra của MT đòi hỏi kiến thức đặc biệt về các công cụ CAT và hiểu biết về cách các hệ thống quản lý dịch và thuật ngữ tương tác với MT và các hệ thống MT. Người sửa lỗi cần được đào tạo kỹ lưỡng để sử dụng đúng các công cụ sửa lỗi, nhận biết các lỗi MT phổ biến, đánh giá xem có ý nghĩa để sửa lỗi đầu ra của MT dựa trên công sức và thời gian đã bỏ ra và làm quen với sự khác biệt giữa các quy trình sửa lỗi đầy đủ và sửa lỗi nhẹ cũng như kết quả cuối cùng.
Để duy trì một sự tôn trọng cao đối với các nhà hoạt động trong ngành dịch thuật, và đặc biệt là đối với các công ty phụ thuộc vào việc sử dụng bộ nhớ dịch và các nguồn và quy trình dịch khác bao gồm MT, chúng tôi rất khuyến khích làm quen với tiêu chuẩn ISO 18587 và cũng xem xét phương pháp chất lượng của các nhà cung cấp dịch bên thứ ba của họ trong ngữ cảnh của sửa lỗi sau đầu ra của MT.
Bạn đã bao giờ sử dụng Google Dịch để dịch một email hoặc một từ hoặc văn bản mà bạn không hiểu sang ngôn ngữ mẹ đẻ của mình chưa? Bạn đã bao giờ đọc một bình luận trên Facebook được dịch tự động từ một ngôn ngữ mà bạn không hiểu chưa? Nếu câu trả lời là có thì bạn đã sử dụng MT. MT đã trở nên phổ biến trong cuộc sống hàng ngày của công ty dịch thuật, nhà ngôn ngữ học và thậm chí cả những người không cố ý liên kết công việc hoặc sở thích của họ với dịch thuật. Một nghiên cứu được thực hiện tại Việt Nam năm 2023 của AM Việt Nam cho thấy gần 100% các công ty dịch thuật và dịch thuật viên ứng dụng MT.
Một trong những lý do khiến Dịch máy có được những cải tiến như vậy là nhờ sự đóng góp của những gã khổng lồ công nghệ như Microsoft, Google, ChatGPT.
Hiện nay có 4 công nghệ dịch máy là Dịch máy Nơ-rôn, Dịch máy thống kê (SMT), Dịch máy dựa trên quy tắc (RBMT) và Dịch máy dựa trên cụm từ (PBMT). Chính Dịch máy Nơ-rôn đã cho thấy kết quả tốt nhất và là động lực chính thúc đẩy Dịch máy phát triển.
Một nghiên cứu đã chỉ ra rằng việc sử dụng PBMT dẫn đến năng suất dịch tăng 18%, trong khi NMT giúp tăng 36% và giúp giảm 42% số lần nhấn phím mà các nhà ngôn ngữ học cần thực hiện trong quá trình chỉnh sửa hậu kỳ.
Theo nghiên cứu gần đây của AM Việt Nam, thuật ngữ dịch như Google được khách hàng sử dụng để đánh giá bản dịch của một công ty hoặc dịch thuật viên. Nghe có vẻ họ đang chỉ trích khéo về chất lượng của bản dịch, có thể khách hàng đang không hài lòng với cách bản dịch của bạn thể hiện. Đây là một thực tế hay gặp khi khách hàng thuê những công ty dịch giá rẻ hoặc thuê người dịch thiếu năng lực trong khi phải chạy tiến độ khá gay gắt.
Trên thực tế ứng dụng, Máy dịch kể cả là Máy dịch Nơ-rôn cũng còn nhiều hạn chế rõ rệt mà người dịch không thể trông chờ. Các bản dịch máy thường dịch theo đại ý, dễ mắc sai lầm do không thể đoán định ngữ cảnh hay đơn giản là dùng thuật ngữ không trúng. Để giải thích điều này rất đơn giản: Ngôn ngữ là văn hóa tự nhiên được tạo ra và tích lũy, một cỗ máy vô tri thì không thể hiểu hết được ý tứ của văn bản.
Tuy nhiên, việc ứng dụng MT vào dịch thuật sẽ giúp cho các công ty dịch thuật:
Ý tưởng đằng sau việc tiêu chuẩn hóa và đặc biệt là các tiêu chuẩn ISO khá đơn giản. Về cơ bản, nó là việc tìm ra cách thực hành tốt nhất để thực hiện điều gì đó, tập hợp các phương pháp thực hành tốt nhất trong ngành vào một tài liệu tiêu chuẩn duy nhất được quốc tế công nhận và trao chứng chỉ tuân thủ cho những ai đáp ứng các tiêu chuẩn này. Ngoài ra, những người nhận chứng chỉ còn được đánh giá thường xuyên để đảm bảo rằng họ tiếp tục đáp ứng các yêu cầu.
Điểm đầu tiên cần nhấn mạnh là Dịch máy phụ thuộc rất nhiều vào công nghệ được sử dụng, được biết đến trong ngành là Công cụ dịch máy. Ngược lại, chất lượng của công cụ phụ thuộc vào công nghệ điều khiển nó và lượng dữ liệu song song, được gọi là văn bản song song đóng vai trò là nguồn dữ liệu cho công cụ MT.
Không thể phủ nhận rằng Máy dịch đã có sự tiến bộ đáng kể trong những năm gần đây. Tuy nhiên, đầu ra MT “thô” sẽ cần được một nhà ngôn ngữ học sửa lại trong một quy trình được gọi là Post-editing nếu khách hàng yêu cầu bản dịch cần văn bản dịch phải rất chính xác, hoàn toàn nhất quán, thể hiện một dòng ngôn ngữ xuất sắc và tuân thủ theo những yêu cầu cụ thể hay tham khảo theo nội dung dịch thuật hiện có, chẳng hạn như Bộ nhớ dịch (TM) của khách hàng, bảng thuật ngữ (cơ sở thuật ngữ).
Mặc dù tùy thuộc vào loại văn bản và mức độ sáng tạo về mặt ngôn ngữ văn bản nguồn, nhưng kết quả đầu ra MT thô có khả năng tạo ra văn bản trôi chảy và có vẻ như thể hiện rất tốt những ý nghĩa thông điệp có trong bản gốc, đặc biệt là ngay từ cái nhìn đầu tiên.
Tuy nhiên, nếu không có bất kỳ sửa đổi nào thêm, có thể các sắc thái ý nghĩa tinh tế hơn sẽ bị mất, văn bản thu được sẽ có một số điểm không chính xác với các chữ viết tắt, từ viết tắt và phần place-holder, đồng thời văn bản sẽ không hoàn toàn nhất quán với chính nó (đặc biệt đối với các văn bản dài) và với các nội dung dịch hiện có, chẳng hạn như TM hoặc bảng chú giải.
ISO 18587:2017 chỉ ra hai loại Hiệu đính MT riêng biệt:
Trong quá trình hiệu đính đầy đủ, nhà ngôn ngữ học đảm bảo rằng văn bản dịch thu được có chất lượng tương đương với chất lượng được thực hiện hoàn toàn do con người dịch (tương tự Tiêu chuẩn ISO 17100). Cách tiếp cận này cung cấp chất lượng dịch thuật cao nhất. Rõ ràng, nếu chiếu theo quan điểm “chất lượng” hiện nay trong ngành dịch thuật thì chỉ sự sửa lỗi đầy đủ mới đáp ứng các tiêu chuẩn chất lượng khi nó cung cấp một kết quả hoàn hảo và chuyên nghiệp.
Trong quá trình hiệu đính nhẹ, nhà ngôn ngữ học sẽ xem xét bản dịch thô và thực hiện các thay đổi tối thiểu để tạo ra văn bản dễ hiểu. Trong trường hợp này, người hiệu đính không cố gắng tạo ra một văn bản có thể so sánh được với chất lượng do người dịch cung cấp. Điều này mang lại chất lượng dịch chỉ ở mức cơ bản và người sử dụng có thể gặp phải những rủi ro về ý nghĩa do quá trình soát xét không được thực hiện một cách tỷ mỉ.
Trên thực tế còn phụ thuộc vào cách dùng bản dịch cuối cùng, ví dụ bản dịch có được xuất bản công chúng hay chỉ dừng ở mức tham khảo để lựa chọn sử dụng phương pháp sửa lỗi nào. Tiêu chuẩn cũng đã nêu ra những yêu cầu mà “sửa lỗi nhẹ” cần đáp ứng để được xem là một dịch vụ. Việc xem xét liệu chất lượng đầu ra sau sửa lỗi khả thi trong tương lai gần hay không là một vấn đề cần thảo luận thêm.
Nhiệm vụ của người hiệu đính bản dịch máy là xem lại đầu ra MT, kiểm tra độ chính xác, tính nhất quán, khả năng đọc và các thông số khác cũng như sửa bất kỳ lỗi nào. Điều quan trọng cần lưu ý là chất lượng đầu ra MT thô phụ thuộc vào một số yếu tố sau đây:
Những người thực hiện công việc Hiệu đính nhẹ sẽ thường tập trung vào 4 khía cạnh sau:
Về cơ bản, điều này có nghĩa là kết quả cuối cùng sẽ thể hiện ý chính của văn bản nguồn, với tất cả nội dung nguồn hiện diện và phản ánh trong văn bản đích. Tuy nhiên, văn bản thu được có thể sẽ thiếu về phong cách ngôn ngữ, tính nhất quán của thuật ngữ và các sắc thái ý nghĩa kém tinh tế hơn.
Những người thực hiện công việc hiệu đính đầy đủ sẽ tập trung vào nhiều khía cạnh hơn, bao gồm:
Nói chung, các tiêu chí này tương tự như các tiêu chí của bản dịch do con người thực hiện.
Câu trả lời là: phụ thuộc vào cách bản dịch sẽ được sử dụng.
Bạn có đang tìm cách tăng tốc quá trình dịch, đồng thời muốn chất lượng bản dịch có thể so sánh được với quá trình dịch thuật của con người theo tiêu chuẩn ISO 17100:2015? Bạn nên sử dụng Hiệu đính đầy đủ.
Hoặc khi bạn chỉ cần dịch thuật tìm kiếm những thông tin hữu ích của tài liệu mà không tốn quá nhiều chi phí? Có lẽ bạn đang tìm kiếm giải pháp Hiệu đính nhẹ.
Chất lượng là một trong những yếu tố quan trọng nhất trong ngành dịch thuật. Các công ty dịch thuật biết rằng chất lượng dịch cao là không chỉ một chiến lược bán hàng liên tục, mà còn hiểu rằng sự nhận thức về chất lượng trong toàn bộ ngành là quan trọng đối với tất cả các bên tham gia.
Sự tiến hóa của dịch máy (MT) có thể được coi là một yếu tố thay đổi cuộc chơi trong ngành dịch thuật. Các công ty dịch thuật cần xem xét về chất lượng của các dịch vụ dịch thuật, và định nghĩa lại dịch vụ dịch thuật là gì trong bối cảnh dịch thuật có sự tham gia của cả máy móc.
Tổ chức Tiêu chuẩn Hóa Quốc tế (ISO) cùng với các chuyên gia trong ngành dịch thuật đã giải quyết vấn đề này bằng cách ban hành hai tiêu chuẩn quốc tế liên quan đến dịch thuật, đó là:
ISO 17100:2015 Dịch Vụ Dịch Thuật – Yêu Cầu cho Dịch Vụ Dịch Thuật, được cải tiến từ tiêu chuẩn EN 15038.
ISO 18587:2017 Dịch vụ dịch thuật – Các yêu cầu Hiệu đính bản dịch máy, một tiêu chuẩn hoàn toàn mới xác định một khung và các yêu cầu cho người hiệu đính bản dịch máy (sửa bản dịch đầu ra của máy).