Trong một nghiên cứu năm 2011, Google Translate được xác định có khả năng dịch hiệu quả nhiều ngôn ngữ châu Âu, nhưng lại gặp khó khăn với các ngôn ngữ châu Á. Danh sách 10 ngôn ngữ có độ chính xác tốt nhất (khi được dịch từ tiếng Anh, theo thứ tự từ tốt nhất đến kém nhất) như sau:
Khi được đánh giá lại vào năm 2019, sử dụng cùng tệp dữ liệu của nghiên cứu năm 2011, kết quả cho thấy chất lượng bản dịch tổng thể của Google Translate đã tăng lên 34%.
Trong một nghiên cứu gần đây hơn của UCLA Medical Center (Hoa Kỳ) vào năm 2021, Google Translate có khả năng truyền tải được 82,5% nghĩa gốc trong bản dịch. Tuy nhiên, khi đi vào chi tiết, độ chính xác sẽ dao động từ 55% đến 94%, tùy thuộc vào cặp ngôn ngữ và lĩnh vực của nội dung cần dịch.
Nhìn chung, Googole Translate – cũng như hầu hết các hệ thống dịch máy hiện nay – đều có khả năng dịch tốt ở những cặp ngôn ngữ giàu dữ liệu đào tạo và thị trường có nhu cầu cao. Đa số các cặp ngôn ngữ như vậy chủ yếu đều có tiếng Anh, hoặc là ngôn ngữ gốc hoặc là ngôn ngữ đích, và các ngôn ngữ còn lại chủ yếu là các ngôn ngữ châu Âu.
Ở phía ngược lại, các ngôn ngữ châu Á đặt ra thách thức không nhỏ do bị hạn chế về nguồn dữ liệu đào tạo và tồn tại những đặc điểm phức tạp mang tính riêng biệt. Tất nhiên, mức độ chính xác của bản dịch máy sẽ vẫn tăng dần theo thời gian, khi mà quá trình cải tiến và tái đào tạo vẫn đang diễn ra liên tục.
Bởi cả ngôn ngữ và dịch thuật đều hàm chứa “tính động”, tức là có sự chuyển biến không ngừng, thay vì là một hiện tượng cố hữu, “tính chính xác” sẽ chỉ nên được hiểu theo nghĩa tương đối. Độ chính xác của bản dịch sẽ phụ thuộc vào mục đích ban đầu của tác giả và đối tượng người đọc/sử dụng. Ví dụ, kỳ vọng về độ chính xác trong ngữ pháp, văn phong và cách dùng từ trong một email sẽ có sự khác biệt đáng kể đối với một tác phẩm tiểu thuyết.
Trong thực tế, kỳ vọng đối với bản dịch máy vốn không cao. Bởi hầu hết mọi người đều cho rằng dịch máy là một dịch vụ miễn phí mà bất kỳ ai cũng có thể sử dụng. Và về cơ bản, dịch máy được coi là công cụ giúp mọi người hiểu được ý nghĩa cơ bản của tài liệu. Xét trên khía cạnh này, dịch máy đã đáp ứng được yêu cầu của người dùng.
Độ chính xác của bản dịch máy sẽ giảm khi:
Nhìn chung, bạn có thể sử dụng Google Translate hiệu quả khi dịch những tài liệu không cần hoàn hảo về mặt thuật ngữ, văn phong và tính nhất quán. Đối với một trang web kinh doanh, đó là những nội dung không làm ảnh hưởng nhiều tới thương hiệu như:
Như đã trình bày ở trên, kết quả nghiên cứu cho thấy Google Translate sẽ đạt hiệu quả cao với những cặp ngôn ngữ nhất định. Có những cặp ngôn ngữ mà Google Translate có khả năng xử lý một cách đáng kinh ngạc, và ngược lại, cũng có những cặp ngôn ngữ mà Google Translate cho ra những kết quả đáng thất vọng. Do đó, việc nắm bắt được đâu là những cặp ngôn ngữ hiệu quả cho Google Translate sẽ giúp bạn định ra được chiến lược áp dụng dịch máy phù hợp để sử dụng Google Translate hiệu quả cũng như phân bổ nguồn lực tương xứng cho các cặp ngôn ngữ còn lại.
Theo thống kê hiện tại, 3 cặp ngôn ngữ phổ biến nhất để sử dụng Google Translate hiệu quả là:
Xét theo lĩnh vực nội dung, 3 ngành mà Google Translate đạt kết quả đánh giá chất lượng cao nhất là:
Các lĩnh vực phổ biến khác có thể sử dụng Google Translate hiệu quả là: Phát triển phần mềm, Du lịch & Khách sạn, Dịch vụ Đám mây, Tài chính-Pháp lý, Kinh doanh & Giáo dục, v.v.
Google Translate, cũng như hầu hết các công cụ dịch máy khác, đều có tính năng xử lý toàn văn bản. Tức là, thay vì phải paste từng đoạn một lên như trước đây, người dùng hoàn toàn có thể đẩy lên cả file để chạy máy dịch. Các định dạng tệp hiện đang được hỗ trợ trên Google Translate gồm:
Mặc dù việc xử lý theo cả file giúp đẩy nhanh tốc độ, bản dịch máy cho cả file sẽ thường tạo ra một số câu lỗi. Ví dụ, có những cụm từ không được dịch mà bị thể hiện thành dấu chấm, hoặc một chuỗi số và ký tự kỳ lạ. Hoặc cũng có những cụm từ bị lặp lại hoặc được dịch thành hai cách khác nhau nhưng vẫn được ghép chung vào một câu. Đây là lỗi phát sinh trong quá trình tách ý trong câu.
Để khắc phục hiện tượng này, bạn có thể kiểm tra sơ bộ những chỗ xuất hiện hai dấu chấm cuối câu hoặc các chỗ bất thường khác và chạy lại máy dịch cho riêng những câu đó. Như vậy, bạn sẽ có kết quả bản dịch tốt hơn.
Nếu chỉ dựa hoàn toàn vào bản dịch máy, bạn sẽ có rủi ro bị bỏ sót các thông tin quan trọng, sai lệch về ngữ nghĩa, hay thậm chí là gặp phải những nội dung vô nghĩa. Để tránh được những điều này và sử dụng Google Translate hiệu quả, bạn sẽ cần thực hiện thêm bước rà soát và sửa lại bản dịch máy. Quy trình này được gọi là hiệu đính bản dịch máy (MT Post-editing – MTPE)
Tùy thuộc vào mức độ chính xác của bản dịch mà bạn mong muốn, bạn có thể áp dụng quy trình hiệu đính nhẹ (light post-editing) hoặc hiệu đính đầy đủ (full post-editing). Cả hai cách này đều tận dụng được đầu ra của bản dịch máy, cho phép sử dụng Google Translate hiệu quả, trong khi vẫn đảm bảo thông điệp của bạn được truyền đi theo đúng mục tiêu ban đầu.
Theo kinh nghiệm chung, những nội dung dưới đây sẽ cần đặc biệt chú trọng khi hiệu đính bản dịch máy:
Dịch thuật không chỉ đơn giản là chuyển nghĩa của các từ từ một ngôn ngữ này sang một ngôn ngữ khác. Nếu chỉ dừng ở đó, bất cứ ai có trong tay một cuốn từ điển cũng có thể dịch! Chính vì điều này mà khi ra phố và nhìn vào các tấm biển quảng cáo song ngữ, bạn có thể dễ dàng bắt gặp cách dịch này.
Thông điệp được tạo ra không chỉ bởi một tập hợp từ – đó còn là ngữ cảnh, mục đích, các khía cạnh phi ngôn từ, v.v. Tuy Google Translate đã có sự tiến bộ đáng kể trong các năm qua, vẫn còn nhiều lĩnh vực mà dịch máy chưa thể cạnh tranh với dịch bởi con người:
Không ai biết liệu công nghệ dịch máy có thể đạt được cấp độ như của con người hay không, nhưng hiển nhiên đây là mục tiêu chung của dịch máy. Ví dụ, các máy tính lượng tử đang tìm cách nâng cao số lượng toán tử và dữ liệu có thể xử lý, hướng tới mục tiêu có thể tự học mà không cần tới sự tác động của con người và hiểu tốt hơn sự xác lập của ngôn ngữ. Tuy nhiên, ở thời điểm hiện tại, bạn có thể lưu ý theo 04 cách mà AM Việt Nam đã chia sẻ ở trên để sử dụng Google Translate hiệu quả!