2010-09-03 39 views

Trả lời

5

Thực ra, chỉ cần đi với Google's translation API có lẽ là điều tốt nhất và dễ nhất để thực hiện.

API của Google dễ sử dụng và tùy thuộc vào các cặp ngôn ngữ đang được dịch, hệ thống dịch của họ tốt hoặc tốt hơn mọi thứ khác.

mã nguồn mở dịch Trọn gói

Tuy nhiên, cũng có một số công cụ mã nguồn mở thực sự tốt cho dịch máy. Nhà nước-of-the-art gói bao gồm:

Không giống như các API dịch, bạn có thể sử dụng những công cụ này mà không cần phải truy cập vào Internet . Quan trọng hơn, bạn có thể sử dụng những công cụ này mà không gặp phải bất kỳ điều chỉnh hoặc giới hạn nào mà API miễn phí áp đặt nếu bạn đang cố gắng dịch lượng dữ liệu lớn hơn.

liệu Đào tạo

Để sử dụng các gói máy dịch mã nguồn mở, bạn sẽ cần dữ liệu huấn luyện. Nếu bạn đang dịch giữa tiếng Anh sang tiếng Đức, hoặc giữa một số ngôn ngữ châu Âu khác, bạn có thể sử dụng số Europarl parallel corpus của Phillip Koehn.

Nếu bạn quan tâm đến ngôn ngữ Liên minh Châu Âu (EU) không có trong kho dữ liệu song song Europarl, bạn có thể thu thập dữ liệu bằng cách thu thập thông tin proceedings of the European parliament. Tất cả các thủ tục tố tụng của EU được dịch sang từng ngôn ngữ EU và cung cấp trực tuyến miễn phí, làm cho chúng trở thành nguồn dữ liệu đào tạo dịch máy rất tốt.

3
+0

Ừ ngôn ngữ Google API là tốt, nhưng tôi không thể là người duy nhất + tôi không nghĩ rằng u có thể sử dụng trong một máy tính để bàn hoặc điện thoại di động ứng dụng mà không cần Internet –

+0

Nếu bạn muốn dịch mà không cần truy cập internet, đây sẽ là một ứng dụng thực sự lớn vì bộ nhớ dịch, bảng thuật ngữ thực sự là các tệp lớn nên đi kèm với ứng dụng của bạn. –

Các vấn đề liên quan