Sử dụng img2txt, bạn có thể trích xuất văn bản tiếng Việt và nhiều ngôn ngữ khác cực nhanh và hoàn hảo mà còn miễn phí, không tài khoản nữa.
Có rất nhiều tiện ích giúp bạn trích xuất vản bản (OCR) trong ảnh hay PDF mà TNS từng có vài bài viết giới thiệu. Trong năm mới này, TNS xin giới thiệu một dịch vụ OCR mới vừa miễn phí, dễ sử dụng mà còn hỗ trợ trích xuất tiếng Việt nữa. Đó là img2txt.
Dịch vụ này không chỉ trích xuất cho chất lượng gần như hoàn hảo mà bạn có thể kiểm tra chính tả, chỉnh sửa với Google Docs và lưu về dưới nhiều định dạng văn bản phổ biến.
img2txt dễ sử dụng, sau đây là các bước thực hiện.
Bước 1: Trên trang chủ, bạn chọn file (hình ảnh, PDF) muốn trích xuất văn bản bên trong bằng cách.
- Kéo thả.
- Bấm Select an…
Kích thước tập tin tối đa là 8 MB. Img2txt có hỗ trợ chọn file từ web nhưng còn đang phát triển.
Bước 2: Bạn bấm Choose the language of the text để chọn ngôn ngữ của văn bản.
Bước 3: Bạn bấm Upload để dịch vụ thực hiện nhiệm vụ của mình.
Hoàn tất, bạn sẽ nhìn thấy văn bản trích xuất. Cạnh bên phải là các nút chức năng cho phép.
– Copy result: Sao chép kết quả vào bộ nhớ đệm.
– Translate a text: Chuyển ngữ văn bản trích xuất trong tab mới với Google Translate.
– Check spelling: Kiểm tra chính tả văn bản trích xuất.
– Edit in Google Docs: Chỉnh sửa văn bản trích xuất với Google Docs.
– Download: Tải văn bản về trong các định dạng.
- Source: Như định dạng gốc.
- Plain text: Trong định dạng txt.
- Adobe Acrobat: Trong định dạng tài liệu PDF.
- Microsoft Word: Trong định dạng docx.
- OpenOffice: Trong định dạng odf.