OCR Text giúp chuyển nội dung file PDF hay hình ảnh thành văn bản tiếng Việt cực tốt mà bạn có thể sử dụng miễn phí.
Nhận dạng ký tự quang học (OCR) hay trích xuất văn bản trên ảnh giờ đây không có gì khó khăn. Nhưng trích xuất văn bản tiếng Việt mà tốt nữa thì đếm trên đầu ngón tay. Trong bài viết này, TNS xin giới thiệu một ứng dụng OCR tiếng Việt cực chuẩn mà còn miễn phí nữa. Đó là OCR Text.
Ứng dụng tương thích Windows 10. Dung lượng 72 MB.
Trích xuất văn bản tiếng Việt với OCR Text rất đơn giản, bạn làm theo như sau.
Bước 1: Bạn mở ứng dụng > bấm phím Ctrl + O hay biểu tượng thư mục để chọn tập tin.
OCR Text hỗ trợ các định dạng sau.
- Hình ảnh (bmp, gif, jpeg, jpg, png, tif, tiff).
- Tài liệu PDF.
- Văn bản thuần (txt).
Bước 2: Bạn chọn ngôn ngữ bên trong file muốn trích xuất (hỗ trợ tiếng Anh và tiếng Việt) tại OCR Language. Ở đây, chúng ta sẽ chọn Vietnamese.
Bước 3: Bạn bấm nút OCR (bên trái biểu tượng cục gôm) hoặc Ctrl + D để trích xuất.
Bước 4: Trích xuất thành công, văn bản sẽ nằm trong khung bên phải. Bạn có thể chỉnh sửa thêm từ hay sao chép, lưu lại. Bạn bấm biểu tượng đĩa mềm hay Ctrl + S để lưu lại dưới định dạng mặc định là txt.
Thay đổi công cụ trích xuất.
OCR Text có hỗ trợ giao diện tiếng Việt nếu bạn cảm thấy giao diện tiếng Anh khó sử dụng thì bấm Settings > User Interface Language> Vietnamese (Tiếng Việt). Ứng dụng còn nhiều tính năng hay khác nữa mà bạn có thể tự khám phá.