Chúng ta đã biết trích xuất văn bản, trích xuất hình ảnh, trích xuất âm thanh,… Vậy còn trích xuất URL thì sao? Hoàn toàn được, bạn có thể thực hiện dễ dàng bằng 6 dịch vụ mà TNS giới thiệu trong bài viết sau để dùng khi cần sao chép lại những liên kết trang web một cách nhanh nhất.
1. Text-Filter.com:
Dịch vụ này là một trong những lựa chọn tốt khi bạn cần trích xuất URL từ văn bản. Nó đi kèm một số tính năng thú vị mà bạn sẽ không thấy trên các trang web tương tự khác.
Truy cập vào đây, bạn cung cấp nội dung văn bản chứa URL cho trang web bằng nhập/dán văn bản vào khung Input hay bấm Choose File để chọn file văn bản định dạng *.txt.
Tiếp theo, bạn sử dụng thêm các chức năng trước khi trích xuất:
– Separator: Bạn có thể thay đổi cách hiển thị cho từng URL trích xuất. Mặc định là mỗi URL cách nhau một hàng, bạn có thể thêm dấu phẩy, dấu gạch thẳng đứng, dấu hai chấm,…
– Sort Alphabetically: Sắp xếp URL theo thứ tự chữ cái.
– Only/Do not extract address containing this string: Chỉ/không trích xuất URL có chứa chuỗi ký tự.
Sau cùng, bạn bấm Extract URLs. Các URL trích xuất xong sẽ hiển thị trong khung Output. Dịch vụ này có khả năng trích xuất nhiều dạng URL, chẳng hạn: http://www.abc.com, http://abc.com, www.abc.com, abc.com. Để lưu lại, bạn sao chép trong Ouput hay bấm Download để lưu trong tập tin txt với tên Text-Filter.Com.txt (bấm vào để đổi tên).
2. Note Parse:
Một dịch vụ đơn giản nhưng trích xuất URL rất tốt, tương đương Text-Filter.com. Dịch vụ không hỗ trợ nhập văn bản bằng file nên khi truy cập vào http://www.noteparse.com/, bạn nhập/dán văn bản vào khung Extract URLs from Copy.
Tiếp theo, bấm Parse để trích xuất. Note Parse có khả năng trích nhiều loại URL giống như Text-Filter. Các URL trích xuất sẽ hiện ra bên dưới, dưới dạng liên kết có thể truy cập, dưới dạng văn bản, dưới dạng JSON. Bạn sao chép lại URL trích xuất hay truy cập theo lựa chọn của mình.
3. Link Extractor:
Dịch vụ này sử dụng cũng rất đơn giản, bạn có thêm tiền tiền tố và hậu tố trên mỗi URL trích xuất.
Truy cập vào đây, bạn nhập/dán văn bản/HTML vào khung Text File / HTML Content. Nếu muốn thêm tiền tố (Prefix) hay hậu tố (Suffix) trên mỗi URL trích xuất thì bạn nhập vào vị trí tương ứng. Sau cùng, bấm Submit và nhận URL trích xuất.
4. Toolsvoid:
Nếu bạn chỉ muốn trích xuất các URL có giao thức (http, https, ftp,…) đầy đủ thì dịch vụ này là sự lựa chọn mà bạn đang cần.
Truy cập vào đây, bạn nhập/dán văn bản vào khung Enter text here > bấm Submit Now. Dịch vụ sẽ trích xuất tên miền (Extracted domains) và URL (Extracted URLs) trong văn bản ở bên dưới.
5. Browserling:
Dịch vụ này khá giống Toolsvoid chỉ hỗ trợ trích xuất URL có giao thức (http, https, ftp). Truy cập vào đây, nhập/dán văn bản vào khung trống > bấm Extract Links. Công việc còn lại là sao chép lại URL của bạn (bấm biểu tượng clipboard).
6. Convertcsv.com:
Dịch vụ này cũng chỉ hỗ trợ trích xuất URL có giao thức nhưng nhiều chức năng hơn, bạn có thể chọn văn bản từ nhiều nguồn, thêm dấu sau mỗi URL, trích xuất ra tập tin Excel,…
Truy cập vào đây, bạn trích xuất URL với dịch đơn giản trong ba bước.
Bước 1: Tại Step 1, bạn chọn văn bản trích xuất bằng chọn file trên thiết bị (Option 1 – Choose a file), từ URL của file (Option 2 – Enter an URL), và nhập/dán văn bản (Option 3 – paste into Text Box below).
Bước 2: Tại Step 2, bạn có thể sử dụng thêm một số chức năng như thêm dấu sau mỗi URL, chỉ trích xuất URL chứa chuỗi ký tự nào đó, chỉ hiển thị URL thuộc trang mạng xã hội,… Phần này không bắt buộc, nếu không muốn sử dụng thì bạn có thể bỏ qua.
Bước 3: Sau cùng, bạn bấm Extract để lấy URL dạng văn bản hay Extract to Excel để lưu URL trích xuất trong tập tin bảng tính Excel (xlsx). Hoặc trong định dạng csv, nhập tên file vào Save your result > bấm Download Result.