Tôi có một số nội dung văn bản với danh sách các URL chứa trong đó.Trích xuất tất cả các url bên trong một chuỗi trong Ruby
Tôi đang cố gắng lấy tất cả các URL ra và đặt chúng vào một mảng.
tôi có mã này
content = "Here is the list of URLs: http://www.google.com http://www.google.com/index.html"
urls = content.scan(/^(http|https):\/\/[a-z0-9]+([\-\.]{1}[a-z0-9]+)*\.[a-z]{2,5}(([0-9]{1,5})?\/.*)?$/ix)
Tôi cố gắng để có được kết quả cuối cùng là:
['http://www.google.com', 'http://www.google.com/index.html']
Đoạn mã trên dường như không được làm việc một cách chính xác. Có ai biết tôi đang làm gì sai không?
Cảm ơn
Tôi sẽ cung cấp cho bạn sự đơn giản. Điều này cũng có thể là tất cả những gì cần thiết. – Chowlett
Tôi tốt nghiệp trường đó! –
Cách tiếp cận này sẽ bỏ lỡ nhiều URL hợp lệ và chọn sai nhiều URL không hợp lệ. – sferik