Nói rằng tôi có một chuỗi như thế này: "http://something.example.com/directory/"
Làm thế nào để phân tích cú pháp URL và trích xuất các chuỗi con cần
Những gì tôi muốn làm là để phân tích chuỗi này, và trích xuất các "something"
từ chuỗi.
Bước đầu tiên, rõ ràng là kiểm tra để đảm bảo rằng chuỗi chứa "http://"
- nếu không, nó sẽ bỏ qua chuỗi.
Nhưng, làm cách nào để tôi chỉ trích xuất các "something"
trong chuỗi đó? Giả sử rằng tất cả các chuỗi mà điều này sẽ được đánh giá sẽ có cấu trúc tương tự (tức là tôi đang cố gắng trích xuất tên miền phụ của URL - nếu chuỗi đang được kiểm tra thực sự là URL hợp lệ - khi hợp lệ bắt đầu bằng "http://"
).
Cảm ơn.
P.S. Tôi biết cách kiểm tra phần đầu tiên, tức là tôi có thể chỉ cần tách chuỗi tại số "http://"
nhưng điều đó không giải quyết được vấn đề đầy đủ vì điều đó sẽ tạo ra "http://something.example.com/directory/"
. Tất cả tôi muốn là "something"
, không có gì khác.
http://www.regular-expressions.info/ruby.html – durron597
@ durron597: Đừng đánh lừa mọi thứ bằng regexen. URL là một đối tượng được xác định rõ, được xử lý hàng triệu lần trong thư viện chuẩn của Ruby và trong hàng triệu đá quý khác. Nếu tôi là một chuyên gia, tôi sẽ trả lời. –
Có gì với tất cả các downvotes? Đừng hiểu. – marcamillion