Làm cách nào để tải mọi thứ sau dấu gạch chéo cuối cùng trong URL?

Làm thế nào tôi có thể trích xuất bất cứ điều gì sau dấu gạch chéo cuối cùng trong một URL bằng Python? Ví dụ: các URL này phải trả lại những điều sau:Làm cách nào để tải mọi thứ sau dấu gạch chéo cuối cùng trong URL?

URL: http://www.test.com/TEST1 
returns: TEST1 

URL: http://www.test.com/page/TEST2 
returns: TEST2 

URL: http://www.test.com/page/page/12345 
returns: 12345

Tôi đã thử urlparse nhưng cung cấp cho tôi tên tệp đầy đủ, chẳng hạn như page/page/12345.

Nguồn

2011-08-31 mix

Nếu URL có thể chứa querystrings như '... foo = bar' và bạn không muốn điều này?; Tôi muốn đề nghị sử dụng 'urlparse' kết hợp với đề xuất' basename' của naeg. – plundra

http://docs.python.org/library/urlparse.html#module-urlparse –

133

Bạn không cần phải điều lạ mắt, chỉ thấy the string methods in the standard library và bạn có thể dễ dàng chia url của bạn giữa phần 'filename' và phần còn lại:

url.rsplit('/', 1)

Vì vậy, bạn có thể nhận được một phần mà bạn quan tâm đơn giản với:

url.rsplit('/', 1)[-1]

Nguồn

2011-08-31 07:28:00 Luke404

Dude, bạn là người bắn bóng. Cảm ơn bạn! – mdandr

Giải pháp rất đẹp ... Ấn tượng –

'url.rsplit ('/', 1)' trả về một danh sách và 'url.rsplit ('/', 1) [- 1]' là bit sau dấu gạch chéo cuối cùng. – Hugo

rsplit nên lên đến nhiệm vụ:

In [1]: 'http://www.test.com/page/TEST2'.rsplit('/', 1)[1] 
Out[1]: 'TEST2'

Nguồn

2011-08-31 07:28:17

extracted_url = url[url.rfind("/")+1:];

Nguồn

2011-08-31 07:28:36 fardjad

quên 'từ chuỗi nhập khẩu rfind' khỏi câu trả lời của bạn – Kimvais

Một hơn (idio (ma) tic) cách:

URL.split("/")[-1]

Nguồn

2011-08-31 07:31:17 Kimvais

Đây phải là câu trả lời được chấp nhận –

partition và rpartition cũng được sử dụng cho những thứ như:

url.rpartition('/')[2]

Nguồn

2011-09-19 09:22:42 tzot

-1

url ='http://www.test.com/page/TEST2'.split('/')[4] 
print url

Output: TEST2.

Nguồn

2013-02-18 21:42:05

Bạn thực sự nên chuyển' -1' làm chỉ mục, nếu không thì điều này chỉ hoạt động trên các chuỗi với chính xác là nhiều '/' –

urlparse là tốt để sử dụng nếu bạn muốn (nói, để loại bỏ bất kỳ tham số chuỗi truy vấn nào).

import urllib.parse 

urls = [ 
    'http://www.test.com/TEST1', 
    'http://www.test.com/page/TEST2', 
    'http://www.test.com/page/page/12345', 
    'http://www.test.com/page/page/12345?abc=123' 
] 

for i in urls: 
    url_parts = urllib.parse.urlparse(i) 
    path_parts = url_parts[2].rpartition('/') 
    print('URL: {}\nreturns: {}\n'.format(i, path_parts[2]))

Output:

URL: http://www.test.com/TEST1 
returns: TEST1 

URL: http://www.test.com/page/TEST2 
returns: TEST2 

URL: http://www.test.com/page/page/12345 
returns: 12345 

URL: http://www.test.com/page/page/12345?abc=123 
returns: 12345

Nguồn

2013-04-04 05:51:03

Bạn CAND làm như thế này:

head, tail = os.path.split(url)

đâu đuôi sẽ là tên file của bạn.

Nguồn

2013-09-20 13:53:46 Winston

Chia url và bật yếu tố cuối cùng url.split('/').pop()

Nguồn

2017-05-19 09:16:15

Làm cách nào để tải mọi thứ sau dấu gạch chéo cuối cùng trong URL?

Trả lời

Các vấn đề liên quan