Chúng tôi có hệ thống cms viết khối nội dung html vào cơ sở dữ liệu máy chủ sql. Tôi biết tên bảng và tên trường nơi các khối nội dung html này cư trú. Một số html chứa liên kết() đến tệp pdf. Đây là một đoạn:Cách trích xuất tên tệp từ một trường có chứa nội dung html trong máy chủ sql?
<p>A deferred tuition payment plan,
or view the <a href="/uploadedFiles/Tuition-Reimbursement-Deferred.pdf"
target="_blank">list</a>.</p>
Tôi cần trích xuất tên tệp pdf từ tất cả các khối nội dung html như vậy. Cuối cùng, tôi cần có danh sách:
Tuition-Reimbursement-Deferred.pdf
Some-other-file.pdf
của tất cả tên tệp pdf từ trường đó.
Mọi trợ giúp đều được đánh giá cao. Cảm ơn.
CẬP NHẬT
Tôi đã nhận được nhiều phản hồi, cảm ơn bạn rất nhiều, nhưng tôi quên đề cập đến mà chúng ta vẫn đang sử dụng SQL Server 2000 ở đây. Vì vậy, điều này đã được thực hiện bằng cách sử dụng SQL 2000 SQL.
tất cả họ đều sẽ có một thư mục mà trước tên tập tin? –
Bạn có phải làm điều này trong TSQL không? Đó là một ngôn ngữ rất nghèo để phân tích văn bản, và nó sẽ dễ dàng hơn nhiều trong một ngôn ngữ khác có thư viện phân tích cú pháp HTML. – Pondlife
Đồng ý, đó chỉ là một lựa chọn nhanh. Nếu cần, tôi sẽ sử dụng HTMLAgilityPack trong mã C# để phân tích cú pháp nội dung. – monstro