2012-06-20 46 views
41

Trước tiên, tôi đã kiểm tra số question này nhưng answer đề cập đến một dịch vụ lỗi thời.
Có công cụ tìm kiếm nào hỗ trợ tìm kiếm biểu thức chính quy không?

Vì vậy, có một trang web (hoặc phần mềm, tôi không quan tâm) cung cấp nội dung internet tìm kiếm với cụm từ thông dụng?

+0

Tôi tin rằng bạn sẽ nhận được câu trả lời ngắn gọn hơn nếu bạn cung cấp [chi tiết hơn] (http://whathaveyoutried.com/) về những gì bạn đang cố gắng hoàn thành. –

+15

Tôi đang cố gắng để có được kết quả dựa trên biểu thức chính quy, giống như tiêu đề câu hỏi của tôi nói! – skafandri

+0

Google Tìm kiếm có thể tìm thấy các kết quả phù hợp của một số cụm từ thông dụng đơn giản. Xem [câu trả lời này] (http://webapps.stackexchange.com/questions/19673/is-there-a-way-to-search-in-google-using-regular-expressions-regex/82769#82769) cho một ví dụ về tìm kiếm biểu thức chính quy. –

Trả lời

16

Hãy để tôi viết ở đây một câu trả lời từ superuser.com question do đoàn kết hoàn chỉnh của tôi với tác giả:

trích dẫn từ các Ask Metafilter:

Cách duy nhất có thể làm cho việc tìm kiếm từ khóa hiệu quả hơn hàng trăm terabyte (hoặc bất kỳ chỉ mục nào của họ là cho đến những ngày này) là để tính toán trước chỉ mục của các từ.

Trong thực tế, một công cụ regex đầy đủ sẽ được hoàn tất, và bạn có thể viết các regexp tùy ý sẽ gobble gần số lượng thời gian và bộ nhớ CPU vô hạn. Vì tất cả những lý do này nó sẽ là sự điên rồ kỹ thuật cho họ để cung cấp regex tìm kiếm cho công chúng nói chung.

+0

Đợi đã, Nếu bạn muốn tạo một dịch vụ web nhỏ, bạn có quyền một số trường hợp dịch vụ như vậy wold rất hữu ích). Nhưng nếu chúng ta đang nói về việc thực hiện một loại kẻ lừa đảo web đầy đủ tính năng, hơn tôi nghĩ rằng đó là sự điên rồ (tốt, có thể, nhưng rất thời gian và MIPS tiêu hao). – gahcep

+9

Vì vậy, các truy vấn hết thời gian chờ quá lâu, nó không phải là sự điên rồ. –

+1

@MikeBantegui Eh? Có rất nhiều dịch vụ đánh giá các biểu thức bằng một ngôn ngữ hoàn chỉnh. Nếu phải mất quá lâu, nó sẽ từ bỏ. – Navin

2

Không tìm kiếm tức thì bằng công cụ regex. Điều này có thể là do các trang được lập chỉ mục như thế nào. Cho phép một để grep web sẽ mất rất nhiều quyền lực tính toán.

+8

Liên kết của bạn hiện đã chết –

0

Mặc dù bạn không thể tìm thấy trang web sử dụng tìm kiếm biểu thức chính quy đầy đủ, nhưng google có khả năng khớp với nhau. Tùy thuộc vào những gì bạn đang cố gắng để đạt được điều này có thể là đủ.

GoogleGuide có vẻ khá sâu với một số tùy chọn có sẵn. Có lẽ nếu bạn đưa ra một ví dụ về loại truy vấn bạn muốn tìm kiếm, chúng tôi có thể tìm ra giải pháp?

+1

Tôi đã kiểm tra điều này, nhưng khá kém , rất nghèo! Tôi không thể chạy bất kỳ * đơn giản * (đơn giản so với những gì tôi có thể làm với cụm từ thông dụng) tìm kiếm, như \ paul * \ (googling paul * là ** cách ** khác với \ paul * \\) hoặc \ paul {3} \ và nhiều trường hợp khác .. – skafandri

+0

Điều này cũng khá thú vị đối với tìm kiếm năng lượng http://www.johntedesco.net/blog/2012/06/21/how-to-solve-impossible-problems-daniel-russells-awesome- google-search-techniques/ – MutterMumble

1

dayyan là chính xác, đó là chỉ số đảo ngược giúp công cụ tìm kiếm nhanh; không có cách nào để tăng tốc tìm kiếm regex trên một petabyte nội dung nếu bạn chỉ có 100 terabyte đĩa flash. Tìm kiếm từ khóa, chỉ số đảo ngược, không có vấn đề gì.

grep web của blekko (https://blekko.com/ws/+/webgrep) hỗ trợ các regex, nhưng hầu hết các tìm kiếm chúng tôi nhận được đều là các chuỗi không đổi, thường là trong HTML, vì đó là điều thú vị : ai sử dụng vi định dạng? ai sử dụng các thư viện javascript khác nhau? ai sử dụng các hệ thống nhận xét khác nhau? Và kể từ đó trở đi.

Nếu bạn gửi cho chúng tôi một regex, chúng tôi rất sẵn lòng chạy nó cho bạn.

Chạy các tìm kiếm này bao gồm công việc MapReduce chạy trên tất cả html trong thu thập thông tin của chúng tôi. Đó là lý do tại sao phải mất một thời gian (một hoặc hai ngày) để có được câu trả lời.

+0

Liên kết bị hỏng. – Navin

+1

Chính xác, blekko đã được IBM mua vào ngày 27 tháng 3 năm 2015 và IBM đã ngừng hoạt động công cụ tìm kiếm công khai của blekko vào ngày đó. –

Các vấn đề liên quan