2011-11-10 26 views
22

Tôi muốn hiển thị một số kết quả tìm kiếm tùy chỉnh.Danh sách các API của công cụ tìm kiếm JSON không có hạn ngạch, như Bing?

Tôi đã xem xét các API JSON của cả Google và Microsoft (Bing). Thật không may, Google có giới hạn về số lượng truy vấn mỗi ngày (50 đô la cho tối đa mười nghìn truy vấn). Tuy nhiên, Bing cho phép số lượng truy vấn "không giới hạn" mỗi ngày, miễn phí.

Có các dịch vụ khác, như API JSON của Bing không có giới hạn truy vấn như API của Google không? Một câu hỏi liên quan có thể là cách các dịch vụ như Metacrawler có thể kết hợp các kết quả tìm kiếm từ một số công cụ tìm kiếm, trong khi các điều khoản dịch vụ của các công cụ này nêu rõ rằng các kết quả này chỉ có thể đạt được thông qua API được trả tiền này chứ không phải thông qua thu thập thông tin .

+0

Xin chào, hãy xem http://indexden.com - đó chính xác là những gì bạn cần. –

+5

API tìm kiếm của Bing không còn miễn phí cho cấp đó ngay bây giờ: https://datamarket.azure.com/dataset/5BA839F1-12CE-4CCE-BF57-A49D98D29A44 – KFL

Trả lời

14

Thông thường các dịch vụ và API có ngưỡng sử dụng, để cho phép thử nghiệm và sử dụng quy mô nhỏ mà không gặp trở ngại và những trở ngại phía trước, nhưng mở ra khả năng cung cấp SLA tốt hơn và các tùy chọn bổ sung. mức hỗ trợ.

Điều đó nói rằng tìm kiếm trên programmableweb.com cho các API tìm kiếm có lẽ là một lựa chọn thú vị - xem http://www.programmableweb.com/apis/directory/1?apicat=Search.

Tôi cũng tò mò, những gì bạn đang tìm kiếm cụ thể về khả năng, những gì bạn muốn xem trong API Bing, v.v. Mọi phản hồi và tôi có thể chuyển tiếp nhóm (kể từ khi tôi ở trên Bing) đội).

+1

NikhilK, cảm ơn phản hồi của bạn. Vấn đề lớn nhất mà tôi gặp phải khi sử dụng API Bing là kết quả dường như ít liên quan hơn so với kết quả của trang tìm kiếm thông thường. Ví dụ, nếu tôi tìm kiếm "nu.nl papandreou" tôi mong đợi nó sẽ trả lại nhiều kết quả liên quan đến papandreou trên trang nu.nl. Thay vào đó, tôi nhận được một trang web nhà đầu tư hiếm khi truy cập liên kết đến nu.nl và nơi người khác sẽ nói về Papandreou. – Tom

+1

Đồng ý. Kết quả API là khủng khiếp so với kết quả trên web. Không có lý do gì mà kết quả sẽ khác nhau. Ngoài ra, một số điều khoản sử dụng có một chút hạn chế. –

2

Tôi có cùng vấn đề với bing, vì vậy tôi đang thử một giải pháp khác. Tôi đang cố gắng phân tích cú pháp nội dung HTML của họ như một con người. HTML của trang web của họ có một số hạn chế, vì vậy tôi đã cạo phiên bản di động của họ.

Nếu có, đó là mã i sử dụng (sử dụng Jsoup và các thành phần http apache) trong java:

DefaultHttpClient client = new DefaultHttpClient(); 
    client.getParams().setParameter(CoreProtocolPNames.USER_AGENT, "Mozilla/5.0 (Windows NT 6.2; rv:9.0.1) Gecko/20100101 Firefox/9.0.1"); 
    client.getParams().setParameter(ClientPNames.COOKIE_POLICY, CookiePolicy.IGNORE_COOKIES); 

    int page = 0; 
    String surl = "http://m.bing.com/search/search.aspx?A=webresults&Q=" + URLEncoder.encode("site:www.facebook.com/ +\"?sk=info\"+\"new york\"+\"Bar\"", "UTF-8") + "&D=Web&SI=" + (page * 10) + "&PN=" + (page); 
    HttpGet get = new HttpGet(surl); 
    InputStream content = client.execute(get).getEntity().getContent(); 
    Document doc = Jsoup.parse(content, "UTF-8", "http://www.bing.com/"); 
    Elements elements = doc.select(".s15 a"); 
    for (Element e : elements) { 
     String url = e.attr("href"); 
     int v = url.indexOf("REDIRURL="); 
     if (v > 0) { 
      url = url.substring(v + 9); 
      url = url.substring(0, url.indexOf("&")); 
      url = URLDecoder.decode(url, "UTF-8"); 
     } else { 
      break; 
     } 
     System.out.println(url + " : " + e.text()); 
    } 
+2

Bạn có biết liệu Microsoft có phát hiện nếu cùng một địa chỉ IP yêu cầu số lượng tìm kiếm rất cao trong một phạm vi thời gian cụ thể không? Ví dụ: Google thực hiện và phát ra mã xác thực. – PAX

5

tôi nghĩ rằng http://www.faroo.com/ có thể giúp bạn ra ngoài. Nó có giới hạn 1 triệu tìm kiếm mỗi tháng giới hạn.

+2

_FAROO_ có vẻ tốt nhưng không có nhiều mức kiểm soát đối với kết quả, với [toán tử được hỗ trợ] duy nhất (http://www.faroo.com/hp/api/api.html#parameter) cho các truy vấn là 'AND' (từ khóa). – Alastair

+0

Có thể là một bộ ngắt giao dịch đối với một số người, nhưng Faroo cũng yêu cầu đăng ký một khóa API. – lsh

+3

Một bộ ngắt giao dịch khác cho Faroo là khóa API của bạn bị hạn chế đối với địa chỉ IP bạn chỉ định trong quá trình đăng ký. – lsh

Các vấn đề liên quan