2009-07-29 42 views
8

Loại công việc đã được thực hiện để xác định liệu một chuỗi cụ thể có liên quan đến vị trí địa lý không? Ví dụ:Xác định vị trí địa lý trong văn bản

'troy, ny' 
'austin, texas' 
'hotels in las vegas, nv' 

Tôi đoán điều tôi mong đợi là một cách tiếp cận thống kê mang lại một mức độ tự tin rằng hai vị trí đầu tiên là vị trí. Người cuối cùng có lẽ sẽ yêu cầu một heuristic mà lấy "% s,% s" và sau đó sử dụng cùng một kỹ thuật. Tôi đặc biệt tìm kiếm các cách tiếp cận không phụ thuộc quá nhiều vào đề xuất 'trong', vì nó không phải là một chỉ số hoàn toàn không rõ ràng hoặc nhất quán về vị trí.

Có ai có thể chỉ cho tôi cách tiếp cận, giấy tờ hoặc các tiện ích hiện có không? Cảm ơn!

Trả lời

7

Vấn đề bạn mô tả thường được gọi là phân tích truy vấn địa lý hoặc thu thập thông tin địa lý nói chung hơn.

Có một nhiệm vụ gần đây để thực hiện việc này tại CLEF 2007 (http://www.uni-hildesheim.de/geoclef/2007/Query-Parsing.htm). Đội chiến thắng sử dụng ngữ pháp dựa trên quy tắc, tương tự như ngữ pháp bạn có thể không muốn. Một bài báo khác tại www2009 nói về GeoParser: http://www2009.eprints.org/239/.

Ngoài ra còn có một số giấy tờ về thông tin địa lý Retrieval tại CIKM 2007: http://www.geo.unizh.ch/~rsp/gir07/accepted.html

Tôi không biết về bất kỳ phần mềm mã nguồn mở mà thực hiện điều này, nhưng nó có thể được đóng gói vào một công cụ tìm kiếm như Lemur.

4

Có một phương pháp rất thú vị được thực hiện bởi Everyblock.com, tập trung vào cách các vị trí được thể hiện bằng tiếng Anh - về cơ bản chúng sử dụng một số biểu thức chính quy và rộng rãi hiện nay là nguồn mở. Ứng dụng của họ được thiết kế để quét qua các bài báo, bài đánh giá và các nguồn cấp dữ liệu công khai khác nhau và liên kết chúng với các vị trí cụ thể và hoạt động tốt. Các biểu thức như "Một ngọn lửa trong tòa nhà ở góc Đông Bắc của 20th và Valencia St. ở San Francisco" được mã hóa địa lý rất chính xác. Bạn có thể nghiên cứu nguồn here. Phần cụ thể mà bạn có thể muốn là ebpub/ebpub/geocoder/base.py, nằm trong bản tải xuống ebpub và mọi thứ xung quanh, ví dụ như bắt đầu với lớp SmartGeocoder và hoạt động ngược.

0

Tôi đang xây dựng một geoparser miễn phí tại geocode.xyz

(hiện hỗ trợ khoảng 50 nước châu Âu, sớm cung cấp phủ sóng toàn cầu)

Một ứng dụng mẫu của geoparsing có thể được tìm thấy trên OpenWikiMap

Các vấn đề liên quan