Mọi người có thể chỉ cho tôi các tài nguyên về lexing, phân tích cú pháp và tokenising bằng Python không?Tài nguyên để lexing, tokenising và phân tích cú pháp trong python
Tôi đang thực hiện một chút hack vào một dự án mã nguồn mở (hotwire) và muốn thực hiện một vài thay đổi đối với mã mà lexes, parses and tokenises các lệnh được nhập vào đó. Vì nó là mã thực sự hoạt động nên nó khá phức tạp và khó có thể làm việc được.
Tôi chưa từng làm việc trên mã để lex/parse/tokenise trước đây, vì vậy tôi đã nghĩ một cách tiếp cận sẽ là làm việc thông qua một hướng dẫn hoặc hai về khía cạnh này. Tôi hy vọng sẽ học đủ để điều hướng xung quanh mã mà tôi thực sự muốn thay đổi. Có điều gì phù hợp không? (Lý tưởng là nó có thể được thực hiện vào một buổi chiều mà không cần phải mua và đọc cuốn sách rồng đầu tiên ...)
Edit: (7 Oct 2008) Không có câu trả lời nào dưới đây hoàn toàn đưa ra những gì tôi muốn. Với chúng tôi có thể tạo ra các trình phân tích cú pháp từ đầu, nhưng tôi muốn tìm hiểu cách viết trình phân tích cú pháp cơ bản của riêng tôi từ đầu, không sử dụng các công cụ tương tự và lex và yacc. Sau khi thực hiện điều đó, tôi có thể hiểu được mã hiện tại tốt hơn.
Vì vậy, ai đó có thể chỉ cho tôi một hướng dẫn mà tôi có thể xây dựng một trình phân tích cú pháp cơ bản từ đầu, chỉ sử dụng python?
Tôi thứ hai là đề xuất cho PLY, rất tuyệt. – mipadi