Tôi đang viết một trình bẻ khóa hashtag cho facebook và mọi regex tôi gặp phải để có thẻ bắt đầu bằng # dường như bao gồm cả dấu chấm câu cũng như ký tự chữ và số. Dưới đây là ví dụ về những gì tôi muốn:Regex để phù hợp với tất cả thẻ bắt đầu bằng chữ và số, không có ký hiệu
Xin chào #world! Tôi đang # m4king một scraper #fac_book và muốn có một biểu thứC# thường xuyên tốt đẹp.
Tôi muốn nó để phù hợp với world
, m4king
, fac
và expression
(lưu ý rằng tôi sẽ thích nó để cắt đứt nếu nó đạt đến dấu chấm câu, bao gồm cả dấu cách). Sẽ tốt hơn nếu nó không bao gồm biểu tượng băm, nhưng nó không phải là siêu quan trọng.
Chỉ trong trường hợp điều quan trọng là tôi sẽ sử dụng phương pháp quét chuỗi của ruby để lấy được nhiều hơn một thẻ.
Cảm ơn đống trước!
Cảm ơn! Tôi chắc chắn sẽ đọc nó! –