Tôi đang làm việc trên tập dữ liệu Twitter trong R và tôi thấy khó xóa tên người dùng khỏi tweets.Mẫu thay thế trong R
Đây là một ví dụ về các tweets trong cột tweet của tập dữ liệu của tôi:
[1] "@danimottale: 2 bad our inalienable rights offend their sensitivities. U cannot reason with obtuse zealotry. // So very well said."
[2] "@FreeMktMonkey @drleegross Want to build HSA throughout lifetime for when older thus need HDHP not to deplete it if ill before 65y/o.thanks"
Tôi muốn xóa/thay thế tất cả các từ bắt đầu bằng "@" để có được kết quả này:
[1] "2 bad our inalienable rights offend their sensitivities. U cannot reason with obtuse zealotry. // So very well said."
[2] "Want to build HSA throughout lifetime for when older thus need HDHP not to deplete it if ill before 65y/o.thanks"
Hàm gsub này hoạt động để xóa biểu tượng "@".
gsub("@", "", tweetdata$tweets)
Tôi muốn nói, xóa ký tự sau biểu tượng văn bản cho đến khi bạn gặp dấu cách hoặc dấu chấm câu.
tôi bắt đầu cố gắng để chỉ đối phó với không gian nhưng không có kết quả:
gsub("@.*[:space:]$", "", tweetdata$tweets)
này loại bỏ các tweet thứ hai hoàn toàn
gsub("@.*[:blank:]$", "", tweetdata$tweets)
này không thay đổi sản lượng.
Tôi sẽ rất biết ơn sự giúp đỡ của bạn.
Rất cám ơn - rất hữu ích, quá tệ tôi không thể bỏ phiếu vì tôi mới. – user3722736
@ user3722736 Bạn có thể kiểm tra giải pháp này nếu nó phù hợp với nhu cầu của bạn mặc dù bằng cách nhấp vào dấu kiểm bên trái bên dưới số phiếu bầu lên. –
Sử dụng 'phụ' thay vì' gsub' vì chỉ có một thay thế. –