Mục tiêu cuối cùng là sử dụng tìm kiếm api tweepy để tập trung vào các chủ đề (ví dụ: docker) và EXCLUDE retweets. Tôi đã xem xét các chủ đề khác đề cập đến việc loại trừ các tweet nhưng chúng hoàn toàn có thể áp dụng được. Tôi đã cố gắng kết hợp những gì tôi đã học được vào mã bên dưới nhưng tôi tin rằng đoạn mã "nếu không" nằm sai chỗ. Bất kỳ trợ giúp nào cũng được đánh giá rất cao.Tweepy - Loại trừ Retweets
#!/usr/bin/python
import tweepy
import csv #Import csv
import os
# Consumer keys and access tokens, used for OAuth
consumer_key = 'MINE'
consumer_secret = 'MINE'
access_token = 'MINE'
access_token_secret = 'MINE'
# OAuth process, using the keys and tokens
auth = tweepy.OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_token, access_token_secret)
api = tweepy.API(auth)
# Open/Create a file to append data
csvFile = open('docker1.csv', 'a')
#Use csv Writer
csvWriter = csv.writer(csvFile)
ids = set()
for tweet in tweepy.Cursor(api.search,
q="docker",
Since="2016-08-09",
#until="2014-02-15",
lang="en").items(5000000):
if not tweet['retweeted'] and 'RT @' not in tweet['text']:
#Write a row to the csv file/ I use encode utf-8
csvWriter.writerow([tweet.created_at, tweet.text.encode('utf-8'), tweet.favorite_count, tweet.retweet_count, tweet.id, tweet.user.screen_name])
#print "...%s tweets downloaded so far" % (len(tweet.id))
ids.add(tweet.id) # add new id
print ("number of unique ids seen so far: {}",format(len(ids)))
csvFile.close()
có lỗi nào bạn gặp phải không? hoặc bạn chỉ đang tìm kiếm tối ưu hóa mã? – harshil9968
@ harshi9968 nhận được nhiều lần xóa ... Cú pháp không chính xác, đối tượng 'Trạng thái' không có thuộc tính '--getitem--' ... Từ nghiên cứu các bài đăng khác tôi biết rằng 'if not tweet [' tweeted '] và' RT @ 'không phải trong tweet [' văn bản '] 'là những gì tôi muốn, nhưng tôi không chắc chắn chính xác nơi để đặt nó trong mã để có được những gì tôi cần – hansolo
bạn có thể gửi một ảnh chụp màn hình của các lỗi? – harshil9968