Tôi chỉ thêm này cho độc giả trong tương lai vì không có câu trả lời khác tồn tại trong một thời gian bây giờ (tôi cũng đã thêm một tiền thưởng):
from googleapiclient.discovery import build
# ...
service = build('vision', 'v1', developerKey=API_KEY, cache_discovery=False)
image_b64 = base64.b64encode(image_bytes).decode()
return service.images().annotate(body={
'requests': [{
'image': {
'content': image_b64
},
'features': [{
'type': 'DOCUMENT_TEXT_DETECTION',
'maxResults': 5,
}]
}]
}).execute()
(python) Mẫu này rõ ràng là không sử dụng khách hàng trong câu hỏi, nhưng đây là cách tôi đã đi vào nó tại thời điểm này để làm OCR đơn giản.
Bạn có thể thay đổi các tính năng hoặc đặc tả hình ảnh để phù hợp với nhu cầu của mình.
Nguồn
2017-09-04 08:48:39
Cố gắng đặt biến môi trường 'GCLOUD_KEYFILE' bằng đường dẫn đến tệp khóa .json của bạn. Ít nhất đây là cách nó hoạt động trong Ruby. – Nakilon