Tôi đang cố gắng đối sánh văn bản chung của SHA1 với cụm từ thông dụng.Regex để khớp với SHA1
Lý tưởng nhất là tôi muốn tránh các từ phù hợp. An toàn để nói rằng toàn bộ SHA1 có một mẫu riêng biệt (chúng dài và có chiều dài nhất quán) - vì vậy tôi có thể phù hợp với những điều này một cách đáng tin cậy - nhưng những gì về SHA1 viết tắt thì sao?
Tôi có thể dựa vào sự hiện diện của các số không?
Nhìn vào SHA1 trong nhật ký cam kết của tôi - các số luôn xuất hiện trong 3 ký tự đầu tiên. Nhưng điều này quá ngắn? Tôi cần cân nhắc bao nhiêu ký tự của SHA1 trước khi tôi có thể giả định một số sẽ xuất hiện?
Điều này không nhất thiết phải chính xác 100% - tôi chỉ cần khớp với SHA1 viết tắt là 99% thời gian.
Làm thế nào để SHA1 được đại diện? Thập phân? Hex? Cơ sở 64? Hàm băm chỉ là một con số thực sự lớn, và về mặt kỹ thuật, mỗi ký tự trong nó là một chữ số, nếu không phải là một 'số' theo nghĩa thông thường. Tôi nghĩ một số ví dụ sẽ thực sự tốt ở đây. –
Hoặc có lẽ tôi chỉ là những thứ quá mức như bình thường. –
FWIW - gần một thập kỷ sau - tất cả các băm trong 'git log' của tôi hiện có chữ cái trong ba ký tự đầu tiên – galois