2011-09-07 41 views
7

Tôi đang làm việc trên một dự án có bộ dữ liệu được chọn và mỗi dữ liệu sẽ có các thuộc tính khác nhau. Tôi sẽ cần sử dụng chức năng thể dục để chọn dữ liệu phù hợp nhất với kịch bản đã chọn của tôi bằng cách sử dụng các thuộc tính.Cách thực hiện chức năng thể dục

Tuy nhiên, tôi thực sự không tìm thấy bất kỳ trang web nào giải thích cách bắt đầu chức năng thể dục của riêng tôi. Tất cả những gì tôi có là nó là một phần của thuật toán di truyền và điều này là xa như tôi nhận được. Vậy tôi có thể đưa ra một số gợi ý ở đây không?

Trả lời

2

Bạn có chắc chắn những gì bạn cần thực sự là một chức năng thể dục?

Chức năng thể dục, như bạn đã nói, một cái gì đó được sử dụng trong thuật toán di truyền. Nó được sử dụng trong mỗi lần lặp của thuật toán để đánh giá chất lượng của tất cả các giải pháp được đề xuất cho vấn đề của bạn trong dân số hiện tại. Chức năng thể dục đánh giá mức độ tuyệt vời của một giải pháp trong dân số, ví dụ: nếu bạn đang cố gắng tìm giá trị của hàm x có giá trị y tối thiểu bằng thuật toán di truyền, hàm thể dục cho đơn vị có thể đơn giản là giá trị âm âm (giá trị càng cao thì hàm tập thể dục càng cao).

Điều cơ bản tôi đang cố gắng nói, các chức năng thể dục không giải quyết được các thuộc tính nhiều, chỉ cần đánh giá kết quả.

Nếu bạn muốn chọn mẫu dữ liệu đại diện nhất có chứa thuộc tính, có thể bạn cũng nên xem xét các phương pháp phân loại hoặc phân cụm? Bạn không đưa ra nhiều thông tin theo cách mà kịch bản được chọn sẽ được biểu diễn, nhưng có thể bạn có thể nhóm dữ liệu của mình (bạn có thể thử thuật toán phân cụm k và thử tăng số cụm cho đến khi lỗi phân loại ngừng giảm đáng kể?) Và hơn là chọn một cụm dữ liệu đại diện khi bạn có yêu cầu về kịch bản?

Nếu bạn đã cung cấp thêm chi tiết về cách các truy vấn được trình bày liên quan đến đại diện dữ liệu, bạn có thể đã nhận được câu trả lời khác (hoặc tốt hơn) từ một người nào đó. Sau đó, một lần nữa, nếu bạn chỉ có mục đích là để tìm hiểu thuật toán di truyền hoặc bất kỳ phần nào khác của trường AI/Machine Learning, bạn nên làm chính xác những gì phs đề xuất và tìm kiếm một cuốn sách, bài giảng âm thanh, ghi danh vào một lớp cho rằng hoặc một cái gì đó tương tự.

12

Đây là một phần khó khăn của GA (tốt, đó và đại diện dữ liệu) và thực sự bạn chỉ có thể học bằng kinh nghiệm.

Nói rõ ràng, chức năng phải là thứ gì đó đo lường kết quả tốt như thế nào. Đặc biệt, nó phải được mịn trên một loạt các dữ liệu - bất kể dữ liệu, chức năng thể dục của bạn phải thể hiện đúng cách để cải thiện.

Vì vậy, ví dụ: hàm thể dục bằng không trừ khi câu trả lời đúng là không tốt, bởi vì nó không giúp bạn nhận được câu trả lời đúng khi bạn bắt đầu.

Và chức năng thể dục tăng lên khi mọi thứ trở nên tốt hơn, nhưng không xác định giải pháp tốt nhất cũng không tốt, vì dân số của bạn sẽ cải thiện đến một điểm nhất định và sau đó gặp khó khăn.

Vì vậy, bạn cần phải ngồi xuống, viết một số ví dụ về dữ liệu của bạn, sau đó suy nghĩ về loại chức năng bạn có thể sử dụng. Bạn muốn một cái gì đó cung cấp cho các giá trị thấp cho dữ liệu xấu và giá trị cao cho dữ liệu tốt. Và điều chỉnh độc đáo giữa hai người.

Hãy thử bất kỳ ý tưởng điên rồ nào bạn có thể nghĩ lúc đầu, và sau đó xem cách bạn có thể đặt điều đó vào một biểu mẫu toán học tốt đẹp. Chỉ cần động não và tiếp tục cố gắng và lặp lại ...có thể bạn sẽ thấy rằng lựa chọn đầu tiên của mình không tốt lắm và khi bạn chạy GA, bạn sẽ có thể xem xét những gì đang diễn ra chi tiết hơn và cải thiện nó.

+0

Điều này khiến tôi nghĩ rằng chúng tôi có thể xác định được chức năng thể dục cho chức năng thể dục tốt như thế nào! – weltschmerz

Các vấn đề liên quan