2012-10-13 73 views
5

Tôi cần một danh sách các từ tích cực và tiêu cực với trọng số được gán cho các từ theo mức độ mạnh và tuần của chúng. Tôi đã có:phân tích tình cảm - wordNet, từ điển sentiWordNet

1.) WordNet - Nó cung cấp điểm + hoặc - cho mỗi từ.

2.) SentiWordNet - Đưa ra các giá trị dương và âm trong phạm vi [0,1].

Tôi đã kiểm tra này trên vài từ,

tình yêu - WordNet là cho 0.0 cho cả danh từ và động từ, tôi không biết lý do tại sao tôi nghĩ rằng nó phải được tích cực bởi ít nhất một số yếu tố.

repress - wordNet cho -9.93
- SentiWordNet cho - 0.0 cho cả pos và neg. (Nên tiêu cực)

nghỉ ngơi - WordNet - 2,488
- SentiWordNet - {pos - 0,125, neg - 0,5} (nên là số dương)

Tôi cần một số giúp đỡ để quyết định cái nào để sử dụng.

Cảm ơn.

+0

Cái cung cấp kết quả tốt hơn. :-) – Reactormonk

+3

Bạn lấy điểm âm dương từ WordNet ở đâu? – justhalf

Trả lời

2

Khá thường xuyên mức độ và/hoặc phân cực có thể phụ thuộc vào tên miền và/hoặc ngữ cảnh, do đó, từ một mình không thực sự đủ để đưa ra quyết định.

Nếu bạn có một số dữ liệu được chú thích, tôi khuyên bạn nên đào tạo một trình phân loại về điều đó bằng cách sử dụng điểm số do hai tài nguyên cung cấp làm tính năng. Nếu bạn không, một tùy chọn là sử dụng một trong các tập đoàn có chú thích có sẵn phù hợp với tên miền được đề cập. Không có bất kỳ dữ liệu nào trong toàn bộ nhiệm vụ trở nên hơi phức tạp, mặc dù có một lượng đáng kể công việc về các cách tiếp cận không giám sát để phân loại tình cảm, tôi tin, xem, ví dụ: Unsupervised Sentiment Analysis

+0

Về bối cảnh/miền, tôi nghĩ nếu một từ có ý kiến ​​khác nhau thì nó phải là một ý nghĩa khác nhau của Wordnet. Ví dụ. yêu thích # 5 (tên miền quần vợt) so với các ý nghĩa khác tại http://sentiwordnet.isti.cnr.it/search.php?q=love Bạn có ví dụ phản đối khi một từ có thể có ý nghĩa khác trong ngữ cảnh khác không nhưng không thể có ý nghĩa riêng của Wordnet? –

1

Có một giao diện để đưa ra ý kiến ​​khác nhau cho SentiWordNet, nếu bạn nghĩ rằng họ là sai: http://sentiwordnet.isti.cnr.it/search.php?q=repose

Tôi đã tải về mới nhất Wordnet 3.1, và kiểm tra các file format documentation, và không thấy bất kỳ đề cập đến tình cảm số bạn đề cập. Nó cũng không được hiển thị trong online search.

Vì vậy, vì cả hai lý do đó, tôi khuyên bạn nên sử dụng SentiWordNet!

(Tôi thấy câu hỏi của bạn là một năm cũ, vì vậy có lẽ bạn có thể cho chúng tôi biết những gì bạn đã đi với, và tại sao?)

-1

Mức độ phân cực không chỉ phụ thuộc vào các từ mình mà còn trên bối cảnh của sentece hoặc cụm từ. SO nếu có kết quả khác nhau liên quan đến cùng một từ thì đó là do sự khác biệt trong ngữ cảnh.

Các vấn đề liên quan