Làm thế nào để lọc/trơn tru với SciPy/Numpy?

Tôi đang cố gắng lọc/tín hiệu trơn tru thu được từ bộ chuyển đổi áp suất của tần số lấy mẫu 50 kHz. Một tín hiệu mẫu được hiển thị dưới đây:Làm thế nào để lọc/trơn tru với SciPy/Numpy?

enter image description here

Tôi muốn để có được một tín hiệu mịn thu được bằng cách hoàng thổ trong MATLAB (Tôi không âm mưu cùng một dữ liệu, giá trị này là khác nhau).

enter image description here

tôi tính toán mật độ phổ công suất sử dụng chức năng matplotlib của psd() và mật độ phổ công suất cũng được cung cấp dưới đây:

enter image description here

Tôi đã thử bằng cách sử dụng đoạn mã sau và thu được một tín hiệu được lọc:

import csv 
import numpy as np 
import matplotlib.pyplot as plt 
import scipy as sp 
from scipy.signal import butter, lfilter, freqz 

def butter_lowpass(cutoff, fs, order=5): 
    nyq = 0.5 * fs 
    normal_cutoff = cutoff/nyq 
    b, a = butter(order, normal_cutoff, btype='low', analog=False) 
    return b, a 

def butter_lowpass_filter(data, cutoff, fs, order=5): 
    b, a = butter_lowpass(cutoff, fs, order=order) 
    y = lfilter(b, a, data) 
    return y 

data = np.loadtxt('data.dat', skiprows=2, delimiter=',', unpack=True).transpose() 
time = data[:,0] 
pressure = data[:,1] 
cutoff = 2000 
fs = 50000 
pressure_smooth = butter_lowpass_filter(pressure, cutoff, fs) 

figure_pressure_trace = plt.figure(figsize=(5.15, 5.15)) 
figure_pressure_trace.clf() 
plot_P_vs_t = plt.subplot(111) 
plot_P_vs_t.plot(time, pressure, linewidth=1.0) 
plot_P_vs_t.plot(time, pressure_smooth, linewidth=1.0) 
plot_P_vs_t.set_ylabel('Pressure (bar)', labelpad=6) 
plot_P_vs_t.set_xlabel('Time (ms)', labelpad=6) 
plt.show() 
plt.close()

Sản lượng tôi nhận được là:

enter image description here

tôi cần làm mịn hơn, tôi cố gắng thay đổi tần số cắt nhưng vẫn kết quả khả quan không thể có được. Tôi không thể có được sự mượt mà như nhau bởi MATLAB. Tôi chắc chắn nó có thể được thực hiện bằng Python, nhưng làm thế nào?

Bạn có thể tìm thấy dữ liệu here.

Cập nhật

tôi áp dụng lowess mịn từ statsmodels, điều này cũng không cung cấp kết quả khả quan.

enter image description here

Nguồn

2015-02-16 Nimal Naser

Bạn có thể muốn có một cái nhìn tại 'thực hiện lowess' của 'statsmodels': http://statsmodels.sourceforge.net/devel/generated/statsmodels.nonparametric.smoothers_lowess.lowess.html – cel

Tôi áp dụng lowess, thay đổi các giá trị phân số, nhưng nó không cung cấp các kết quả thỏa đáng. Các ô được đính kèm trong bản cập nhật bài đăng. –

oh okay, trông hoàn toàn kỳ lạ. Thành thật mà nói, tôi không có nghĩa là một chuyên gia trong xử lý tín hiệu, vì vậy tôi thậm chí không chắc chắn nếu nó có ý nghĩa để áp dụng 'loewess' ở đây. Tuy nhiên, tôi ngạc nhiên một chút rằng nó đã đi sai lầm khủng khiếp. – cel

Dưới đây là một vài gợi ý.

Đầu tiên, hãy thử các lowess chức năng từ statsmodels với it=0, và tinh chỉnh các frac tranh luận một chút:

In [328]: from statsmodels.nonparametric.smoothers_lowess import lowess 

In [329]: filtered = lowess(pressure, time, is_sorted=True, frac=0.025, it=0) 

In [330]: plot(time, pressure, 'r') 
Out[330]: [<matplotlib.lines.Line2D at 0x1178d0668>] 

In [331]: plot(filtered[:,0], filtered[:,1], 'b') 
Out[331]: [<matplotlib.lines.Line2D at 0x1173d4550>]

plot

Một gợi ý thứ hai là sử dụng scipy.signal.filtfilt thay vì lfilter áp dụng bộ lọc Butterworth . filtfilt là bộ lọc chuyển tiếp lùi lại. Nó áp dụng các bộ lọc hai lần, một lần về phía trước và một lần lạc hậu, dẫn đến sự chậm trễ pha số không.

Dưới đây là một phiên bản sửa đổi của kịch bản của bạn. Những thay đổi đáng kể là việc sử dụng các filtfilt thay vì lfilter, và sự thay đổi của cutoff từ 3000 đến 1500. Bạn có thể muốn thử nghiệm với tham số đó - giá trị cao hơn kết quả trong việc theo dõi tốt hơn về sự khởi đầu của sự gia tăng áp lực, nhưng là một giá trị mà quá cao không lọc ra dao động 3kHz (gần) sau khi tăng áp suất.

import numpy as np 
import matplotlib.pyplot as plt 
from scipy.signal import butter, filtfilt 

def butter_lowpass(cutoff, fs, order=5): 
    nyq = 0.5 * fs 
    normal_cutoff = cutoff/nyq 
    b, a = butter(order, normal_cutoff, btype='low', analog=False) 
    return b, a 

def butter_lowpass_filtfilt(data, cutoff, fs, order=5): 
    b, a = butter_lowpass(cutoff, fs, order=order) 
    y = filtfilt(b, a, data) 
    return y 

data = np.loadtxt('data.dat', skiprows=2, delimiter=',', unpack=True).transpose() 
time = data[:,0] 
pressure = data[:,1] 
cutoff = 1500 
fs = 50000 
pressure_smooth = butter_lowpass_filtfilt(pressure, cutoff, fs) 

figure_pressure_trace = plt.figure() 
figure_pressure_trace.clf() 
plot_P_vs_t = plt.subplot(111) 
plot_P_vs_t.plot(time, pressure, 'r', linewidth=1.0) 
plot_P_vs_t.plot(time, pressure_smooth, 'b', linewidth=1.0) 
plt.show() 
plt.close()

Đây là cốt truyện của kết quả. Lưu ý độ lệch trong tín hiệu được lọc ở cạnh phải. Để xử lý, bạn có thể thử nghiệm với các padtype và padlen thông số của filtfilt, hoặc, nếu bạn biết bạn có đủ dữ liệu, bạn có thể loại bỏ các cạnh của tín hiệu được lọc.

plot of filtfilt result

Nguồn

2015-02-16 12:50:56

Chính xác những gì tôi muốn. Nhưng làm thế nào bạn chọn đối số 'frac'? Nó có được bằng thử và sai hay nó có thể liên quan đến sự biến động trong tín hiệu, bởi vì tôi phải làm điều này cho nhiều tập tin (> 1000). –

Tôi bắt đầu với thử và sai, nhưng bạn có thể hiểu được giá trị sau khi thực tế. Các dao động lớn ở đuôi của phản ứng bước là khoảng 3.1kHz. Ở tốc độ mẫu 50kHz, tương ứng với khoảng 16 mẫu trên mỗi chu kỳ. Đối với phương pháp lowess để loại bỏ các dao động này, bạn cần một cửa sổ đủ lớn để bao gồm một số dao động. Có 2000 mẫu trong dữ liệu, và 2000 * 0,025 là 50, trong đó bao gồm khoảng 3 dao động. Nếu phổ của dữ liệu trong tất cả các tệp của bạn giống nhau, nhưng số lượng mẫu trong mỗi tệp khác nhau, bạn có thể thử sử dụng 'frac = 50.0/num_samples'. –

Dưới đây là một ví dụ của việc sử dụng một sự phù hợp loewess. Lưu ý rằng tôi đã tước tiêu đề từ data.dat.

Từ cốt truyện có vẻ như phương pháp này hoạt động tốt trên các tập con của dữ liệu. Việc lắp tất cả dữ liệu cùng một lúc không mang lại kết quả hợp lý. Vì vậy, có lẽ đây không phải là phương pháp tốt nhất ở đây.

import pandas as pd 
import matplotlib.pylab as plt 
from statsmodels.nonparametric.smoothers_lowess import lowess 

data = pd.read_table("data.dat", sep=",", names=["time", "pressure"]) 
sub_data = data[data.time > 21.5] 

result = lowess(sub_data.pressure, sub_data.time.values) 
x_smooth = result[:,0] 
y_smooth = result[:,1] 

tot_result = lowess(data.pressure, data.time.values, frac=0.1) 
x_tot_smooth = tot_result[:,0] 
y_tot_smooth = tot_result[:,1] 

fig, ax = plt.subplots(figsize=(8, 6)) 
ax.plot(data.time.values, data.pressure, label="raw") 
ax.plot(x_tot_smooth, y_tot_smooth, label="lowess 1%", linewidth=3, color="g") 
ax.plot(x_smooth, y_smooth, label="lowess", linewidth=3, color="r") 
plt.legend()

Đây là kết quả tôi nhận được:

plot

Nguồn

2015-02-16 08:25:04 cel

Điều này có vẻ tốt, vì vậy bạn chia nhỏ dữ liệu và áp dụng làm mịn. Nhưng tôi phải làm điều này cho nhiều tập tin trên một nghìn tập tin và sự gia tăng áp lực không phải lúc nào cũng xảy ra ở 21 ms. –

@NimalNaser, tôi đã cập nhật câu trả lời. Nếu không tách phương pháp này không hoạt động và trong khi kết quả sau khi chia nhỏ trông khá đẹp, tôi nghi ngờ rằng đây là phương pháp tốt nhất cho vấn đề của bạn. Tôi vẫn muốn để hiển thị các kết quả để tham khảo :) – cel

@NimalNaser, và cập nhật khác. Lần này tôi đã giảm đáng kể khu vực làm mịn. Tuy nhiên bạn thấy rằng điều này là xa tối ưu. – cel

Làm thế nào để lọc/trơn tru với SciPy/Numpy?

Trả lời

Các vấn đề liên quan