|
|
|
Matlab数据处理--部分 |
|
发布时间:2013-11-05 点击: 次 |
一.LOAD/SAVE
例子用到数值由空格间隔的ASCII file sample_file.txt :
1 5 4 16 8
5 43 2 6 8
6 8 4 32 1
90 7 8 7 6
5 9 81 2 3
>>M = load('sample_file.txt') %加载sample_file文件,同时在workspace中出现M变量,为5×5矩阵
>>M = M+5 %将矩阵中各个元素+5
>>save sample_file_plus5 M %将变量M以二进制形式存储在文件名为sample_file_plus5.mat中
>>save sample_file_plus5.txt M -ascii %将变量M以ASCII码形式存储在sample_file_plus5.txt文本文件中。
二. UIGETFILE/UIPUTFILE
UIGETFILE/UIPUTFILE是基于图形用户界面(GUI)的。会弹出对话框,列出当前目录的文件和目录,提示你选择一个文件。UIGETFILE让你选择一个文件来写(类似Windows ‘另存为’选项?)。用UIGETFILE,可以选择已存在的文件改写,也可以输入新的文件名。两个函数的返回值是所选文件名和路径。
例如:用 UIGETFILE 从当前目录选择一个 M-file
[fname,pname] = uigetfile('*.m','Sample Dialog Box')
%在当前路径下打开一个文档选择对话框,对话框的名字叫Sample Dialog Box,当选择一个m文件后,fname=所打开文档的名字(带扩展名)pname返回的是文档的存储路径。当改变路径时,pname随之改变
三.UIIMPORT/IMPORTDATA
UIIMPORT是一个功能强大,易于使用的基于GUI的high level routine,用于读complex data files。文件也必须是homogeneous。
IMPORTDATA形成UIIMPORT的功能,不打开GUI。可以将IMPORTDATA用于函数或者脚本中,因为在函数或者脚本中基于GUI的文件导入机制并不理想。
例如:包含几行文件头和文本、数值数据的文件'sample_file2.txt' :
This is a file header.
This is file is an example.
col1 col2 col3 col4
A 1 4 612.000
B 1 4 613.000
C 1 4 614.000
D 1 4 615.000
注意:该文件的各行不能有空行,否则不能被读出
>>D = importdata('sample_file2.txt','') %D =
'This is a file header.'
'This is file is an example.'
'col1 col2 col3 col4'
'A 1 4 612.000'
'B 1 4 613.000'
'C 1 4 614.000'
'D 1 4 615.000'
且workspace中出现D为cell类
>>D = importdata('sample_file2.txt')
% D=
data: [4x3 double]
textdata: {7x4 cell}
可以通过访问结构D的数据和文本域,来看结构D中的真实值,例如输入:
data = D.data
text = D.textdata
注意: 对于 ASCII data, 你必须检验导入向导正确的识别了列分隔符。
四.TEXTREAD/STRREAD
TEXTREAD 是一个强大的动态high level routine,设计用来读ASCII格式的文本和/或数值数据文件。STRREAD除是从字符串而不是文件读以外,类似于TEXTREAD。
两个函数可以用许多参数来改变其具体的工作方式,他们返回读入指定输出的数据。他们有效的提供给你一个“两全其美”的方法,因为他们可以用一个命令读入混合的ASCII和数值数据。例子:
>>file = textread('fft.m','%s','delimiter','\n','whitespace','');%将一个完整的文件读进一个cell阵列,此处读取的是fft.m文件,并不一定在当前地址上。
>>words = strread(file{28},'%s','delimiter','') %只读出变量file的第28行的字符串,返回cell类型变量words
>>[c1 c2 c3 c4] = textread('sample_file2.txt','%s %s %s %s','headerlines',2)
%读取当前路径下sample_file2.txt文件,并且跳过文件开头的前2行,把每列分别赋值给c1~c4类型为Cell的单元体
%c1 =
'col1'
'A'
'B'
'C'
'D'
c2 =
'col2'
'1'
'1'
'1'
'1'
c3 =
'col3'
'4'
'4'
'4'
'4'
c4 =
'col4'
'612.000'
'613.000'
'614.000'
'615.000'
>>[c1 c2 c3 c4] = textread('sample_file2.txt', '%s %s %s %s',2,'headerlines',4)
%读取指定文件,并跳过前4行,只读取2行,分别将各列赋值给c1~c4,类型为cell
%c1 =
'B'
'C'
c2 =
'1'
'1'
c3 =
'4'
'4'
c4 =
'613.000'
'614.000'
>>[c2 c3 c4] = textread('sample_file2.txt','%*s %d %d %f','headerlines',3)
%读取指定文件,跳过前3行,、、、、、
% c2 =
1
1
1
1
c3 =
4
4
4
4
c4 =
612
613
614
615
五.DLMREAD/DLMWRITE/CSVREAD
DLMREAD 和 DLMWRITE函数能够读写分隔的ASCII data,CSVREAD用来读分隔符是逗号的文件,是DLMREAD的特殊情况。当读空格和Tab分隔的电子数据表文件时,DLMREAD特别有用。
以'sample_file.txt'为例:
>>D = dlmread('sample_file.txt','')
%读取文件sample_file.txt,并创建矩阵D,效果如同load('sample_file.txt')
D =
1 5 4 16 8
5 43 2 6 8
6 8 4 32 1
90 7 8 7 6
5 9 81 2 3
>>D_partial = dlmread('sample_file.txt','',[2 0 4 2])
%相当于分解矩阵,只读取指定文件的从第2行第0列至第4行第2列的方形区域,构成新的矩阵。注意:这里的行号、列号均以0开始。
%D_partial =
6 8 4
90 7 8
5 9 81
>>dlmwrite('partialD.txt',D_partial,',')
%在当前路径下生成partialD.txt文本文件,该文件内容为以D_partial中各个元素以逗号分开的形式,且不同行之间元素由黑色方框隔开。
注意: 保证DLMREAD and DLMWRITE指定范围的指标从0开始,而不是从1开始。
六.XLSREAD用来读Excel的数值和文本数据。
如何选择合适的命令呢?
一.纯数据,且列数相同
0 3866.162 2198.938 141.140
1 3741.139 2208.475 141.252
2 3866.200 2198.936 141.156
3 3678.048 2199.191 141.230
4 3685.453 2213.726 141.261
5 3728.769 2212.433 141.277
6 3738.785 2214.381 141.256
7 3728.759 2214.261 141.228
8 3748.886 2214.299 141.243
9 3748.935 2212.417 141.253
10 3733.612 2226.653 141.236
11 3733.583 2229.248 141.223
12 3729.229 2229.118 141.186
对于这个code.txt文件,由于各行列数相同,故简单地使用load,importdata均可。
如>>load(‘code.txt’)则将上面的数据连同行号一并赋值为变量code(double型)
>>importdata(‘code.txt’)生成一变量名为ans的,内容与load的结果一样
二. 字段名(中、英文字段均可)+数据:
CH0 CH1 CH2 CH3
0.000123 0.000325 0.000378 0.000598
0.000986 0.000256 0.000245 0.000698
如存储为datastring.txt
>>importdata(‘datastring.txt’)
>> ans =
data: [2x4 double]
textdata: {'CH0' 'CH1' 'CH2' 'CH3'}
colheaders: {'CH0' 'CH1' 'CH2' 'CH3'}
解释:ans为一结构体,访问其中元素时,可使用>>ans.data%将文件中的数据回显
由于是记录的形式,因此各行列数必相同(缺少部分列时请自行在文件中补上 Inf 或 NaN),故直接使用 importdata 便可。
三.注释(含有独立的数字串)+数据(列数相同):
这个文件有4列,但前3行是文字说明,4列数字是从第4行开始的.现在我想把这个文件的前2列和文字说明提出来组成一个新的dat文件
源文件:
CODE:
Group 2 12.02.2006 Limei
Samples of datas: 50000
CH0 CH1 CH2 CH3
0.000123 0.000325 0.000378 0.000598
0.000986 0.000256 0.000245 0.000698
目标文件:
CODE:
Group 2 12.02.2006 Limei
Samples of datas: 50000
CH0 CH1
0.000123 0.000325
0.000986 0.000256
解答:由于注释中含有独立的数字串,且注释部分没有明显的格式,这时候用importdata, load等高级命令直接读取会失败,用 textread, dlmwrite 等格式化命令也不太合适,因此只能使用低级命令进行读取。(当然了,可以跳过注释部分直接用高级命令读取数据,即:[a b c d] = textread(filename,'%f %f %f %f','headerlines',4); )。一个简单的、非通用的包含注释的读取方法如下:
-------------------------------------转---------------------------------
CODE:
clc;clear;
fid = fopen('exp.txt', 'r');
fid_n=fopen('ex.dat','w');
while ~feof(fid)
tline=fgetl(fid);
if ~isempty(tline)
if double(tline(1))>=48 && double(tline(1))<=57 %数值开始
a=strread(tline);
a(3:4)=[];
fprintf(fid_n,'%f %f\n',a);
clear a;
elseif double(tline(1))==67 %字母C开始
[b1,b2,b3,b4]=strread(tline,'%s %s %s %s');
b=[b1{1},' ',b2{1}];
fprintf(fid_n,'%s\n',b);
clear b b1 b2 b3 b4;
else
fprintf(fid_n,'%s\n',tline);
end
else
fprintf(fid_n,'%s\n',tline);
end
end
fclose(fid);
fclose(fid_n);
四. 4. 注释(不含独立的数字串)+数据(列数相同):
源文件:
CODE:
你好 abc
欢迎来到 我们
振动论坛
vib.hit.edu.cn
1 11 111 1111
2 22 222 2222
3 33 333 3333
4 44 444 4444
5 55 555 5555
直接用 importdata 便可
解答:
--------------------------------------------转--------------------------------------
CODE:
function [data]=distilldata(infile)
%功能说明:
%将保存数据的原始文件中的数值数据读入到一个data变量中
%使用说明:
% infile——原始数据文件名;
% data=数据变量
tmpfile='tmp2.mat';
fidin=fopen(infile,'r'); % 打开原始数据文件(.list)
fidtmp=fopen(tmpfile,'w'); % 创建保存数据文件(不含说明文字)
五. 各列数据的分离:
源文件:
CODE:
0 + 47038.7 1.05 09:26:07 C
2 + 46477.7 1.03 09:28:38 C
4 + 44865.7 1.04 09:28:48 C
6 + 41786.4 1.03 09:28:56 C
8 + 39896.0 0.97 09:29:03 C
10 + 37518.4 0.93 09:29:15 C
12 + 35858.5 0.92 09:29:30 C
14 + 46105.0 1.03 09:30:21 C
16 + 46168.6 6.89 09:30:30 C
18 + 48672.3 4.33 09:30:40 C
20 + 49565.7 0.49 09:30:48 C
22 + 49580.7 0.53 09:30:55 C
24 + 49602.3 0.84 09:31:03 C
26 + 49582.5 1.51 09:31:11 C
28 + 49577.0 1.39 09:31:19 C
30 + 49589.3 0.61 09:31:27 C
32 + 49578.3 1.06 09:31:29 C
34 + 49512.5 1.77 09:31:38 C
解答:直接用 [a,b,c,d,e,f]=textread(yourfilename,'%d %c %f %f %s %c'); 便可
while ~feof(fidin) % 判断是否为文件末尾
tline=fgetl(fidin); % 从文件读入一行文本(不含回车键)
if ~isempty(tline) % 判断是否空行
[m,n]=size(tline);
flag=1;
for i=1:n %判断一行中有没有字符(+-.Ee和空格键除外)
if ~(tline(i)==' '|tline(i)=='-'|tline(i)=='.'|tline(i)=='E'...
|tline(i)=='e'|tline(i)=='+'...
|(double(tline(i))>=48&&double(tline(i))<=57))
flag=0;
break;
end
end
if flag==1 % 如果是数字行,把此行数据写入文件
fprintf(fidtmp,'%s\n',tline);
end
end
end
fclose(fidin);
fclose(fidtmp);
data=textread(tmpfile);
delete(tmpfile);
如果要求不高,也可以使用 textread 函数跳过注释部分进行读取,不过前提是需要事先知道文件内容的结构(即哪行是数据、哪行是注释)
五.
|
|
|
|